丁力 | cnSchema:中⽂知识图谱的普通话
本文转载自公众号:大数据创新学习中心。
3月10日下午,复旦大学知识工场联手北京理工大学大数据创新学习中心举办的“知识图谱前沿技术课程暨学术研讨会”上,OpenKG联合发起⼈、海知智能CTO丁力博士分享了以“cnSchema:中⽂知识图谱的普通话”为主题展开报告,主要介绍了面向中文信息处理的cnSchema.org,特别介绍了其核心本体设计以及其在知识图谱驱动的智能问答与智能分析中的应用案例。
首先,丁博士介绍了中文开放知识图谱(简称 OpenKG.CN)和cnSchema。
OpenKG.CN旨在促进中⽂知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和⼴泛应⽤。目前已与多个高校、机构、企业等联盟合作,开展活动和业务。
cnSchema.org,作为OpenKG社区的Schema规范,面向中文信息处理,支持快速领域知识建模,支持跨数据源、跨领域、跨语言的开放数据自动化处理,提供schema层面的支持与服务。
紧接着,丁博士简要介绍了知识图谱的基础与发展历程:
1. 知识图谱中常见的知识表示方法:RDF三元组、图数据库、深度学习
2. 知识图谱的五个层次:实体 -> 结构 -> 关系 -> 本体 -> 融合
3. 知识图谱大事记
(1)Semantic Network (1956)
以节点表示实体,链表示关系。
优点:表示方式“自然”、灵活且易于理解。
缺点:缺乏标准,难以实现未知语言现象的处理。
(2)The Web (1989)
The Web作为一个信息空间,其目标不仅有助于人际沟通,还能使机器参与进来并提供帮助。
(3)The Semantic Web (2001)
提出三个设想:
①在网络上发布结构化数据;
②用本体实现共同理解;
③使用可用数据实现智能又酷炫的应用。
4、Linked Open Government Data (2010)
与政府的政治、经济、健康等多方面数据挂钩。
(5)Journey to Web Schema,Schema.org(2011)
网络Schema由标准第一(1996年起)过渡到数据第一(2004年起)再发展为用户第一(2008年起)。
2011年出现了schema.org。
知识图谱境界变迁的总结:
在简要介绍了知识图谱的一些基础知识和重要发展历程之后,丁博士为我们详细讲解了cnSchema。
1. cnSchema生态
2. cnSchema 核⼼本体设计
3. cnSchema实体定义更加明确
4. 基于cnSchema的KBQA
接下来,丁博士为我们详细分析了cnSchema在知识图谱驱动的智能问答与智能分析中的应用案例。目前cnSchema在智能家居、智能客服和企业内部的智能化等领域已形成了AI应用落地成果。
领域知识图谱构建的关键方法和技术包括:领域词汇抽取,实体识别,实体分类;领域知识抽取:抽取关系、抽取事件、抽取深层次结构;语义关联,搜索、匹配与排序;基于active learning技术,提升标注效率:基于领域语料的NLP技术。
1. 智能机器人(Bots)
Bots是基于Ruyi.AI第三方技能开方平台的搜索引擎后新兴的人机接口,对话中的信息粒度缩小到短文本、实体和关系,而且多轮对话还要求更丰富的上下文知识。cnSchema是中文知识图谱接口的关键,schema自身对接中文自然语言处理以及针对中文信息中特有概念的处理都需要其支持。
2. 基于cnSchema的智能分析
以甲子光年的AI公司评价体系为例,利用NLP分类器,对AI公司数据进行清洗与筛选;使用基于深度学习的神经网络算法构建learning to rank模型,在舆论力指数、团队力指数、商业力指数、资本力指数四个大的评价维度下,划分出众多具体细化的模型参评因素,高时效性地动态评估这些发展中的AI公司。
3. 基于cnSchema的领域知识图谱
目前,基于cnSchema的领域知识图谱涵盖了音乐、工商、医院、新闻、履历和饮食等多个领域。如音乐和饮食知识图谱,图中介绍了知识图谱的模块划分和关联。
最后,丁力博士表示cnschema是开放的中文知识图谱schema,致力通过最佳实践帮助垂直领域合作者扩展领域知识图谱,以支持数据发布和应用,支持大家快速实现应用落地。
大数据创新学习中心
让学习成为一种乐趣
长按扫码关注我们
OpenKG.CN
中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 博客。
丁力 | cnSchema:中⽂知识图谱的普通话相关推荐
- 如何在推荐系统中玩转知识图谱
微信公众号"圆圆的算法笔记",持续更新NLP.CV.搜推广干货笔记和业内前沿工作解读~ 后台回复"交流"加入"圆圆的算法笔记"交流群:回复& ...
- CNCC 2018技术论坛——知识图谱赋能数字经济
本周五报名参加了在杭州举办的CNCC 2018大会,听取了关于知识图谱的技术论坛--知识图谱赋能数字经济.共有6位专家讲者带来了精彩的主题报告,以及一个小时的Panel环节.本博客将整理总结分享专家的 ...
- 一站式了解多模态、金融、事理知识图谱构建指南 | AI ProCon 2020
整理 | 许爱艳 出品 | AI科技大本营(ID:rgznai100) [导读]7 月 3-4 日,由 CSDN 主办的第三届 AI 开发者大会(AI ProCon 2020)在线上举行.本次大会有超 ...
- 前沿技术探秘:知识图谱构建流程及方法
作者 | 郑毅 封图| CSDN│下载于视觉中国 出品 | CSDN云计算(ID:CSDNcloud) 随着AI技术的发展和普及,当今社会已经进入了智能化时代.与以往不同的是,在这一波浪潮中,企业不仅 ...
- 解决掉这些痛点和难点,让知识图谱不再是“噱头”
(图片付费下载自视觉中国) 作者| 夕颜 出品| AI科技大本营(ID:rgznai100) 2012 年,谷歌正式提出知识图谱的概念,当时,研究人员的主要目的是用来优化搜索引擎技术.今年初,谷歌前员 ...
- 史上最全《知识图谱》2020综述论文!!!
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 知识图谱是当下的研究热点.最近18位学者共同撰写了一篇<知识图谱>综述 ...
- 【每周NLP论文推荐】 知识图谱重要论文介绍
欢迎来到<每周NLP论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 知识图谱是NLP中非常重要的底层基础建筑. ...
- powerbuilder查询符合条件的数据并且过滤掉其他数据_论文浅尝 ISWC2020 | KnowlyBERT: 知识图谱结合语言模型补全图谱查询...
论文笔记整理:胡楠,东南大学博士. 来源:ISWC 2020 动机 像Wikidata这样的现代知识图已经捕获了数十亿个RDF三元组,但是它们仍然缺乏对大多数关系的良好覆盖.同时在NLP研究的最新进展 ...
- 会议研讨 | TF45: 知识图谱新技术、新场景、新应用
基于"新基建"面向新产业.新业态和新模式的背景下,知识图谱作为人工智能的重要基石正在火热发展中.新的知识图谱技术在新的场景和应用中使人工智能从感知智能逐渐向认知智能过渡.知识图谱与 ...
最新文章
- 【数据库】适用于SQLite的SQL语句(二)
- 13篇文章,教你学会ES6知识点
- java.sql.SQLException: Lock wait timeout exceeded --转
- c字符串中包含双引号_码哥学Python,一起解密神秘的字符串密码
- Android游戏开发系统控件-CheckBox
- cookiejar包_爬虫之FileCookieJar
- JVM调优——Java动态编译过程中的内存溢出问题
- VS2012解决方案的设置
- IC卡清卡软件的使用
- 视频显示器与服务器之间使用什么线连接,显示器连接线有哪些?四种主流连线科普。...
- css 背景重复渐变_CSS3重复渐变[CSS3提示]
- ICP许可证有多重要
- 中国正式进入 5G 商用元年!
- 电脑休眠后无法唤醒的解决办法!
- 中债登——各功能快捷入口
- 微信群抽奖,有什么好用的抽奖小程序?
- 电脑脑运行快捷键是什么,电脑运行窗口快捷键
- vue点击按钮打开新页签,并传参
- zynq linux如何使用pl ip,ZYNQ+linux网口调试笔记(3)PL-ETH
- 那些花儿(夏洛特烦恼版)