【转】自然语言系列学习之表示学习与知识获取(三)知识图谱
分布式表示可以非常好的建立跨领域跨对象的知识迁移。有非常多的工作是去学习不同语言的各种词汇在同一个空间里统一的表示,这种表示对构建跨语言的知识迁移或者进行机器翻译都是非常重要的。此外有一个工作是试图建立视觉信息和文本信息联合统一的语义表示,现在有一个非常重要的新颖的任务是为图片自动产生一句关于图片的介绍Image Caption Generation,它是建立视觉和文本联合表示的非常有意思的任务。
利用分布式表示进行词汇的语义表示可以进行很多相关领域的研究,如 《Diachronic Word Embeddings Reveal Statistical Laws of Semantic Change》(https://arxiv.org/abs/1605.09096)是Stanford lp group在acl2016上发表的一篇文章,它是关于构建同一个词在不同的历史时期的word in value的情况。
实际上它就可以很好的去发现这些词的语义信息,随着时间的变化,它演化的情况,这说明分布式表示可以有效的支持相关的语言学家进行语义演化的研究。
上面是通过词汇表示的方向来简单介绍分布式表示的一些优势,接下来会花比较多的时间介绍知识表示一些相关的思想进展,还有它在知识获取方面的一些应用。
知识表示的研究对象是知识图谱,知识图谱主要包括实体和关系两个主要对象(节点代表实体,连边代表关系)。
根据上图,知识图谱中每一个节点代表一个不同的实体,这些实体之间的连边实际上反映了它们的关系,知识图谱与传统的社会网络不同的地方在于在它里面每一条边实际上都会带有明确标识类型关系的标签,它实际上让知识图谱变得更加复杂的同时也变得更加有表达能力。
知识图谱也可以通过三元组的形式进行表示,这种三元组(head,relation,tail)的表述,是一种典型基于符号的表示方法。也就是上图可以用若干三元组表示,每一个三元组包括头实体,尾实体和他们之间的某一种关系。比如上图中patti和miami之间有born in的关系,那么头实体就是head,尾实体就是miami,他们之间的relation关系是born in,也就是说知识图谱可以用若干个三元组来进行这种符号表示。
具有代表性的知识图谱非常多,这里面举两个例子,一个是反应人类的语言知识的wordnet,它是一个非常有代表性的被自然语言学者广泛应用的知识图谱库。另外一个非常有代表性的知识图谱是关于世界相关知识的freebase,freeebase是被Google收购的一家创业公司,在收购之后逐渐扩充,逐渐成为世界上最大的一个公开的知识图谱库。它在2014年被谷歌闭源,相关的知识库已经transform到了wikidata中。
知识图谱典型代表方案是基于符号表示的三元组(rdf)形式,这种基于符号的表示有一个非常大的问题是它假设所有的实体或者说所有的关系,他们互相之间都是相互独立的, 那么其实我们没有很好和有效的办法去衡量这些实体之间的语义关系,过去有非常多的研究算法被提出来,尝试计算这些实体之间语义的关系,但是由于它们都是基于图的算法,比如寻找最短路径来反应两个实体之间的关系,这个计算过程其实是复杂度的非常高的一件事情,那么我们找到一个解决方案是将知识映射到低维向量空间中去,譬如把实体之间的关系能够映射到低维向量空间中,这样就可以很好的表示它们背后的语义信息,也能够很好的计算任意两个实体之间的语义关系,这就是这个解决方案的一个基本的思想。
【转】自然语言系列学习之表示学习与知识获取(三)知识图谱相关推荐
- 自然语言系列学习之表示学习与知识获取(七)利用关系路径进行关系抽取
接下来介绍另外一个方向是如何更好的利用知识图库里关系路径的信息进行关系抽取. 有一个非常直观的例子介绍关系路径的好处,如电影阿甘正传(上图),我们如果想要知道阿甘正传的语言是什么,可以通它的电影导演是 ...
- 【转】自然语言系列学习之表示学习与知识获取(一)分布式表示
研究表示学习跟人工智能很多领域研究对象有关,这些领域包括自然语言处理,数据挖掘,社会网络分析,多媒体处理等等,他们研究的对象包括 : 网络结构:用户及其关系和行为 媒体信息:文本,视频,语音等信息 知 ...
- 【转】自然语言系列学习之表示学习与知识获取(八)利用远程监督多实例的关系抽取
下面介绍下如何利用远程监督多实例进行关系抽取.前文有提到到当利用文本进行关系抽取,基本思想是利用知识图谱中,如(下图)任意两个实体同时在句子中出现: 我们把句子当成是两个实体关系训练得样例,这样就可以 ...
- 自然语言系列学习之表示学习与知识获取(六)融合实体描述的知识表示和融合实体所在句子的知识表示
利用文本信息还有还有另外一个非常重要的来源,就是来自于实体的描述,在知识库里对一些实体构建关于它的一个简单的介绍(short description). 这些简短的介绍,往往能够很好的反映实体的表示, ...
- 【转】自然语言系列学习之表示学习与知识获取(五)融合文本和知识,利用cnn方法进行关系抽取
本文重点放在怎么利用知识表示学习,辅助我们进行关系抽取,首先介绍如何利用分布式表示去融合知识和文本进行文本的抽取. 前文提到利用知识图谱学习了知识表示,就可以预测任意两个实体之间的关系,它是通过t-h ...
- 【转】自然语言系列学习之表示学习与知识获取(四)TransE
概述 在知识表示学习方面,一个代表性的算法就是transe, 它的基本思想是把每一个实体和每一个关系都表示成一个低维的向量,它的想法是对于每一个事实,将其中的relation看成是从头实体到尾实体的一 ...
- 【转】自然语言系列学习之表示学习与知识获取(二)word2vec
自然语言处理相关的对象包括词汇,词义,短语,实体,句子,文档,还有比如说社会网络,知识表示等等. 本文通过词汇表示的基本知识介绍分布式表示的基本的思想和特点. 在词汇表示方面的经典模型是2013年go ...
- 知识图谱论文阅读(八)【转】推荐系统遇上深度学习(二十六)--知识图谱与推荐系统结合之DKN模型原理及实现
学习的博客: 推荐系统遇上深度学习(二十六)–知识图谱与推荐系统结合之DKN模型原理及实现 知识图谱特征学习的模型分类汇总 知识图谱嵌入(KGE):方法和应用的综述 论文: Knowledge Gra ...
- Datawhale 知识图谱组队学习 之 Task 1 知识图谱介绍
Datawhale 知识图谱组队学习 之 Task 1 知识图谱介绍 知识图谱理论: 相关理论 知识图谱背景 早在 2010 年微软就开始构建知识图谱,包括 Satori 和 Probase:2012 ...
最新文章
- python 多项式拟合
- 组合的输出pascal程序
- Spring MVC HttpMessageConverter对象
- python初步学习-查看文档及数据类型转换
- 反射创建对象_如何应用Java反射技术灵活地创建程序类的对象实例
- oracle10g如何导出dmp,Oracle 10g dmp文件的导入导出
- .net解决Xss攻击
- springboot logback自定义配置文件路径
- Python 图片与字符串互转
- SSIS工具的ETL过程,全量ETL和增量ETL过程教程
- Asp.Net MVC 自定义登录过滤器
- 算法设计 分析篇(摊销分析)
- 面向对象分析过程案例实战
- 交通灯c语言单片机程序,基于51单片机的一个简单交通灯程序
- NGFF(M.2) m.2中Bkey接口Mkey接口有什么不同
- 超简单! 一个标签搞定跑马灯,纯css制作跑马灯效果
- 职场低情商就这三句话
- 超简单地输出所有水仙花数(Java实现)
- android照片共享,在安卓手机上可以实现多人共享照片吗?
- ubuntu android编译和开发环境配置记录
热门文章
- Linq使用Group By 1
- thinkphp环境变量.env配置
- PHP微信支付没有收到微信的回调怎么修改订单状态:主动查询
- team网卡配置_Windows下的网卡Teaming 配置教程(图文)
- matlab删失数据威布尔,基于混合I型删失数据威布尔模型的可接受抽样计划
- python控制步进电机代码tx2_步进电机C语言控制,高手请进来指点一下!
- PHP 5.3以上版本新增的一些方法
- mysql 建索引_mysql数据库正确建立索引及使用
- 【maven插件】versions-maven-plugin : 管理版本号
- php 将一个字符串转换成数组,PHP将一个字符串转换成数组