论文浅尝 | 用对抗学习做知识表示(NAACL2018)
论文链接:https://arxiv.org/pdf/1711.04071.pdf
代码链接:https:// github.com/cai-lw/KBGAN
本文针对在生成负样本时有大部分负样本可以很好地和正样本区分开,对训练的影响不大,提出了使用生成对抗网络(GANs)的方法,解决生成的负样本不够好的问题。它是第一个考虑用对抗学习生成负样本的工作。
设计模型时,本文把基于概率的log损失的表示学习模型作为生成器得到更好的负样本质量;使用基于距离的边缘损失的表示学习模型作为判别器得到表示学习的最终结果。由于生成器的步骤离散导致不能直接运用梯度反向传播,对此作者使用了一步强化学习设置,使用一个降低方差的强化方法实现这个目标。
方法上本文先列举了两种损失函数:
(1)Margin loss function:
(2)Log-softmax loss function:
再通过分析均匀负采样的缺陷:等概率替换会使容易区分的负样本对学习的贡献较小,会让模型学到一些简单的特征,而不是尽可能去理解语义,对此作者认为使用log损失函数从替换实体得到的所有负样本中筛选出更有用的负样本很有必要。
最后通过模型图我们发现论文使用softmax概率模型为生成器G,通过概率分布进行采样;判别器部分D接收生成的负样本和ground truth triple并计算分数;G通过梯度策略最小化生成的负三元组的分数,D通过梯度下降最小化正样本和负样本的边缘损失。
假设生成器得到的负样本概率分布为
(1)那么判别器的score function为
(2)生成器的目标是最大化负距离的期望为
由于 R_G 是一个离散采样步骤得不到梯度,本文借鉴了其他论文提到的梯度策略理论获取梯度进行优化【这一部分论文把这个过程对标到强化学习,认为生成器是agent,判别器是environment, (h, r, t) 是 state,负样本概率分布 P_G 是policy,(h’, r, t’)是action,-f_D(h’, r, t’)是reward,认为是 one-step RL 是在每个 epoch,actions 不会影响 state,但每个 action 后会重新从一个不相关的state开始;为减小算法方差而不引入新参数,作者从 reward 减掉一个常量】
概率分布的计算使用以下公式,f_G(h, r, t)为生成器的scorefunction:
算法伪代码如下:
实验部分
论文选用的数据集有FB15K-237, WN18, WN18RR,结果发现使用 DISMULT 或 COMPLEX 作为生成器都不会对性能有较大影响,且 TransD, TransE 在 KBGAN 中很明显优于它们的 baseline。
笔记整理:李娟,浙江大学直博生,研究方向为表示学习.
OpenKG.CN
中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 博客。
论文浅尝 | 用对抗学习做知识表示(NAACL2018)相关推荐
- 论文浅尝 | 基于对抗学习的弱监督知识图谱对齐
论文笔记整理:郭凌冰,浙江大学研究助理,研究方向为知识图谱的表示学习. 绝大部分现有的知识图谱对齐方法都要求足够的已对齐三元组作为监督数据,但在现实世界中,获取大量的对齐三元组的代价十分高昂.本文提出 ...
- 论文浅尝 | 用增强学习进行推理:问答与知识库完善(KBC)
本文转载自公众号:程序媛的日常. 利用知识库.知识图谱来完善问答系统,有非常广阔的实际应用场景.当用户提出一个问题时,有时候仅用知识库中的某一个三元组事实(fact triple)即可回答.但当问题比 ...
- 论文浅尝 | 基于表示学习的大规模知识库规则挖掘
链接:www.ict.griffith.edu.au/zhe/pub/OmranWW18.pdf 动机 传统的规则挖掘算法因计算量过大等原因无法应用在大规模KG上.为了解决这个问题,本文提出了一种新的 ...
- 论文浅尝 | 使用变分推理做KBQA
Yuyu Zhang, Hanjun Dai, Zornitsa Kozareva, Alexander J.Smola, and Le Song: Variational Reasoning for ...
- 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述
随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...
- 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings
论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...
- 论文浅尝 | 图神经网络综述:方法及应用
论文链接:https://arxiv.org/pdf/1812.08434.pdf GNN相关论文列表链接:https://github.com/thunlp/GNNPapers 近日,清华刘知远老师 ...
- 论文浅尝 | 近期论文精选
本文转载自公众号 PaperWeekly, 对我们近期的论文浅尝进行了精选整理并附上了相应的源码链接,感谢 PaperWeekly! TheWebConf 2018 ■ 链接 | https://ww ...
- 论文浅尝 | 从 6 篇顶会论文看「知识图谱」领域最新研究进展 | 解读 代码
本文内容源自往期「论文浅尝」,由 PaperWeekly 精选并重新排版整理,感谢 PaperWeekly. ISWC 2018 ■ 链接 | http://www.paperweekly.site/ ...
最新文章
- springboot基于maven多模块项目搭建(直接启动webApplication)
- selenium中的三种等待方式(显示等待WebDriverWait()、隐式等待implicitly()、强制等待sleep())---基于python...
- Mac下SourceTree导出更新文件
- 单模光电转换器怎么接_以太网光纤收发器怎么用?
- 弹性盒模型--新版与旧版比较(2)
- 如何彻底关闭windows defender
- android+ndk+r9+x64下载,Win7 64位中文旗舰版上Cocos2d-x 3.0的Android开发调试环境架设
- 创建sdcard.img时,提示permission dennid
- Django 分页查询并返回jsons数据,中文乱码解决方法
- selenium测试(Java)-- 显式等待(九)
- mac m1搭建java opencv 环境(遇到的坑记录)
- vs C++实现Socket通信、添加ws2_32.lib 静态链接库
- linux修改文件类型和权限
- 无奈人心渐开明 贪嗔痴恨爱恶欲
- android背光,Android背光亮度调节
- [uwsgi-body-read] Error reading 65536 bytes. Content-Length: 560903 consumed: 0 left: 560903 message
- Flink源码剖析:回撤流
- 34day 新浪微博(首页)
- window关闭烦人的右下角广告
- 工作总结PPT怎么写?60套工作总结PPT模板:年度汇报、项目汇报,晋升述职
热门文章
- 利用openssl来计算sha1, sha224, sha256, sha384, sha512
- 尘埃落定,初心未改——一个大学生的电子大赛感悟
- 你知道GNU C 对C语言的扩展吗?
- 给楠哥准备的入门单片机
- gpg96244qs1屏驱动起来了
- 机器学习导论 与数学分析
- LeetCode 2091. 从数组中移除最大值和最小值(一次遍历)
- LeetCode MySQL 1777. 每家商店的产品价格(行列转换)
- LeetCode 1563. 石子游戏 V(DP)
- LeetCode 1560. 圆形赛道上经过次数最多的扇区