当你站在人脸识别门禁闸口,扫脸,绿灯亮通过,就可以任意进出宿舍楼、图书馆、教学区等各种校内场所,你也许会想:机器认识我吗?

认知图谱Topic必读论文

当你站在人脸识别门禁闸口,扫脸,绿灯亮通过,就可以任意进出宿舍楼、图书馆、教学区等各种校内场所,你也许会想:机器认识我吗?
实际并非如此。当前的AI识别能做的只是比对,它缺少信息进入大脑之后的加工、理解、思考步骤,因此仅仅停留在感知阶段,而并非“认知”。而这种以感知智能技术为主的人工智能,无论是在智能理解能力还是安全性方面,与人类智能都相去甚远。
想要让人工智能有类似大脑的活动,走到认知阶段,需要让它掌握知识、进行推理。机器必须要掌握大量的知识,特别是常识知识才能实现真正类人的智能。所以,“理解”与“解释”是AI需要攻克的下一个挑战,而认识图谱为“可解释的AI”提供了全新的视角和机遇。
“Knowing yourself is the beginning of all wisdom.”亚里士多德的这句话,正是认知图谱使命最好的概括。
那么,想深入学习和研究认知图谱,研读该领域的经典论文,对于研究者和从业者都必不可缺。经过我们对人工智能领域国际顶会/期刊中“认知图谱”相关关键词论文的计算,以及热心读者徐菁博士的整理,AMiner推出了100篇认知图谱经典必读论文。这些论文可以说基本都是经典中的经典,他们多是领域大佬+顶级会议的组合,读完它们,相信你对认知图谱的认认识肯定会有质的飞越。
此外,AMiner还为你特别准备了“一键综述”服务,一键批量生成“论文综述”,另有“论文精读”加持,如此周到细致,还不赶紧来体验下。
在使用体验过程若有任何意见,请在文末留言或邮件至report@aminer.cn

该List除了整合了认知图谱领域的100篇经典论文,小脉还对这些论文进行了简要分析。
先来看看它们都出自哪些会议?根据对论文出处的分析,它们大多选自NeurIPS、ICLR、ACL、EMNLP、IJCAI、AAAI等机器学习与自然语言处理领域的国际顶会。
根据对这些经典论文发表年份的统计,近十年这些论文主要发表在2016-2019这四年间,占比达60%;在2014-2016年间也有不少经典论文发表。
再来看看入选作者,有一位大佬有4篇论文入选,他正是DeepMind的研究科学家Oriol Vinyals,在今年被评为AI 2000机器学习全球最具影响力学者之一。还有三位作者有3篇论文入选,他们分别是微软研究院合伙人研究经理高剑峰,佐治亚理工大学机器学习中心的教授宋乐,Facebook研究科学家、纽约大学客座教授Jason Weston,他们都是机器学习领域的大牛。另有21位作者都有2篇入选。

我们按照这100篇经典论文的被引量,挑选了其中的10篇作简单评述,供大家学习参考。
我们近期还会推出《认知图谱研究报告》,欢迎关注。

Neural Machine Translation by Jointly Learning to Align and Translate(ICLR 2015)
作者:Dzmitry Bahdanau,Kyunghyun Cho,Yoshua Bengio
单位:Jacobs University Bremen,Université de Montréal
引用量:9818
推荐理由:这篇论文的一作正是Yoshua Bengio的博士生Dzmitry Bahdanau。文中首次提出在神经网络机器翻译(NMT) 中使用Attention的机制,可以使模型自动确定源句子中和目标词语最相关的部分,相比于基本encoder-decoder方法提高了翻译效果。该文提出的方法优化了神经机器翻译模型,其效果的提升对于长句子的翻译尤其明显。

Sequence to Sequence Learning with Neural Networks(NeurIPS2014)
作者:Ilya Sutskever,Oriol Vinyals,Quoc V. Le
单位:Google
引用量:8846
推荐理由:该文是谷歌发表于2014年NeurIPS的一篇神作,现已被广泛使用的Sequence to Sequence模型论文。文中基于多层的长短期记忆网络(LSTM),提出了一种对序列结构做最小假设的一般端到端序列学习方法,在长短句翻译方面均表现优异。

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding(NAACL-HLT 2019)
作者:Jacob Devlin,Ming-Wei Chang,Kenton Lee,Kristina Toutanova
单位:Google
引用量:2952
推荐理由:该论文提出的BERT模型被各地学者、媒体美誉为NLP新一代大杀器。文中提出了一种语言表达模型BERT,即Transformer的双向编码表示,它通过考虑所有层整个上下文对为标注过的文本进行深度双向表达的预训练。实验结果证明,使用预训练过的BERT模型,仅仅在后面再包一层输出层,并对其进行微调训练,就可以取得不错的效果。BERT在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人成绩:全部两个衡量指标上全面超越人类,并且还在11种不同NLP测试中创出最佳成绩。

Ontology Learning for the Semantic Web(IEEE 2001)
作者:Alexander D. Maedche,Steffen Staab
单位:University of Karlsruhe
引用量:2932
推荐理由:本文提出了一种利用半自动本体构建工具,扩展典型本体工程环境的本体学习框架。该框架包括本体的导入、提取、裁剪、细化和评价。实验结果表明,利用语义网和本体,该方法能够实现全面的、可移植的机器理解。

Effective Approaches to Attention-based Neural Machine Translation(EMNLP 2015)
作者:Thang Luong,Hieu Pham,Christopher D. Manning
单位:Stanford University
引用量:2866
推荐理由:该文是NLP大牛Christopher D. Manning与他的博士生Thang Luong等人的佳作。也是继Bahdanau等人提出Attention用于NLP的后续工作,作者提出了相对于之前工作的两种新的但却有效的注意力机制,全局注意力(global)和局部注意力(local)。其中,局部注意力机制的运用使得神经机器翻译模型远胜于非注意力机制模型(5个BLEU点)。在融合了各个注意力机制模型之后,它在英文翻译到德文的多项任务中取得了SOTA的结果。

Attention Is All You Need(NeurIPS2017)
作者:Ashish Vaswani,Noam Shazeer,Niki Parmar,Jakob Uszkoreit,Llion Jones,Aidan N. Gomez,Lukasz Kaiser,Illia Polosukhin
单位:Google,University of Toronto
引用量:2706
推荐理由:本篇文章的创新点在于抛弃了之前传统的encoder-decoder模型必须结合CNN或者RNN的固有模式,只用Attention。文章提出一种基于注意机制的transformer模型,目的在于减少计算量和提高并行效率的同时不损害最终的实验结果。结果表明,它能更好地完成机器翻译任务,在质量上更优同时可并行化,所需的训练时间明显更少。

Translating Embeddings for Modeling Multi-relational Data(NeurIPS2013)
作者:Antoine Bordes,Nicolas Usunier,Alberto García-Durán,Jason Weston,Oksana Yakhnenko
单位:Universite de Technologie de Compi` egne (UTC),Google
引用量:1660
推荐理由:本文提出了TransE,一种通过将关系解释为在实体的低维嵌入上操作的转换来建模关系的方法。尽管它很简单,但是这种假设被证明是强大的,因为大量的实验表明在两个知识库连接预测方面,TransE明显优于目前最新的方法。它解决了多关系数据在低维向量空间中的嵌入问题,且模型易于训练,包含较少的参数,可以扩展到非常大的数据库。

Ontology Based Context Modeling and Reasoning using OWL(PerCom 2004)
作者:Xiaohang Wang,Daqing Zhang,Tao Gu,Hung Keng Pung
单位:National University of Singapore
引用量:1460
推荐理由:该文使用了OWL的基于本体的上下文建模和推理方法,在普适计算环境中建模上下文,并支持基于逻辑的上下文推理。

A Neural Attention Model for Abstractive Sentence Summarization (EMNLP 2015)
作者:Alexander M. Rush,Sumit Chopra,Jason Weston
单位:Facebook
引用量:1229
推荐理由:该文是神经网络用于生成式模型的开篇之作,作者提出了利用Gigaword构建大量平行句对的方法,使得利用神经网络训练成为可能,之后多篇工作都使用了该方法构建训练数据。实验结果表明,该方法使得文本文摘的性能提升,容易进行端到端训练,并可扩展到大量的训练数据。

Reasoning With Neural Tensor Networks for Knowledge Base Completion(NeurIPS2013)
作者:Richard Socher,Danqi Chen,Christopher D. Manning,Andrew Y. Ng
单位:Stanford University
引用量:1043
推荐理由:这篇论文是是吴恩达与曼宁团队的佳作。这篇论文主要创新点表现在,相比前人在知识库里使用实体去预测关系,作者引入了一个损失函数为双线性的三层神经网络(NTN)模型,并且对于实体向量初始化的处理采用非监督模型训练得到的词向量的平均值,大大提高了系统的准确率。
看完了以上佳作,更多经典论文请进入“认知图谱”专题页查看。

相关阅读:

必读论文 | 机器学习必读论文20篇

必读论文 | 知识图谱必读论文10篇

必读论文 | COVID-19必读论文20篇

必读论文 | 信息检索与推荐必读论文10篇

必读论文|百篇最值得一读的“认知图谱”经典论相关推荐

  1. 百篇最值得一读的“认知图谱”经典论文

    当你站在人脸识别门禁闸口,扫脸,绿灯亮通过,就可以任意进出宿舍楼.图书馆.教学区等各种校内场所,你也许会想:机器认识我吗? 实际并非如此.当前的AI识别能做的只是比对,它缺少信息进入大脑之后的加工.理 ...

  2. 必读论文 | 云机器人必读论文10篇

    云机器人(Cloud Robotics)是云计算和机器人的交叉学科并且是机器人领域的一个重大热点新方向,它运用云计算的强大运算和存储能力,给机器人提供一个更智能的"大脑",在增强单 ...

  3. 必读论文|机器学习必读论文20篇

    机器学习Topic必读论文 学术文献代表着研究热点与技术前沿,过去10多年间,学术文献出现了爆炸式增长.对很多初学者来说,如何正确找到自己研究领域的切入点成了一件非常痛苦的事儿.不必苦恼,小编这里有神 ...

  4. 必读论文|信息检索与推荐必读论文10篇

    AMiner研究团队开发出一款利用人工智能(AI)技术.帮助科研工作者阅读论文的智能论文搜索工具.该工具可以展示出该领域的必读论文,并且对所选论文进行"智能"阅读,反馈给你该论文的 ...

  5. ChatGPT相关技术必读论文100篇(2.27日起,几乎每天更新)

    按上篇文章<ChatGPT技术原理解析:从RL之PPO算法.RLHF到GPT-N.instructGPT>的最后所述 为了写本ChatGPT笔记,过去两个月翻了大量中英文资料/paper( ...

  6. 必读论文 | 卷积神经网络百篇经典论文推荐

    作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉.分类等领域上,都取得了当前最好的效果. 卷积神经网络的前世今生 卷积神经网络 ...

  7. 必读论文 | 生成对抗网络经典论文推荐10篇

    生成式对抗网络(Generative adversarial networks, GAN)是当前人工智能学界最为重要的研究热点之一.其突出的生成能力不仅可用于生成各类图像和自然语言数据,还启发和推动了 ...

  8. 这33篇区块链必读论文, 读过5篇以上的竟不到1%

    作者 | Bhaskar Krishnamachari 译者 | Guoxi 责编 | Aholiab 出品 | 区块链大本营(blockchain_camp) 区块链行业中,很多开发者都是半路出家的 ...

  9. 图灵奖得主Judea Pearl:最近值得一读的19篇因果推断论文

    近日,图灵奖得主.因果科学之父Judea Pearl 在推特上分享了一个论文集列表PDF,推荐了19篇大多近期发表.值得一读的因果推断相关文章(推荐列表下载),同时特别highlight了一下&quo ...

最新文章

  1. mysql通过查看跟踪日志跟踪执行的sql语句
  2. 写数据到文件注意事项write方法
  3. MySQL 5.6 Warning - Using a password on the command line interface can be insecur 解决方案
  4. CentOS 6.4下安装中文输入法
  5. jsp里面java和js交互_jsp与js交互实例 | 学步园
  6. python数字加密解密_Python对整形数字进行加密和解密
  7. SugarCRM 在Html中增加超连接按钮
  8. c++ printf怎么用_【经典】把脉printf中的C进阶技巧
  9. 矩阵可逆的一种刻画方式
  10. 凭借K2 SmartObject框架,在SharePoint中集成数据
  11. java 流程控制篇 2021/02/26持续更新中
  12. java service层 事务_Java高并发秒时啊API之Service层1
  13. Oracle mysql 语句_Oracle 数据库常用操作语句大全
  14. 牛客网暑期ACM多校训练营(第五场)J-plan (模拟)
  15. 浅析Hibernate映射(三)——继承映射
  16. 【5G架构】5G 协议栈结构以及与OSI七层协议之间的关系
  17. 用isprime判断是否为素数(函数法)
  18. xgboost early_stop_rounds是如何生效的?
  19. Mantel test: 两个矩阵相关关系的检验
  20. 有个开发者总结这 15 优雅的 JavaScript 个技巧

热门文章

  1. 局域网LanQQ聊天项目
  2. crash linux主要命令,crash分析
  3. 出行即服务MAAS专辑(2022)(可下载)
  4. DSP28377D开发笔记(一) 初步认识DSP28377D芯片
  5. 金融业移动管理驾驶舱产品功能介绍
  6. 记忆力减退之----SP3232---STM32
  7. java多态实现的三种形式,逆袭面经分享
  8. Java第四天笔记02——方法的定义及调用
  9. a标签的带参传值和form表单的带参
  10. MAT的使用(一)使用方法介绍