欢迎来到《每周NLP论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。

语义匹配也是NLP中比较基础的任务,它的主要目标是计算两个querry、两个文本之间的关系,包括相似度、问答关系等。在搜索引擎、智能问答、知识检索、信息流推荐等系统中都有应用。

作者&编辑 | 小Dream哥

1 最早的深度语义匹配模型-DSSM

Deep Structured Semantic Models(DSMM)的原理很简单,通过搜索引擎里 Query 和 Title 的海量的点击曝光日志,用 DNN 把 Query 和 Title 表达为低维语义向量,并通过 cosine 距离来计算两个语义向量的距离,最终训练出语义相似度模型。该模型既可以用来预测两个句子的语义相似度,又可以获得某句子的低维语义向量表达。

DSSM采用词袋模型(BOW),因此丧失了语序信息和上下文信息。另一方面,DSSM 采用弱监督、端到端的模型,预测结果不可控。

文章引用量:300+

推荐指数:✦✦✦✦✧

[1] Huang P S , He X , Gao J , et al. Learning deep structured semantic models for web search using clickthrough data[C]// Proceedings of the 22nd ACM international conference on Conference on information & knowledge management. ACM, 2013.

2 卷积用在语义匹配上-CLSM

针对DSSM词袋模型丢失上下文信息的缺点,CLSM(convolutional latent semantic model)应运而生,又叫 CNN-DSSM。CNN-DSSM 与 DSSM 的区别主要在于输入层和表示层。

文章引用量:140+

推荐指数:✦✦✦✦✧

[2] Shen Y , He X , Gao J , et al. [ACM Press the 23rd ACM International Conference - Shanghai, China (2014.11.03-2014.11.07)] Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management - CIKM \"14 - A Latent Semantic Model with Convolutional-Pooling Structure for Information Retrieval[J]. 2014:101-110.

3 LSTM用在语义匹配上

针对 CNN-DSSM无法捕获较远距离上下文特征的缺点,有人提出了用LSTM-DSSM来解决该问题。

文章引用量:较少

推荐指数:✦✦✦✦✦

[3] Palangi H , Deng L , Shen Y , et al. Semantic Modelling with Long-Short-Term Memory for Information Retrieval[J]. Computer Science, 2014.

4 MV-DSSM

MV learning是指从不共享特征空间的多个domain中学习模型。MVDNN可以通过渗透多domain的数据来学习到更好的用户表征。

基于Multi-View的DSSM参数变多了,由于多视角的训练,输入的语料也可以变得不同,自由度也更大了,但是随之带来的问题就是训练会变得越来越困难。

文章引用量:较少

推荐指数:✦✦✦✧✧

[4] Elkahky A M , Song Y , He X . A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems[C]// the 24th International Conference. International World Wide Web Conferences Steering Committee, 2015.

5 基于字符特征的语义匹配 

研究了基于字符和字符特征与基于词向量进行语义匹配任务的差异,观点挺新颖,可以一看。

文章引用量:较少

推荐指数:✦✦✦✦✧

[5] Wuwei Lan, Wei Xu. Character-based Neural Networks for Sentence Pair Modeling. arXiv preprint arXiv:1805.08297v1, 2018.

6 基于BERT的语义相似度计算与匹配

基于BERT及其他预训练模型进行语义相似度计算是一种趋势,这篇文章只是做了一个简要的介绍,实在找不到更好的文章了。有的同学请推荐呀。

文章引用量:较少

推荐指数:✦✦✦✧✧

[6] Manish Patel. TinySearch- Semantics based Search Engine using Bert Embeddings. 2019.

7 ResNet宽度问题 

一篇综述性的文章,介绍了多种用于语义计算的深度学习模型,并进行了比较,值得一读。

文章引用量:较少

推荐指数:✦✦✦✦✦

[7] Zagoruyko S, Komodakis N. Neural Network Models for Paraphrase Identifification, Semantic Textual Similarity, Natural Language Inference, and Question Answering. arXiv:1806.04330v2, 2019.

8 非常好的工具MatchZOO

语义匹配非常好的开源工具,这篇文章介绍了如何利用这个工具进行训练,快速获得一个效果较好的模型。

文章引用量:较少

推荐指数:✦✦✦✦✦

[8] Jiafeng Guo, Yixing Fan, Xiang Ji, et al. MatchZoo: A Learning, Practicing, and Developing System for Neural Text Matching. arXiv:1905.10289v2.

9 如何获取文章与交流

找到有三AI开源项目即可获取。

https://github.com/longpeng2008/yousan.ai

文章细节众多,阅读交流在有三AI-NLP知识星球中进行,感兴趣可以加入。

总结

以上就是NLP中语义匹配任务一些比较代表性的文章,下一期我们将介绍一些对话系统的文章。

有三AI夏季划

有三AI夏季划进行中,欢迎了解并加入,系统性成长为中级CV算法工程师。

转载文章请后台联系

侵权必究

往期精选

  • 【NLP】自然语言处理专栏上线,带你一步一步走进“人工智能技术皇冠上的明珠”。

  • 【NLP】用于语音识别、分词的隐马尔科夫模型HMM

  • 【NLP】用于序列标注问题的条件随机场(Conditional Random Field, CRF)

  • 【NLP】经典分类模型朴素贝叶斯解读

  • 【NLP】 NLP专栏栏主自述,说不出口的话就交给AI说吧

  • 【NLP】 深度学习NLP开篇-循环神经网络(RNN)

  • 【NLP】 NLP中应用最广泛的特征抽取模型-LSTM

  • 【NLP】 聊聊NLP中的attention机制

  • 【NLP】 理解NLP中网红特征抽取器Tranformer

  • 【每周NLP论文推荐】从预训练模型掌握NLP的基本发展脉络

  • 【技术综述】深度学习在自然语言处理中的应用

【每周NLP论文推荐】 介绍语义匹配中的经典文章相关推荐

  1. 【每周NLP论文推荐】 对话管理中的标志性论文介绍

    欢迎来到<每周NLP论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 对话管理(Dialog Managemen ...

  2. 【每周NLP论文推荐】 生成式聊天机器人论文介绍

    欢迎来到<每周NLP论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 生成式聊天机器人是研究的热点,现在看来,通 ...

  3. 【每周NLP论文推荐】 聊天机器人中FAQ相关的论文推荐

    欢迎来到<每周NLP论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 今天推荐FAQ相关的论文,FAQ是聊天机器 ...

  4. 【每周NLP论文推荐】 掌握实体关系抽取必读的文章

    欢迎来到<每周NLP论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 实体关系抽取作为信息抽取领域的重要研究课题 ...

  5. 【每周NLP论文推荐】 开发聊天机器人必读的重要论文

    欢迎来到<每周NLP论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 对于聊天机器人研究,可以追溯到上个世纪50 ...

  6. 【每周CV论文推荐】 CV领域中数据增强相关的论文推荐

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 数据增强在每一个深度学习项目中都是必要的操作 ...

  7. 【每周NLP论文推荐】 NLP中命名实体识别从机器学习到深度学习的代表性研究

    NER是自然语言处理中相对比较基础的任务,但却是非常重要的任务.在NLP中,大部分的任务都需要NER的能力,例如,聊天机器人中,需要NER来提取实体完成对用户输入的理解:在信息提取任务中,需要提取相应 ...

  8. 【每周NLP论文推荐】 知识图谱重要论文介绍

    欢迎来到<每周NLP论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 知识图谱是NLP中非常重要的底层基础建筑. ...

  9. 【每周NLP论文推荐】从预训练模型掌握NLP的基本发展脉络

    读论文是做AI的人必需要下的功夫,所以咱们开通了专栏<每周NLP论文推荐>.本着有三AI的一贯原则,即系统性学习,所以每次的论文推荐也会是成系统的,争取每次能够把一个领域内的"故 ...

最新文章

  1. SQL-16 统计出当前各个title类型对应的员工当前薪水对应的平均工资。结果给出title以及平均工资avg。...
  2. C语言——把结构体数据封装成TLV格式的数据
  3. 009_Raphael绘制图形
  4. matlab-画个拱桥和倒影?
  5. Java的多线程和线程池的使用,你真的清楚了吗?
  6. PHP小白学习日程之旅
  7. Java13-day04【Integer、int和String的相转、自动装箱和拆箱、Date、SimpleDateFormat、Calendar、异常、try...catch、throws】
  8. PHOTOSHOP中3D下拉菜单为灰色如何设置
  9. flask之jinji2模板介绍
  10. 使用JQuery Mobile实现手机新闻浏览器
  11. bat脚本中获取上级目录_使用Python写一个可以监控Tomcat 运行的脚本,并且把.py文件转换成.exe文件...
  12. TensorFlow6-线性回归实战
  13. 阿里巴巴1582.73亿背后的持续交付如何玩
  14. 分子动力学模拟-gromacs的基本使用
  15. Win10下ImageAI-gpu训练自己的数据集
  16. 【嵌入式系统开发12】在stm32F103C8T6环境下,用HAL库,采用中断模式编程,控制LED的高亮与熄灭
  17. WebApi实现验证授权Token,WebApi生成文档等(转)
  18. 21个数据科学家面试必须知道的问题和答案
  19. Kali Linux系统安装
  20. 设计水杯,门锁的测试用例

热门文章

  1. Linux最常用命令:简单易学,但能解决95%以上的问题
  2. Java泛型深入理解小总结
  3. postman怎么不登陆使用_钉钉登陆不了怎么办,那时的网速也不流畅,怎么办
  4. LeetCode 17电话号码的字母组合(搜索)18四数之和
  5. 杭电1430康托 bfs(java)
  6. C语言基础-第一个C程序
  7. 如何在队列排队之前让ThreadPoolExecutor将线程增加到最大数量
  8. Oracle buffer状态深入剖析
  9. mysql myisam存储引擎_MySQL浅谈MyISAM存储引擎
  10. php7抓取网页数据,php7-远程获取api接口或网页内容