1、Learning Text Similarity with Siamese Recurrent Networks | 网络包含4层BiLSTM(64-d hidden),最后一层的BiLSTM的hidden state和cell state进行concat,然后在timestep维度进行average处理,并接一个Dense层(激活函数为tanh),得到的两个Embedding Space进行Cosine sim计算,得到的相似度分数E用于损失函数计算,损失函数使用对比损失函数,计算方法为,损失函数正例:1/4(1-E)^2,负例:E^2(如果E<m),否则0 | Paul Neculoiu et al,2016

论文链接:

链接https://aclanthology.org/W16-1617.pdf

论文解读:

链接https://blog.csdn.net/weixin_41362649/article/details/113795728?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~aggregatepage~first_rank_ecpm_v1~rank_v31_ecpm-23-113795728.pc_agg_new_rank&utm_term=%E5%8F%8C%E5%90%91lstm%E5%AD%AA%E7%94%9F&spm=1000.2123.3001.4430

代码复现:  暂未实现。

2、Siamese Recurrent Architectures for Learning Sentence Similarity  | Siamese LSTM,一个用来计算句对相似度的模型 | Jonas Mueller et al,2016

论文链接:

链接https://www.semanticscholar.org/paper/Siamese-Recurrent-Architectures-for-Learning-Mueller-Thyagarajan/72b89e45e8ad8b44bdcab524b959dc09bf63eb1e

论文解读:

链接https://blog.csdn.net/qq_38587650/article/details/123734093?spm=1001.2014.3001.5501

论文复现:

链接https://gitcode.net/mirrors/leokb24/Siamese-LSTM?utm_source=csdn_github_accelerator

3、Bag of Tricks for Efficient Text Classification  | 比较经典的FastText,比较依赖Word Embedding的质量(槽点本身难点就在于embedding,结果文章不谈这个),整个网络结构使用N-gram,对得到的Embedding求和,并过两个Dense然后输出,本身网络结构就那没啥,当然fast啦,外加论文具体加了hashing trick,hierarchical softmax等进行加速、内存优化 | Armand Joulin et al,2016

论文链接:

链接https://arxiv.org/pdf/1607.01759.pdf

论文解读:

论文复现:

4、Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks | 和之前提出的InferSent结构如出一辙,妥妥的双塔结构,只是换成了Bert来进行特征表示。模型结构没有什么创新点,但是这个结构用起来效果挺好,速度也快,很适合工业界使用。论文中在针对句向量表示计算策略分别使用了CLS向量策略、平均池化策略、最大值池化策略三个策略进行实验,实验结果中平均池化策略最优 | Nils Reimers et al,2019

论文链接:

链接https://arxiv.org/pdf/1908.10084.pdf

论文解读:

论文复现:

5、SimCSE: Simple Contrastive Learning of Sentence Embeddings |  基于Sentence-Bert,引入对比学习的思想,在无监督与有监督语义相似度计算任务达到SOTA。主要围绕对比学习质量指标Alignment和Uniformity来进行优化,对于Unsupervised,核心是使用dropout mask生成正样本,负样本是in-batch negatives。而Supervised则是NLI中entailment关系样例对。负例:a) in-batch negatives b)NLI中关系为contradiction的样例对 | Tianyu Gao et al,2021

论文链接:

链接https://arxiv.org/pdf/2104.08821.pdf

论文解读:

论文复现:

6、Multi-Perspective Sentence Similarity Modeling with Convolutional Neural Networks | 基于卷积神经网络的多视角句子相似度建模

论文链接:

链接https://www.aclweb.org/anthology/D15-1181.pdf

论文解读:

链接https://www.pianshen.com/article/74641504186/

论文复现:

7、Learning Deep Structured Semantic Models for Web Search using Clickthrough Data | DSSM是相当知名的多塔模型

论文链接:

链接https://posenhuang.github.io/papers/cikm2013_DSSM_fullversion.pdf

论文解读:

论文复现:

链接https://github.com/InsaneLife/dssm

8、Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, NLI and QA | 用于意译识别、语义文本相似性、自然语言推理和问题回答的神经网络模型

论文链接:

链接https://arxiv.org/pdf/1806.04330.pdf

论文解读:

链接https://www.pianshen.com/article/2145783639/

论文复现:

9、A Simple but Tough-to-Beat Baseline for Sentenc

论文链接:

链接https://openreview.net/pdf?id=SyK00v5xx

论文解读:

链接https://www.cnblogs.com/databingo/p/9788244.html

论文复现:

链接https://github.com/PrincetonML/SIF

10、Evolution of Semantic Similarity - A Survey | 语义相似度的一篇综述(2020)整体文章从数据集开始,将技术体系分为:基于知识的语义相似性方法、基于语料的语义相似性方法、基于深度神经网络的方法、基于混合模型方法四类进行分析 | DHIVYA CHANDRASEKARAN et al,2020

论文链接:

链接https://arxiv.org/pdf/2004.13820.pdf

论文解读:

链接https://zhuanlan.zhihu.com/p/138636605

论文复现:

11 、Learning Semantic Textual Similarity from Conversations  | Google提出了一个新的方法来学习用来计算语义文本相似度的句子表示方法

论文链接:

链接https://arxiv.org/pdf/1804.07754.pdf

自然语言处理研究方向--文本相似度论文合集(不断更新)相关推荐

  1. 人群计数最全代码、数据、论文合集

    2021.11.19更新: 人群计数 /Crowd Counting Rethinking Counting and Localization in Crowds:A Purely Point-Bas ...

  2. 【论文泛读】 Deep Learning 论文合集

    [论文泛读] Deep Learning 论文合集 文章目录 [论文泛读] Deep Learning 论文合集 Batch Normalization: Accelerating Deep Netw ...

  3. 【深度学习在智能机器人中的应用】论文合集推荐丨CMU新型机器人算法可操纵所有日常家具

    近日,卡内基梅隆大学机器人学院 (CMU Robotics Institute) 推出物体轨迹预测(FlowBot 3D)算法,可以使机器人去操纵日常家具.该算法泛化性极强,只需一个神经网络模型便能泛 ...

  4. 【论文相关】历年CVPR、ICCV、ECCV论文合集下载

    历年CVPR.ICCV.ECCV论文合集下载:还在不断更新中 本文来源与更新地址: https://github.com/WingsBrokenAngel/AIPaperCompleteDownloa ...

  5. 重磅福利!ICCV 2019全部论文合集共1075篇!会议信息全收录!

    会议之眼A类,CCF A类的计算机视觉会议ICCV 2019 于11月2日在韩国首尔落下帷幕, 在这场盛会中,华人科学家和企业切切实实地怒刷了一波存在感.会议之眼小助手在这里为大家整理了本次大会信息以 ...

  6. 【强化学习论文合集】三十三.2021国际人工智能联合会议论文(IJCAI2021)

    欢迎订阅本专栏:<强化学习论文合集> 专栏介绍: 本专栏整理了2017~2022年(后面会持续更新)强化学习领域国际顶级会议已录用的论文,会议包括但不限于:ICML.NeurIPS.AAA ...

  7. 【强化学习论文合集】十二.2018国际人工智能联合会议论文(IJCAI2018)

    欢迎订阅本专栏:<强化学习论文合集> 专栏介绍: 本专栏整理了2017~2022年(后面会持续更新)强化学习领域国际顶级会议已录用的论文,会议包括但不限于:ICML.NeurIPS.AAA ...

  8. 【强化学习论文合集】二十九.2021国际机器学习大会论文(ICML2021)

    欢迎订阅本专栏:<强化学习论文合集> 专栏介绍: 本专栏整理了2017~2022年(后面会持续更新)强化学习领域国际顶级会议已录用的论文,会议包括但不限于:ICML.NeurIPS.AAA ...

  9. 【强化学习论文合集】三十五.2021神经信息处理系统大会论文(NIPS2021)

    欢迎订阅本专栏:<强化学习论文合集> 专栏介绍: 本专栏整理了2017~2022年(后面会持续更新)强化学习领域国际顶级会议已录用的论文,会议包括但不限于:ICML.NeurIPS.AAA ...

最新文章

  1. 一个较为详细的ETL系统实现方案
  2. 《开源安全运维平台OSSIM最佳实践》实验环境下载
  3. c#_List<T>(IEnumerable<T>)
  4. networkx中求解平均度_机器学习之统计学二(分位数、平均数)
  5. python学完可以干啥-Python学完可以做什么
  6. 北京重磅发布:杰青、优青放宽女性年龄限制,基金人才评审“同等条件下女性优先”...
  7. java 发送邮件_Jenkins实现自动化邮件发送踩坑记录
  8. 一大波程序员血赚到腰疼...
  9. 以下构成python循环结构的方法中正确的是_python教程:python循环结构
  10. 金蝶K3采购价格管控杂谈
  11. 2014年南京航空航天大学计算机学院推荐研究生公示,2014年南航计算机科学与技术学院考研分数线及复试调剂办法...
  12. 2022年起重机司机(限桥式起重机)复训题库模拟考试平台操作
  13. “五子登科”新解之“票子,房子,车子,妻子,孩子”
  14. 基于NV040D-S8语音芯片在智能水杯/保温杯的方案设计
  15. ffmypeg 视频处理类库使用方法
  16. idea java svn 设置_idea配置svn,随时拉取和上传代码的正确做法
  17. Java基础面试题(2022版)
  18. 【FreeSwitch开发实践】外呼网关配置(拨打电话)
  19. one-stage和two-stage网络的区别
  20. python教程 -- 廖雪峰

热门文章

  1. BZOJ 1123 Luogu P3469 [POI2008]BLO-Blockade 割点+乘法原理
  2. VUE微信H5生成二维码海报保存在本地相册
  3. ZJM 与生日礼物(字典树)
  4. 记录一次服务器被植入挖矿脚本事件
  5. 资深大牛带你了解源码!带你轻松理解Android-Hook机制,已开源
  6. 在vue项目中引用萤石云播放器插件
  7. 阿里云服务器型号大全及机型如何选择(建议收藏)
  8. 各种风格登录页响应式html5模板 Admin后台管理系统模板手机wap登录页html模板html会员登录页面模板源码70多套高大尚响应式网站模板html5网页静态模板Bootstrap扁平化网站源码
  9. 分布式计算、云计算与大数据
  10. IDEA alt + insert快捷键不能使用