《a simple but tough-to-beat baseline for sentence embeddings》published at ICLR 2017.

ICLR会议的论文总是创意层出不穷,相信将来该会议的地位越来越受人们尊重。

本文提出了一个简单但是完胜现在已有的很多方法的sentence embedding方法。作者称之为WR方法,W stands for weighted average, R stands for removing some special direction which is derived from a generative model of texts. 简单地说,模型的输入是一个已有的word embedding,基于该 word embedding 和 sentence s, 通过加权求平均的方法求得sentence s的embedding,然后使用主成分分析去掉一些special direction.

sentence embedding 是由c_s的MLE计算得到的,c_s用作者的说法是,"represents what is being talked about", 个人理解是包含一定语义的向量,用于表示这个句子的主旨。为了更好地模拟句子的语义,作者设计两个"smoothing term",如下图:

Section 3.1合理性讨论:

证明了使用了sub-sampling的word2vec模型,其实是在w的向量更新的方向(梯度)加上了一个权重,实验证明word2vec的权重(w = sigma(q*v))和本文模型中的权重(w = a/(a+p(w)))是相似的。(但是一个是sentence embedding,一个是word embedding,可以直接比较吗? word embedding 是前面n-1个词的embedding结果的加权平均,句子是由词组成的,所以可以类似地比较,大概是这样)

关于word2vec,详细可看https://www.cnblogs.com/peghoty/p/3857839.html(非常有用)

原文代码:https://github.com/PrincetonML/SIF

论文阅读笔记——《a simple but tough-to-beat baseline for sentence embeddings》相关推荐

  1. 《Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs》论文阅读笔记

    <Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs>论文阅读笔记 主要挑战贡献: KG上的推理挑战主要 ...

  2. 论文阅读 | NIPS‘20 | Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs

    很有意思的一篇paper.在众多Knowledge Graph Embedding (KGE) 的论文中通过问题设计和有意思的解决方式脱颖而出. 首先来看看问题设计. 一般的KGE model都是利用 ...

  3. Beta Distribution Guided Aspect-aware Graph for Aspect Category Sentiment Analysis论文阅读笔记(EMNLP2021)

    目录 标题翻译:基于Beta分布引导方面感知图的方面类别情感分析 原文链接:https://aclanthology.org/2021.emnlp-main.19.pdf 摘要: 1 引言 2 相关工 ...

  4. Phrase-BERT: Improved Phrase Embeddings from BERT with an Application to Corpus Exploration论文阅读笔记

    问题: 因为bert是在长文本(512token长度)预训练的,因此,如果没有特定于任务的微调,BERT在短语和句子上的表现通常比简单基线(如GLoVe的平均池化)更差.且字节2020在EMNLP上的 ...

  5. DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记

    DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记 Article Background ...

  6. [论文阅读笔记] Are Meta-Paths Necessary, Revisiting Heterogeneous Graph Embeddings

    [论文阅读笔记] Are Meta-Paths Necessary? Revisiting Heterogeneous Graph Embeddings 购物返利 www.cpa5.cn 本文结构 解 ...

  7. 论文阅读笔记—Reasoning on Knowledge Graphs with Debate Dynamics(AAAI,2020)

    这是一篇非常有趣的工作,看完会觉得眼前一亮. 论文标题:Reasoning on Knowledge Graphs with Debate Dynamics 发表于AAAI,2020 动机  很多机器 ...

  8. Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction论文阅读笔记

    我的博客链接 0. 前言 1. 作者试图解决什么问题? 作者想在KGE中对语义层级(semantic hierarchies)进行建模. 2. 这篇论文的关键元素是什么? semantic hiera ...

  9. 斯坦福图机器学习CS224W笔记自用: Reasoning in Knowledge Graphs using Embeddings

    1. 基于嵌入的知识图推理 目标:如何对知识图进行多跳推理? 知识图推理: 回答多跳查询 路径查询 连接查询 Query2box 示例:生物医学图 知识图谱上的预测查询 我们是否可以进行多跳推理,即在 ...

最新文章

  1. Jackson解析JavaBean空值不显示问题
  2. 算法提高 c++_ch04_02_修正版
  3. Android Gson使用详解
  4. POPUP_TO_DECIDE_WITH_MESSAGE
  5. java线程删除文件,线程“main”java.io.jgitinernalexception中的异常:无法删除临时文件c:\users\13 dec...
  6. 开发每个静态网站是的模版代码(自己开发是长期优化过的觉得最简的代码)
  7. Java代码质量监控工具Sonar安装
  8. 最全三大框架整合(使用映射)——DeptServiceImpl.java
  9. html4符合web的标准吗,在生成HTML,表格等时,CakePhp是否“符合标准”?
  10. linux redis 监控工具,Redis服务器监控工具redis-live
  11. mysql 文章内容_假设mysql数据库里面有个字段存的是文章内容,用什么方式查询出所有文章中包含某个特定词语的数据。...
  12. 在xcode 项目 中针对 单个文件关闭或者打开ARC 开关
  13. 随想录(libc.so和ld.so调试)
  14. 如何使用 DNSMAQ 搭建 DNS 服务器?
  15. UWP 实现分享功能
  16. 计算机怎么禁止远程桌面,win7怎样禁用远程桌面共享_win7系统禁用远程桌面共享的步骤-系统城...
  17. Creative cloud登录不上、打不开、一直在加载,可能是移动宽带的问题
  18. 湖北省襄阳市谷歌高清卫星地图下载
  19. 频繁默认网关不可用_电脑经常掉线提示默认网关不可用原因分析和解决办法
  20. 字节序——Big Endian和Little Endian

热门文章

  1. C++ STL 是什么
  2. 【备战十四届蓝桥杯 | 开篇】如何高效备战蓝桥杯
  3. js 正则替换隐藏部分身份证或手机号以及隐藏部分名字
  4. 微信小程序调用百度文字转语音API
  5. IDL基础学习资料+监督分类
  6. 【UVA】 133 --- The Dole Queue
  7. Git 原理安装和命令解析
  8. lemur代码分析之入口设计
  9. 36套模具3D+2D原图+结构图
  10. 道教圣地青城山有一副名联:事在人为……