在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。

在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。

点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。

这是 PaperDaily 的第 12 篇文章[ 自然语言处理 ]

Earth Mover’s Distance Minimization for Unsupervised Bilingual Lexicon Induction

@paperhwd 推荐

#Bilingual Word Embeddings

文章想解决的问题是如何使用无监督的方法构建双语词典,传统方法需要利用有监督的种子翻译词对来获得两个语言空间的映射。文章的主要思路是借助 GAN 这个工具。当然我们知道 GAN 存在训练困难的问题,所以文章其实真正实现的是 WGAN。

关于文章的应用和意义,一方面为许多跨语言处理任务提供了重要资源,尤其是为完全缺乏双语资源的小语种和专门领域开辟了与其他语言连接的可能。此外,只使用单语语料就能构建双语词典意味着语言在词汇层面的某种同态性,佐证了人类语言在概念表示上可能存在的一致性。

论文链接

http://www.paperweekly.site/papers/1087

代码链接

http://nlp.csai.tsinghua.edu.cn/~zm/UBiLexEMD/

Ngram2vec: Learning Improved Word Representations from Ngram Co-occurrence Statistics

@paperhwd 推荐

#Word Embeddings

本文主要还是想生成质量更好的词向量,基于经典的 word2vec 的思想,在其之上加入了 ngram 的共现信息,取得了更好的结果。我更加在意的其实是他们提供了不错的工具包,同时在建立共现矩阵的时候采取了优化策略来减少存储开销,加快了计算速度。

论文链接

http://www.paperweekly.site/papers/1086

代码链接

https://github.com/zhezhaoa/ngram2vec/

Improved Neural Machine Translation with a Syntax-Aware Encoder and Decoder

@Andy 推荐

#Neural Machine Translation

文章提出了 bidirectional tree encoder,可以同时学会译出语言的序列表达和树状表达特征。之后,解码器利用这些信息进行解码。 其次,提出了 tree-coverage model,使得注意力机制更有效地利用了译出语言的句法结构。

论文链接

http://www.paperweekly.site/papers/1082

代码链接

https://github.com/howardchenhd/Syntax-awared-NMT/

A Simple Approach to Learn Polysemous Word Embeddings

@haimizhao 推荐

#Word Embeddings

文章在原有的向量表示的基础上,直接对上下文的向量表示作加权和,作为目标词在该上下文的表示,方法极其简单,可以低成本尝试,一系列评估方法也自成一体。

论文链接

http://www.paperweekly.site/papers/1052

代码链接

https://github.com/dingwc/multisense

Neural Paraphrase Generation with Stacked Residual LSTM Networks

@paperweekly 推荐

#Paraphrase Generation

本文是第一篇用 deep learning 来做 paraphrase 生成任务的工作,已开源。

论文链接

http://www.paperweekly.site/papers/1034

代码链接

https://github.com/iamaaditya/neural-paraphrase-generation

Attention-Based Recurrent Neural Network Models for Joint Intent Detection and Slot Filling

@applenob 推荐

#Recurrent Neural Networks

基于 attention 的意图识别 + 槽位填充 RNN 模型。

论文链接

http://www.paperweekly.site/papers/937

代码链接

https://github.com/DSKSD/RNN-for-Joint-NLU

https://github.com/applenob/RNN-for-Joint-NLU

本文由 AI 学术社区 PaperWeekly 精选推荐,社区目前已覆盖自然语言处理、计算机视觉、人工智能、机器学习、数据挖掘和信息检索等研究方向,点击阅读原文」即刻加入社区!

我是彩蛋

 

解锁新姿势:用微信刷论文!

PaperWeekly小程序上线啦

今日arXiv√猜你喜欢√热门资源

随时紧跟最新最热论文

解锁方式

1. 识别下方二维码打开小程序

2. 用PaperWeekly社区账号进行登陆

3. 登陆后即可解锁所有功能

长按识别二维码,使用小程序

*点击阅读原文即可注册

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

开源代码“All in One”:6 份最新「Paper + Code」等你复现 | PaperDaily #12相关推荐

  1. 开源代码上新!6 份最新「Paper + Code」 | PaperDaily #17

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  2. 本周值得读:13 份最新开源「Paper + Code」

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  3. 这 8 份「Paper + Code」,你一定用得上 | PaperDaily #08

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  4. Transformer如何用于视频?最新「视频Transformer」2022综述

    视频Transformer最新综述论文 Transformer模型在建模长范围交互方面取得了巨大的成功.然而,他们的规模与输入长度的平方和缺乏归纳偏差.在处理高维视频时,这些限制可能会进一步加剧.正确 ...

  5. 我发现了个Python黑魔法,执行任意代码都会自动念上一段「平安经」

    来源 | Python编程时光 最近的"平安经"可谓是引起了不小的风波啊. 作为一个正儿八经的程序员,最害怕的就是自己的代码上线出现各种各样的 BUG. 为此,明哥今天分享一个 P ...

  6. 我发现了个 Python 黑魔法,执行任意代码都会自动念上一段「平安经」

    来源 | Python编程时光 最近的"平安经"可谓是引起了不小的风波啊. 作为一个正儿八经的程序员,最害怕的就是自己的代码上线出现各种各样的 BUG. 为此,明哥今天分享一个 P ...

  7. 最新「智能车联网」综述论文,170篇文献全面概述智能车联网(VANETs)技术

    智能化的车联网是网络领域最活跃的研究主题之一,其核心是通过感应器收集信息,利用车联网通信技术将收集的信息集合起来,实现车辆精准定位.智能交叉路口管理.合作式自适应巡航控制.车辆早期安全预警.紧急消息广 ...

  8. 含有脏话的开源代码比不含脏话的代码质量明显要好!

    点击上方"Java基基",选择"设为星标" 做积极的人,而不是积极废人! 每天 14:00 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java ...

  9. 送你6份最新开源代码!含NLP、ML、计算机视觉方向(附代码论文)

    来源:PaperWeekly 本文长度为636字,建议阅读3分钟 本文为你分享6份最新的开源代码,包括自然语言处理.计算机视觉和机器学习3个方面. 自然语言处理  1 DuReader: a Chin ...

最新文章

  1. 【Qt】Qt信号与槽使用不当,使程序崩溃
  2. Tomcat7.0.26的连接数控制bug的问题排查
  3. 每日一皮:我们最要避开的山寨产品...
  4. C语言程序设计 计算个人所得税 浙大版,《C语言及程序设计》实践参考——个人所得税计算器switch语句版...
  5. 【控制】《多智能体系统一致性协同演化控制理论与技术》纪良浩老师-第9章-二阶连续时间时延多智能体系统加权一致性
  6. Anroid-async-http封装网络请求框架源码分析
  7. [PAT乙级]1029 旧键盘
  8. 「拨云见日」英特尔揭秘短视频背后的二三事
  9. 【原创】OllyDBG 入门系列(五)-消息断点及 RUN 跟踪
  10. python爬虫怎么挣钱_python爬虫12 | 爸爸,他使坏,用动态的 Json 数据,我要怎么搞?...
  11. The package lists or status file could not be parsed or opened.
  12. Pocket通证POKT锁仓总价值超2.1947亿美元
  13. 小米全球第二,雷军签发内部嘉奖令;亚马逊被欧盟处以创纪录的8.88亿美元罚款;​PyCharm 2021.2 发布|极客日报...
  14. linux mysql查看数据库编码_MySQL查看和修改字符编码的实现方法
  15. 面向项目(五)—— #pragma
  16. 代码编辑器sublime text 4130 for Mac
  17. HTTP学习(3)--解析报文
  18. 关于excel表格直接引用和间接引用
  19. Gitee+PicGo+Typora图床搭建丨出现 Error: You must be logged in to use 的解决方法
  20. 白平衡算法---色温曲线

热门文章

  1. EntityFramework 学习: Console中初见
  2. [转] OpenStack Kilo 更新日志
  3. 多线程搜索磁盘上的文件
  4. mysql中xml类型_使用 SQLXML 数据类型
  5. android7.1开机监听广播,Android7.1 Audio Debug相关方法
  6. 服务器端使用jsp还是asp_快速了解 ASP.NET Core Blazor
  7. 2 了解MyBatis配置文件
  8. oracle 数据库运维技术,Oracle数据库智能运维标准化工艺研究-orastar-DIY数据库运维工具-第1期 导论篇...
  9. 关于点名的简单python编程_如何用python编写一个简易的随机点名软件
  10. 原字体_在包装上玩转字体