选自OpenNMT机器之心编译参与:吴攀

神经机器翻译是近段时间以来推动机器翻译发展的主要推动力。今天,哈佛大学自然语言处理研究组(Harvard NLP)宣布开源了其研发的神经机器翻译系统 OpenNMT,该系统使用了 Torch 数学工具包。该研究组在官网上表示该系统已经达到生产可用的水平(industrial-strength)。

官网:http://opennmt.net代码:https://github.com/opennmt/opennmt演示:https://demo-pnmt.systran.netDocker 容器:https://hub.docker.com/r/harvardnlp/opennmt

OpenNMT 可以像主要的翻译服务提供商的已投入生产的系统那样使用。该系统简单易用,易于扩展,同时也能维持效率和当前最佳的翻译准确度。

其特性包括:

简单的通用型接口,仅需要源文件和目标文件;为高性能 GPU 训练进行了速度和内存优化;可以提升翻译性能的最新研究的特性;有多个语言对的预训练好的模型(即将到来);允许其它序列生成任务的扩展,比如归纳总结和图像到文本生成。

安装

OpenNMT 仅需要一次 vanilla torch/cutorch 安装。它要使用 nn、nngraph 和 cunn。有(CUDA)Docker 容器可选。

快速启动

OpenNMT 包含三条指令:

1)预处理数据

th preprocess.lua -train_src data/src-train.txt -train_tgt data/tgt-train.txt -valid_src data/src-val.txt -valid_tgt data/tgt-val.txt -save_data data/demo

2)训练模型

th train.lua -data data/demo-train.t7 -save_model model

3)翻译句子

th translate.lua -model model_final.t7 -src data/src-test.txt -output pred.txt

查看指南了解更多:http://opennmt.github.io/Guide

研究

其中主要的模型基于论文 Neural Machine Translation by Jointly Learning to Align and Translate Bahdanau et al. ICLR 2015 和 Effective Approaches to Attention-based Neural Machine Translation, Luong et al. EMNLP 2015。

在基本模型上,还有大量可选项,这都要感谢 SYSTRAN(http://www.systransoft.com/)的出色工作。特别地,下面是一些实现的功能:

Effective Approaches to Attention-based Neural Machine Translation . Luong et al., EMNLP 2015.Character-based Neural Machine Translation. Costa-Jussa and Fonollosa, ACL 2016.Compression of Neural Machine Translation Models via Pruning . See et al., COLING 2016.Sequence-Level Knowledge Distillation . Kim and Rush., EMNLP 2016.Deep Recurrent Models with Fast Forward Connections for Neural Machine Translation . Zhou et al, TACL 2016.Guided Alignment Training for Topic-Aware Neural Machine Translation . Chen et al., arXiv:1607.01628.Linguistic Input Features Improve Neural Machine Translation . Senrich et al., arXiv:1606.02892

声明

OpenNMT 的实现使用了以下项目的代码:

Andrej Karpathy 的 char-rnn:https://github.com/karpathy/char-rnnWojciech Zaremba 的 LSTM:https://github.com/wojzaremba/lstmElement RNN 库:https://github.com/Element-Research/rnn

证书

MIT

举报/反馈

android 内存检测开源库 翻译,开源 | 哈佛大学NLP组开源神经机器翻译工具包OpenNMT:已达到生产可用水平...相关推荐

  1. 哈佛大学 NLP 组开源神经机器翻译系统 OpenNMT

    今天,Harvard NLP (哈佛大学自然语言处理研究组) 宣布开源其研发的神经机器翻译系统 OpenNMT,该系统使用了 Torch 数学工具包,已达 industrial-strength 可生 ...

  2. Android内存检测工具系列工具集

    Android内存检测工具系列工具集 Android关于内存的工具不少,灵活地选择工具就显得特别重要.在此特别推荐分享涵盖一定初步和定位能力的工具,可以让我们一步到位地分析问题,提升效率. 在此列举几 ...

  3. java开源库生成折线图_Android HelloChart开源库图表之折线图的实例代码

    前面我们介绍了开源图表库MPAndroidChart,请参考: 我们今天介绍的将是一个更为优秀的图表库,比MPAndroidChart性能更好,功能更完善,UI风格更美观,坐标轴更精细. 支持缩放.滑 ...

  4. 安卓流行布局开源库_如何使用流行度在开源库之间进行选择

    安卓流行布局开源库 by Ashish Singal 通过Ashish Singal 如何使用流行度在开源库之间进行选择 (How to choose between open source libr ...

  5. android内存检测方法,Android_Android系统检测程序内存占用各种方法,1.检查系统总内存 复制代码 - phpStudy...

    Android系统检测程序内存占用各种方法 1.检查系统总内存 liuhx@uc ~ $ adb shell cat /proc/meminfo MemTotal:         840868 kB ...

  6. Android 内存检测工具

    所谓内存泄漏,是指本该被回收的内存由于某种原因绕开了GC回收算法,从而导致该内存无法被有效数据使用而使得总内存减小的情况. 内存泄漏会导致内存消耗的增加,大量的消耗会使得APP OOM,特别是在一些内 ...

  7. android 内存检测框架,Android项目内存泄漏检测

    关于Android项目的内存泄漏是一个老生常谈的问题,之前一直是在写代码时各种注意,比如IO流要及时关闭,引用的curcor要及时关闭等,这样做确实能规避一部分的内存泄漏,不过还是会有漏网之鱼,因此除 ...

  8. Android内存检测工具

    什么是内存泄漏? 在运行的程序中,如果一个无法访问的对象仍然占用着内存空间,即为此对象造成了内存泄漏 垃圾回收(GC)机制: 当垃圾回收运行时,虚拟机首先会识别GC Root.GC Root 是一个可 ...

  9. 【Android RTMP】Android Studio 集成 x264 开源库 ( Ubuntu 交叉编译 | Android Studio 导入函数库 )

    文章目录 安卓直播推流专栏博客总结 一. x264 简介 二. x264 交叉编译 三. Android Studio 导入函数库 四. 交叉编译版本 五. GitHub 项目地址 安卓直播推流专栏博 ...

最新文章

  1. oracle顺序读发散读,Oracle 拼音排序
  2. Oracle 中 decode 函数用法
  3. Java生产环境下性能监控与调优详解 第5章 Tomcat性能监控与调优
  4. Onboard,迷人的引导页样式制作库
  5. 搜狗营收创新高,股价却跌7%,对话王·玄奘·小川
  6. java 最佳主键_最佳Java 8书籍
  7. eplan单线原理图多线原理图_EPLAN-文本
  8. Java分页之后再进行排序
  9. python代码图片头像_Python爬取堆糖网优美古风头像(附源码)
  10. 微信SVG使用指南 01
  11. Android检测手机是否安装app
  12. 群体智能的未来趋势:网络安全领域、网络安全相关领域及其拓展
  13. php读取pdf文件乱码_PHP读取文件,解决中文乱码UTF-8的方法分析
  14. Spring Cloud Alibaba——Nacos服务配置中心
  15. 2020/11/05随记 基于jini的C++和Java交互
  16. Android访问网络资源
  17. 基于深度强化学习的组合优化方法在工业应用中的实践
  18. 傅里叶实现高精度乘法
  19. Day 04-常用Composition API_ref reactive 函数
  20. vmware安装linux后没有声音,安装虚拟机后没声音了

热门文章

  1. 让IIS7.0.0.0支持 .iso .7z .torrent .apk等文件下载的设置方法
  2. 带你秒学JavaScript
  3. 在SQLite数据库中获取新插入数据自增长的ID值
  4. 《一个程序员的奋斗史》帮我选封面哇! —— 猜封面页数赢赠书活动~
  5. [翻译]SQL Server 该做和不该做的
  6. fatal: 无法访问 ‘x.git/‘gnutls_handshake() failed: The TLS connection was non-properly terminated.解决办法
  7. MyBatis学习笔记(一):MAVEN的下载,安装与环境配置和在IDEA中配置maven
  8. Android9.0 setMasterVolume流程分析(二十三)
  9. android audio混音
  10. 为什么学习Markdown