AI_Challenger 机器翻译

官方提供的脚本有不少错误,python脚本从2迁移到了3。 训练脚本中去掉了batch_size项,改用 --worker_gpu_memory_fraction 可以免去内存溢出风险。经尝试,在base、big模式下训练的模型效果很差,只有hparams_set=transformer_base_single_gpu 时,训练的模型效果好。最近在客户提供的单个服务器上用4块v100 32g transformer_big_single_gpu训练6万次时已经比提交结果时用公司的k40结果强多了。自然语言处理,好设备代表好结果。本次比赛,官方的脚本中有错误、许多地方描述不清、定义新问题根本就没有提。初学者shell命令基础比较差时,很难训练出好的模型,也很难生成可以提交的结果。本项目把整个过程脚本化,可以帮助初学者训练出还算不错的模型。才知道,所谓big模式就是生成的模型比较大,需要5个多G。需要注意的是t2t训练的模型最后很难收敛,遇到比较好的模型要及时备份,t2t只留下最新的10个模型。有使用本项目训练出好的汉译英模型的,希望能上传到网盘,给本人一个链接。

git clone https://github.com/dreamnotover/english_chinese_machine_translation_baseline.git

数据  https://pan.baidu.com/s/1teDqwd3Tbc7cbacpzPpa7A

Neural Machine Translation (English-to-

aI_Challenger 机器翻译相关推荐

  1. 机器翻译注意力机制及其PyTorch实现

    前面阐述注意力理论知识,后面简单描述PyTorch利用注意力实现机器翻译 Effective Approaches to Attention-based Neural Machine Translat ...

  2. TVM优化GPU机器翻译

    TVM优化GPU机器翻译 背景 神经机器翻译(NMT)是一种自动化的端到端方法,具有克服传统基于短语的翻译系统中的弱点的潜力.最近,阿里巴巴集团正在为全球电子商务部署NMT服务. 将Transform ...

  3. TensorFlow+TVM优化NMT神经机器翻译

    TensorFlow+TVM优化NMT神经机器翻译 背景 神经机器翻译(NMT)是一种自动化的端到端方法,具有克服传统基于短语的翻译系统中的弱点的潜力.本文为全球电子商务部署NMT服务. 目前,将Tr ...

  4. EMNLP 2019 | 大规模利用单语数据提升神经机器翻译

    BDTC大会官网:https://t.csdnimg.cn/q4TY 作者 | 吴郦军.夏应策 来源 | 微软研究院AI头条(ID:MSRAsia) 编者按:目前,目标语言端的无标注单语数据已被广泛应 ...

  5. 基于RNN的NLP机器翻译深度学习课程 | 附实战代码

    作者 | 小宋是呢 来源 | CSDN博客 深度学习用的有一年多了,最近开始NLP自然处理方面的研发.刚好趁着这个机会写一系列 NLP 机器翻译深度学习实战课程. 本系列课程将从原理讲解与数据处理深入 ...

  6. NLP机器翻译深度学习实战课程基础 | 深度应用

    作者 | 小宋是呢 来源 | CSDN博客 0.前言 深度学习用的有一年多了,最近开始 NLP 自然处理方面的研发.刚好趁着这个机会写一系列 NLP 机器翻译深度学习实战课程. 本系列课程将从原理讲解 ...

  7. Transformer新型神经网络在机器翻译中的应用 | 公开课笔记

    嘉宾 | 于恒 来源 | AI科技大本营在线公开课 编辑 | Jane 于恒:直播间的朋友大家好!欢迎大家来到本次AI科技大本营公开课,我是本次讲师于恒. 在讲课开始之前先简短的做个自我介绍,我是博士 ...

  8. 翻译们又要失业?Facebook最新无监督机器翻译成果,BLEU提升10个点!

    作者 | 琥珀 出品 | AI科技大本营(公众号ID:rgznai100) 神经机器翻译(NMT)关注的是通过 AI 在不同人类语言之间进行翻译的过程.2015 年,蒙特利尔学习算法研究所的研究人员开 ...

  9. 明晚8点直播 | Transformer新型神经网络在机器翻译中的应用

    机器翻译是自然语言处理领域的皇冠明珠,学术界和产业界的研究人员已经致力于机器翻译研究很多年,从最早的基于规则,到基于统计模型,再到基于神经网络,发展速度是高速倍增的. 近几年机器翻译领域不断取得实质性 ...

最新文章

  1. 【Paper】2013_Autonomous Cooperation Between UAV and UGV to Improve Navigation and Environmental
  2. rtmp 时间戳问题
  3. Elasticsearch安装(Linux)
  4. 十年 | 在Java开发做了10年后,才学会此绝招,用于颠覆Java应用
  5. 腾讯基于预训练模型的文本内容理解实践
  6. java程序设计专业介绍_简介Java编程中的Object类
  7. 汉诺塔问题(递归之路)
  8. html按钮美好,崛起中的九大HTML5开发工具
  9. 鼎利测试软件 说明书,鼎利软件使用手册.docx
  10. 程序员996可还好?某公司强制实行997、007,网友:钱给到位了吗?
  11. scratch编程植物大战僵尸教程(一)
  12. 银行圈巨变!中国建设银行无人银行开业!
  13. Windows Server 2008密码破解
  14. 2023第十三届“中兴捧月”全球精英挑战赛今日正式启动
  15. Docker的安装与基本使用(一)---使用Docker的前提条件和三要素
  16. windows下安装配置mycat
  17. 在PlatEMO v2.9中增加多模态多目标算法(1)
  18. 周鸿袆:从程序员创业谈起
  19. C语言:搬砖问题(for循环)
  20. seek是python文件操作方法吗,seek引发的python文件读写的问题

热门文章

  1. 问题:现有12个外形相同的小球,只有其中一个小球质量不同(不能确定较重还是较轻),请用天平找出是哪个小球不同,而且还要找出究竟是轻是重?条件:只能称三次
  2. 地球形状与重力场简述总结
  3. 让人傻傻分不清的TDD、ATDD、BDD
  4. 萧萧雨落情未绝,瑟瑟风起愁又涌
  5. proteus仿真的过程中,经常会不小心把示波器关掉,导致无法查看波形。那么如何调出示波器呢?
  6. 调试MCP2515驱动时遇到的问题 CAN控制器和CAN收发器之间的TX和RX引脚接反,导致无法正常收发数据
  7. 艾默生质量流量计调试
  8. 数字PAM信号功率谱密度推导
  9. 雷电模拟器9如何设置网桥
  10. Android 面试题(有详细答案)