文章目录

  • 基于transformer 的翻译系统
    • 1. 数据处理
      • 1.1 英文分词
      • 1.2 中文分词
      • 1.3 生成字典
      • 1.4 数据生成器
    • 2. 构建模型
      • 2.1 构造建模组件
        • layer norm层
        • embedding层
        • multihead层
        • feedforward
        • label_smoothing.
      • 2.2 搭建模型
    • 3. 训练模型
      • 3.1 参数设定
      • 3.2 模型训练
      • 3.3 模型推断

基于transformer 的翻译系统

论文:https://arxiv.org/abs/1706.03762
项目地址:https://github.com/audier/my_deep_project/tree/master/NLP/4.transformer

本文实现了一个基于自注意力机制的翻译系统。注意力机制是机制是这两年比较火的方向,其中去年提出的自注意力机制更是各位大神的宠儿,网上可读性较高的代码有一点点不完美的地方就是mask没有发挥作用,最近也在做翻译系统,于是整理本文分享思路。
本文代码参考网上可读性较好的项目:https://github.com/Kyubyong/transformer
但是作者在key_mask和queries_mask中有一定的失误,本文修改了对应的模型和multihead层,使该功能正常。

转载请注明出处:https://blog.csdn.net/chinatelecom08

1. 数据处理

本文使用数据:https://github.com/audier/my_deep_project/tree/master/NLP/4.transformer

  • 读取数据
  • 分别保存为inputs,outputs
with open('cmn.txt', 'r', encoding='utf8') as f:data = f.readlines()

http://www.taodudu.cc/news/show-257091.html

相关文章:

  • 语音识别|基于CNN+DFSMN(简化版:标量+无步长因子)的声学模型实现及代码开源(keras)
  • transformers理论解释
  • XLNET原理详解
  • 只想安安静静的做个程序员
  • python写入csv文件的几种方法
  • Transformers2.0让你三行代码调用语言模型,兼容TF2.0和PyTorch
  • transforms预训练模型 (模块创始团队网址)
  • Pytorch-基于Transformer的情感分类
  • 从源码分析DEARGUI之添加字体
  • add_table和 add_column
  • add_combo
  • matplotlib 中将图直接从buffer中变为PIL 再到numpy
  • 魂力真的存在那么该如何提高魂力呢
  • 安装librosa遇到LLVM问题原因是numba问题
  • 为什么有人会觉得灵魂无处安放
  • 今天且明白父母为什么生死度外的让孩子们读书
  • 怎样高级文明的生活
  • 从源码分析DEARGUI之add_drag_float和4
  • 从源码分析DEARGUI之add_color_int和4
  • 从源码分析DEARGUI之add_drawing
  • 从源码分析DEARGUI之add_input_float和4
  • 从源码分析DEARGUI之add_input_text
  • 从源码分析DEARGUI之add_label_text
  • 从源码分析DEARGUI之add_listbox
  • 从源码分析DEARGUI之add_menu
  • 从源码分析DEARGUI之add_menu_items
  • 从源码分析DEARGUI之add_plot和add_line_series
  • 从源码分析DEARGUI之add_progress_bar
  • 从源码分析DEARGUI之add_radio_button
  • 从源码分析DEARGUI之add_plot和add_scatter_series

NLP——基于transformer 的翻译系统相关推荐

  1. 基于Transformer的翻译模型(英->中)

    基于Transformer的翻译模型(英->中) Transformer结构 数据格式 模型结构 Embedding 位置编码 1.固定编码. 2.动态训练. Position Encoding ...

  2. NLP——8.基于统计的翻译系统

    基于统计的机器翻译:mosesdecoder作为比对翻译效果的baseline,如果不如这个的效果,就说明测试系统效果不算好. 首先看看一共需要以下三个模型: 语言模型:用来评估这句话的通畅程度. 1 ...

  3. 02-NLP-04基于统计的翻译系统-03-短语翻译表构造——短语抽取

    统计翻译模型核心就是基于短语的翻译(短语与短语的对应). 上一讲中词到词的对应就是为了短语对应做铺垫. 一致性短语需要满足三个条件: 条件1:如果"北京 房价"对应的英文短语中包含 ...

  4. AAAI'23 | 利用大规模辅助数据提升端到端语音翻译系统

    每天给你送来NLP技术干货! 作者 | 张裕浩 单位 | 东北大学自然语言处理实验室 来自 | 机器翻译学堂 [导读]本文由论文原作者撰写,介绍作者团队设计的一种多阶段的预训练方法,利用有标注和无标注 ...

  5. NLP之基于Transformer的句子翻译

    Transformer 文章目录 Transformer 1.理论 1.1 Model Structure 1.2 Multi-Head Attention & Scaled Dot-Prod ...

  6. 最新综述:基于Transformer的NLP预训练模型已经发展到何种程度?

    ©作者 | 机器之心编辑部 来源 | 机器之心 Transformer 为自然语言处理领域带来的变革已无需多言.近日,印度国立理工学院.生物医学人工智能创业公司 Nference.ai 的研究者全面调 ...

  7. NLP实操手册: 基于Transformer的深度学习架构的应用指南(综述)

    翻译来自百分点认知智能实验室 易显维 桂安春 本文翻译自The NLP Cookbook: Modern Recipes for Transformer based Deep Learning Arc ...

  8. 基于Transformer的中英文翻译

    基于Transformer的机器翻译 机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程. 本项目是机器翻译领域主流模型 Transformer 的 PaddlePad ...

  9. 基于Transformer实现英语-->西班牙语的翻译任务

    基于Transformer实现英语–>西班牙语的翻译任务 该项目基于PaddlePaddle框架完成,项目直达:基于Transformer实现英语–>西班牙语的翻译任务 作者信息: Git ...

最新文章

  1. 不能摸鱼的工作不是好工作?
  2. Docker 初级教程
  3. 查询shared_pool主要部分的使用率
  4. 一个情怀引发的生产事故
  5. kotlin 添加第一个 集合_Flutter开发必学Dart语法篇之集合操作符函数与源码分析...
  6. java 读取 excel poi_Java中读取Excel功能实现_POI
  7. React Portals与Error Boundaries
  8. ubuntu16.04 安装Opencv 3.1.0 import cv2 报错ImportError: No module named hdf5
  9. eclipse设置Tomcat超级详细
  10. 发那科机器人override指令_上海发那科(FANUC)机器人有限公司内部教材 -
  11. 特征值、特征向量及相似矩阵
  12. python做情感分析【中、英文都有】
  13. 【BZOJ1645】[Usaco2007 Open]City Horizon 城市地平线 离散化+线段树
  14. 批量替换一个文件中的文件名,例如将文件夹中s**_abnormal.jpg文件修改为s**_abnor.jpg
  15. CLISP 实现记录:5.数据和控制流
  16. 【Web编程实践课第二次作业】体育新闻世界
  17. 使用Nginx搭建直播服务器(nginx-rtmp-module)
  18. 选择笔记本是考虑方便
  19. 教师如何创建百度百科词条?这篇带你了解
  20. 什么是蓝海战略和长尾理论?

热门文章

  1. ajax请求多张图片数据库,ajax上传多文件,一次上传多张图片
  2. docker ubuntu镜像_Docker 入门指南 | Linux 中国
  3. android键盘映射(转)-- good 1,android UI
  4. java tomcat监控_java-jvisualvm远程监控tomcat
  5. 云服务器ecs安装mysql_阿里云服务器ecs配置之安装mysql
  6. 如何阅读微控制器数据手册:探索硬件 ?
  7. 【FPGA】SRIO IP核的三层协议的作用?
  8. centos6.8 安装nginx
  9. Uber开源TensorFlow框架工具箱Ludwig,无需编码即可进行深度学习开发
  10. js中给数组中对象去重