NLP——基于transformer 的翻译系统
文章目录
- 基于transformer 的翻译系统
- 1. 数据处理
- 1.1 英文分词
- 1.2 中文分词
- 1.3 生成字典
- 1.4 数据生成器
- 2. 构建模型
- 2.1 构造建模组件
- layer norm层
- embedding层
- multihead层
- feedforward
- label_smoothing.
- 2.2 搭建模型
- 3. 训练模型
- 3.1 参数设定
- 3.2 模型训练
- 3.3 模型推断
基于transformer 的翻译系统
论文:https://arxiv.org/abs/1706.03762
项目地址:https://github.com/audier/my_deep_project/tree/master/NLP/4.transformer
本文实现了一个基于自注意力机制的翻译系统。注意力机制是机制是这两年比较火的方向,其中去年提出的自注意力机制更是各位大神的宠儿,网上可读性较高的代码有一点点不完美的地方就是mask没有发挥作用,最近也在做翻译系统,于是整理本文分享思路。
本文代码参考网上可读性较好的项目:https://github.com/Kyubyong/transformer
但是作者在key_mask和queries_mask中有一定的失误,本文修改了对应的模型和multihead层,使该功能正常。
转载请注明出处:https://blog.csdn.net/chinatelecom08
1. 数据处理
本文使用数据:https://github.com/audier/my_deep_project/tree/master/NLP/4.transformer
- 读取数据
- 分别保存为inputs,outputs
with open('cmn.txt', 'r', encoding='utf8') as f:data = f.readlines()
相关文章:
- 语音识别|基于CNN+DFSMN(简化版:标量+无步长因子)的声学模型实现及代码开源(keras)
- transformers理论解释
- XLNET原理详解
- 只想安安静静的做个程序员
- python写入csv文件的几种方法
- Transformers2.0让你三行代码调用语言模型,兼容TF2.0和PyTorch
- transforms预训练模型 (模块创始团队网址)
- Pytorch-基于Transformer的情感分类
- 从源码分析DEARGUI之添加字体
- add_table和 add_column
- add_combo
- matplotlib 中将图直接从buffer中变为PIL 再到numpy
- 魂力真的存在那么该如何提高魂力呢
- 安装librosa遇到LLVM问题原因是numba问题
- 为什么有人会觉得灵魂无处安放
- 今天且明白父母为什么生死度外的让孩子们读书
- 怎样高级文明的生活
- 从源码分析DEARGUI之add_drag_float和4
- 从源码分析DEARGUI之add_color_int和4
- 从源码分析DEARGUI之add_drawing
- 从源码分析DEARGUI之add_input_float和4
- 从源码分析DEARGUI之add_input_text
- 从源码分析DEARGUI之add_label_text
- 从源码分析DEARGUI之add_listbox
- 从源码分析DEARGUI之add_menu
- 从源码分析DEARGUI之add_menu_items
- 从源码分析DEARGUI之add_plot和add_line_series
- 从源码分析DEARGUI之add_progress_bar
- 从源码分析DEARGUI之add_radio_button
- 从源码分析DEARGUI之add_plot和add_scatter_series
NLP——基于transformer 的翻译系统相关推荐
- 基于Transformer的翻译模型(英->中)
基于Transformer的翻译模型(英->中) Transformer结构 数据格式 模型结构 Embedding 位置编码 1.固定编码. 2.动态训练. Position Encoding ...
- NLP——8.基于统计的翻译系统
基于统计的机器翻译:mosesdecoder作为比对翻译效果的baseline,如果不如这个的效果,就说明测试系统效果不算好. 首先看看一共需要以下三个模型: 语言模型:用来评估这句话的通畅程度. 1 ...
- 02-NLP-04基于统计的翻译系统-03-短语翻译表构造——短语抽取
统计翻译模型核心就是基于短语的翻译(短语与短语的对应). 上一讲中词到词的对应就是为了短语对应做铺垫. 一致性短语需要满足三个条件: 条件1:如果"北京 房价"对应的英文短语中包含 ...
- AAAI'23 | 利用大规模辅助数据提升端到端语音翻译系统
每天给你送来NLP技术干货! 作者 | 张裕浩 单位 | 东北大学自然语言处理实验室 来自 | 机器翻译学堂 [导读]本文由论文原作者撰写,介绍作者团队设计的一种多阶段的预训练方法,利用有标注和无标注 ...
- NLP之基于Transformer的句子翻译
Transformer 文章目录 Transformer 1.理论 1.1 Model Structure 1.2 Multi-Head Attention & Scaled Dot-Prod ...
- 最新综述:基于Transformer的NLP预训练模型已经发展到何种程度?
©作者 | 机器之心编辑部 来源 | 机器之心 Transformer 为自然语言处理领域带来的变革已无需多言.近日,印度国立理工学院.生物医学人工智能创业公司 Nference.ai 的研究者全面调 ...
- NLP实操手册: 基于Transformer的深度学习架构的应用指南(综述)
翻译来自百分点认知智能实验室 易显维 桂安春 本文翻译自The NLP Cookbook: Modern Recipes for Transformer based Deep Learning Arc ...
- 基于Transformer的中英文翻译
基于Transformer的机器翻译 机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程. 本项目是机器翻译领域主流模型 Transformer 的 PaddlePad ...
- 基于Transformer实现英语-->西班牙语的翻译任务
基于Transformer实现英语–>西班牙语的翻译任务 该项目基于PaddlePaddle框架完成,项目直达:基于Transformer实现英语–>西班牙语的翻译任务 作者信息: Git ...
最新文章
- 不能摸鱼的工作不是好工作?
- Docker 初级教程
- 查询shared_pool主要部分的使用率
- 一个情怀引发的生产事故
- kotlin 添加第一个 集合_Flutter开发必学Dart语法篇之集合操作符函数与源码分析...
- java 读取 excel poi_Java中读取Excel功能实现_POI
- React Portals与Error Boundaries
- ubuntu16.04 安装Opencv 3.1.0 import cv2 报错ImportError: No module named hdf5
- eclipse设置Tomcat超级详细
- 发那科机器人override指令_上海发那科(FANUC)机器人有限公司内部教材 -
- 特征值、特征向量及相似矩阵
- python做情感分析【中、英文都有】
- 【BZOJ1645】[Usaco2007 Open]City Horizon 城市地平线 离散化+线段树
- 批量替换一个文件中的文件名,例如将文件夹中s**_abnormal.jpg文件修改为s**_abnor.jpg
- CLISP 实现记录:5.数据和控制流
- 【Web编程实践课第二次作业】体育新闻世界
- 使用Nginx搭建直播服务器(nginx-rtmp-module)
- 选择笔记本是考虑方便
- 教师如何创建百度百科词条?这篇带你了解
- 什么是蓝海战略和长尾理论?
热门文章
- ajax请求多张图片数据库,ajax上传多文件,一次上传多张图片
- docker ubuntu镜像_Docker 入门指南 | Linux 中国
- android键盘映射(转)-- good 1,android UI
- java tomcat监控_java-jvisualvm远程监控tomcat
- 云服务器ecs安装mysql_阿里云服务器ecs配置之安装mysql
- 如何阅读微控制器数据手册:探索硬件 ?
- 【FPGA】SRIO IP核的三层协议的作用?
- centos6.8 安装nginx
- Uber开源TensorFlow框架工具箱Ludwig,无需编码即可进行深度学习开发
- js中给数组中对象去重