文章目录

基于transformer 的翻译系统
- 1. 数据处理
- - 1.1 英文分词
  - 1.2 中文分词
  - 1.3 生成字典
  - 1.4 数据生成器
- 2. 构建模型
- - 2.1 构造建模组件
  - - layer norm层
    - embedding层
    - multihead层
    - feedforward
    - label_smoothing.
  - 2.2 搭建模型
- 3. 训练模型
- - 3.1 参数设定
  - 3.2 模型训练
  - 3.3 模型推断

基于transformer 的翻译系统

论文：https://arxiv.org/abs/1706.03762
项目地址：https://github.com/audier/my_deep_project/tree/master/NLP/4.transformer

本文实现了一个基于自注意力机制的翻译系统。注意力机制是机制是这两年比较火的方向，其中去年提出的自注意力机制更是各位大神的宠儿，网上可读性较高的代码有一点点不完美的地方就是mask没有发挥作用，最近也在做翻译系统，于是整理本文分享思路。
本文代码参考网上可读性较好的项目：https://github.com/Kyubyong/transformer
但是作者在key_mask和queries_mask中有一定的失误，本文修改了对应的模型和multihead层，使该功能正常。

转载请注明出处：https://blog.csdn.net/chinatelecom08

1. 数据处理

本文使用数据：https://github.com/audier/my_deep_project/tree/master/NLP/4.transformer

读取数据
分别保存为inputs，outputs

with open('cmn.txt', 'r', encoding='utf8') as f:data = f.readlines()

http://www.taodudu.cc/news/show-257091.html

语音识别|基于CNN+DFSMN（简化版：标量+无步长因子）的声学模型实现及代码开源（keras）
transformers理论解释
XLNET原理详解
只想安安静静的做个程序员
python写入csv文件的几种方法
Transformers2.0让你三行代码调用语言模型，兼容TF2.0和PyTorch
transforms预训练模型 (模块创始团队网址)
Pytorch-基于Transformer的情感分类
从源码分析DEARGUI之添加字体
add_table和 add_column
add_combo
matplotlib 中将图直接从buffer中变为PIL 再到numpy
魂力真的存在那么该如何提高魂力呢
安装librosa遇到LLVM问题原因是numba问题
为什么有人会觉得灵魂无处安放
今天且明白父母为什么生死度外的让孩子们读书
怎样高级文明的生活
从源码分析DEARGUI之add_drag_float和4
从源码分析DEARGUI之add_color_int和4
从源码分析DEARGUI之add_drawing
从源码分析DEARGUI之add_input_float和4
从源码分析DEARGUI之add_input_text
从源码分析DEARGUI之add_label_text
从源码分析DEARGUI之add_listbox
从源码分析DEARGUI之add_menu
从源码分析DEARGUI之add_menu_items
从源码分析DEARGUI之add_plot和add_line_series
从源码分析DEARGUI之add_progress_bar
从源码分析DEARGUI之add_radio_button
从源码分析DEARGUI之add_plot和add_scatter_series

NLP——基于transformer 的翻译系统相关推荐

基于Transformer的翻译模型（英-＞中）
基于Transformer的翻译模型(英->中) Transformer结构数据格式模型结构 Embedding 位置编码 1.固定编码. 2.动态训练. Position Encoding ...
NLP——8.基于统计的翻译系统
基于统计的机器翻译:mosesdecoder作为比对翻译效果的baseline,如果不如这个的效果,就说明测试系统效果不算好. 首先看看一共需要以下三个模型: 语言模型:用来评估这句话的通畅程度. 1 ...
02-NLP-04基于统计的翻译系统-03-短语翻译表构造——短语抽取
统计翻译模型核心就是基于短语的翻译(短语与短语的对应). 上一讲中词到词的对应就是为了短语对应做铺垫. 一致性短语需要满足三个条件: 条件1:如果"北京房价"对应的英文短语中包含 ...
AAAI'23 | 利用大规模辅助数据提升端到端语音翻译系统
每天给你送来NLP技术干货! 作者 | 张裕浩单位 | 东北大学自然语言处理实验室来自 | 机器翻译学堂 [导读]本文由论文原作者撰写,介绍作者团队设计的一种多阶段的预训练方法,利用有标注和无标注 ...
NLP之基于Transformer的句子翻译
Transformer 文章目录 Transformer 1.理论 1.1 Model Structure 1.2 Multi-Head Attention & Scaled Dot-Prod ...
最新综述：基于Transformer的NLP预训练模型已经发展到何种程度？
©作者 | 机器之心编辑部来源 | 机器之心 Transformer 为自然语言处理领域带来的变革已无需多言.近日,印度国立理工学院.生物医学人工智能创业公司 Nference.ai 的研究者全面调 ...
NLP实操手册: 基于Transformer的深度学习架构的应用指南(综述)
翻译来自百分点认知智能实验室易显维桂安春本文翻译自The NLP Cookbook: Modern Recipes for Transformer based Deep Learning Arc ...
基于Transformer的中英文翻译
基于Transformer的机器翻译机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程. 本项目是机器翻译领域主流模型 Transformer 的 PaddlePad ...
基于Transformer实现英语--＞西班牙语的翻译任务
基于Transformer实现英语–>西班牙语的翻译任务该项目基于PaddlePaddle框架完成,项目直达:基于Transformer实现英语–>西班牙语的翻译任务作者信息: Git ...

NLP——基于transformer 的翻译系统

文章目录

基于transformer 的翻译系统

1. 数据处理

相关文章：

NLP——基于transformer 的翻译系统相关推荐

最新文章

热门文章