目录

介绍

翻译多种语言

下一步


  • 下载源文件 - 3.5 KB

介绍

谷歌翻译工作得如此之好,它通常看起来很神奇。但这不是魔法——这是深度学习!

在本系列文章中,我们将向您展示如何使用深度学习来创建自动翻译系统。本系列可被视为分步教程,可帮助您理解和构建神经元机器翻译。

本系列假设您熟悉机器学习的概念:模型训练、监督学习、神经网络以及人工神经元、层和反向传播。

我们在上一篇文章中取得的成果很好,即使它还没有完全准备好取代谷歌翻译。在本文中,我们将在其他语言上训练和测试我们的翻译模型。

翻译多种语言

我们在这里创建的函数将使用我们开发的模型支持从一种语言到另一种语言的自动翻译。

欢迎您将代码下载为Google Colab文件。

我们的应用程序将能够从制表符分隔的平行语料库中创建模型,例如来自Tatoeba项目的语料库。

查看我们的代码,您会看到我们已将训练模型所需的所有内容分组到一个train_model函数中,以及一个translate函数,该函数接收一个包含模型输入语言文本的文件并将其翻译成模型的输出语。

让我们用一个包含一些我们希望翻译的英文文本的文件来运行我们的工具——f test.txt,其中包含:

this is a test
hello
can you give me the bill please
where is the main street
translate("rus.txt","test.txt","model12")

我们得到以下输出:

 input                             model translation
0 this is a test                    это тест
1 hello                             привет
2 can you give me the bill please   не можете мне  пожалуйста
3 where is the main street          где здесь улице

结果是正确的,除了第三行。

现在让我们训练然后使用法语翻译器:

train_model("fra.txt","model_fr")
translate("fra.txt","test.txt","model_fr")
  input                             model translation
0 this is a test                    c'est un d'un
1 hello
2 can you give me the bill please   tu me donner la  s'il te prie
3 where is the main street          où est la rue est rue

结果很糟糕。只有第四句话被翻译得比较容易理解。原因是法语的复杂性,以及与俄语数据集相比,训练数据集相对较小的事实。

这是从英语到德语的自动翻译结果:

  input                             model translation
0 this is a test                    das ist eine test
1 hello
2 can you give me the bill please   könntest sie mir die rechnung geben
3 where is the main street          wo ist die straße

这几乎是100%完美的。

最后,让我们看看同样的方法将英语翻译成荷兰语的效果如何:

  input                            model translation
0 this is a test                   dit is een nationale
1 hello                            hallo
2 can you give me the bill please  kunt je me  instapkaart geven
3 where is the main street         waar is de bushalt

不完美“主街在哪儿”翻译成“公交车站在哪里?”,“can you give me bill please”翻译成“can you give me the boarding pass”。

如您所见,根据语言和训练数据集的大小,我们得到了非常不同的结果。

下一步

正如我们所见,我们能够构建一个非常好的机器翻译系统,而无需编写数千行代码或在GPU上花费数千美元来训练或建模。当然,与大多数深度学习任务一样,您的训练数据集越大(并且您可以花更多时间训练它),您的翻译模型就越准确。

有很多方法可以为机器翻译构建ML系统。我们只是探索了其中之一。或者,您可以使用卷积神经网络(CNN)代替RNN,或使用Moses之类的软件;将统计机器翻译与深度学习模型相结合。

既然您已经看到了AI语言翻译的实际应用,您可能想尝试使用Transformers进行AI翻译。Transformer是一种完全基于注意力的自然语言处理任务的最先进方法。它们根本不像我们创建的模型那样使用序列。尽管Transformer是新的,并且不像基于序列的AI翻译那样得到大量研究的支持,但看起来Transformer将成为许多自然语言处理任务的未来。

https://www.codeproject.com/Articles/5299750/AI-Language-Translation-With-Multiple-Languages

(六)多语言人工智能语言翻译相关推荐

  1. android+siri人工智能语言软件,苹果系统新增翻译功能,网友惊呼人工智能太强大...

    IOS14系统的更新中有一项非常令人惊喜的功能,那就是苹果自带的系统翻译应用. 这个全新的苹果翻译APP可以支出一共十一种语言的互相翻译,在此次更新之前,苹果用户如果想要翻译某个句子单词,需要单独下载 ...

  2. 人工智能语言python实验报告_【报名】人工智能语言Python启蒙课程(五六年级)...

    原标题:[报名]人工智能语言Python启蒙课程(五六年级) 7月,图书馆为中低年级的小朋友准备了两期8节课的少儿编程启蒙课程.8月,我们将为小学高年级的学生朋友献上一期人工智能语言Python启蒙公 ...

  3. Wix 安装部署教程(十六) -- 自动生成多语言文件

    Wix 安装部署教程(十六) -- 自动生成多语言文件 原文:Wix 安装部署教程(十六) -- 自动生成多语言文件 因为持续集成需要,所有项目编译完之后生成一个多语言的安装包.之前生成mst文件都是 ...

  4. Atitit.5gl 第五代语言编程语言 PROLOG教程  人工智能语言的标准 与实现

    Atitit.5gl 第五代语言编程语言 PROLOG教程  人工智能语言的标准 与实现 1. 第五代语言就是自然语言又被称为知识库语言或人工智能语言,1 2. 人工智能语言特点2 2.1. 试探法2 ...

  5. 关于c语言的英文论文,C语言论文外文翻译.doc

    C语言论文外文翻译C语言论文外文翻译 ASP.NET Technique 1. Building ASP.NET Pages ASP.NET and the .NET Framework ASP.NE ...

  6. Go语言使用百度翻译api

    Go语言使用百度翻译api 之前做过一个使用百度翻译api的工具,这个工具用于用户的自动翻译功能,是使用C#调用百度翻译api接口,既然在学习Go语言,那必然也是要使用Go来玩耍一番.这里我是这么安排 ...

  7. TIOBE 8 月编程语言排行榜:数据挖掘和人工智能语言强势崛起!

    整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 今天,TIOBE 官方最新发布了 8 月的编程语言榜单,一起来看本月榜单中有什么值得关注的发展趋势吧? (图片来自视觉中国) 数据挖掘和 ...

  8. 人工智能语言--PROLOG

    人工智能语言--PROLOG [ 作者:张家华    转贴自:本站原创    点击数:6710    更新时间:2004-6-6    文章录入:admin ]       一.什么是人工智能语言 人 ...

  9. 毕业论文知识点记录(六)——基于R语言优化maxent模型

    毕业论文知识点记录(六)--基于R语言优化maxent模型 第一步:R安装 这个网上都有很多详细的步骤,就不再详细介绍了. 第二步:R安装包 因为优化maxent模型需要用到kuenm程序包,但是官网 ...

最新文章

  1. jdk安装和环境变量的配置
  2. 这家工作室花三年把塞尔达做进RogueLike里面
  3. mac下使用n管理node版本
  4. pae扩展内存 linux,浅析linux内核内存管理之PAE
  5. 微课|中学生可以这样学Python(例11.3):tkinter通信录管理系统2
  6. latex放一张大图在作者和正文之间
  7. Java sychronized关键字总结(二)
  8. 集合之Collection接口AND Iterator迭代器 AND 增强for AND 泛型
  9. 最新HyperSnap绿色汉化版
  10. LimeSDR官方系列教程(五):SDR的软件
  11. PhotoShop 之钢笔工具
  12. halcon自动对焦
  13. 【转】中国只有俩导演,一个叫贾樟柯,一个叫姜文
  14. Jxl解析Excel表格数据
  15. 效率倍增,5 个提高生产力的 Jupyter notebook插件
  16. JavaScript 的常量和变量
  17. spark开发及调优
  18. 使用Dism++备份系统文件并恢复
  19. C语言中结构体直接赋值
  20. Go实现的一站式云原生机器学习平台 | Gopher Daily (2020.12.08) ʕ◔ϖ◔ʔ

热门文章

  1. mysql view 子查询_mysql – View的SELECT包含FROM子句中的子查询
  2. c语言链表版百度云,链表详解(C语言版)
  3. 用字典存储学生成绩查询_C语言 | 用结构体变量存储学生信息
  4. oracle用户的追踪文件,Oracle中怎样通过触发器来追踪用户的活动?
  5. PSD分层电商促销模板|季末大促上演
  6. python1234出栈_Python数据结构与算法3——栈和队列
  7. r 语言 ggplot上添加平均值_R语言中ggplot2包作数据分布情况下的统计图实例学习(一)
  8. 什么是最大传输单元(MTU)?什么又是最大分段大小(MSS)以及如何计算?
  9. 如何创建一个最小的串口、TTY设备包括虚拟控制台,串口以及伪终端设备的驱动程序
  10. VTI介质Thomsen参数关于入射角的敏感性曲线