开源 | IBM、哈佛共同研发：Seq2Seq模型可视化工具

作者 | Ben Dickson

译者 | 刘旭坤

编辑 | Jane

出品 | AI科技大本营

近年来随着深度学习和神经网络技术的发展，机器翻译也取得了长足的进步。神经网络结构越来越复杂，但我们始终无法解释内部发生了什么，“黑箱问题”一直困扰着我们。我们不清楚程序在翻译过程中如何进行决策，所以当翻译出错时也很难改正。随着深度学习在各行各业中的广泛应用，深度学习的不可解释性已经成为其面临的严峻挑战之一。

今年，在德国柏林举办的 IEEE VAST 可视化分析大会上，来自 IBM 和哈佛大学的研究人员展示了为解决翻译中的 AI 黑盒问题所开发的调试工具。这款名为 Seq2Seq-Vis 的工具能将人工智能的翻译过程进行可视化，方便开发人员对模型进行调试。

Seq2Seq-Vis 主要针对机器翻译中最常用的 Seq2Seq 模型。这一模型能够将任意长度的序列，也就是原文的句子，映射到目标语言。除了机器翻译任务，在自动问答、文本摘要等任务中也都主要应用 Seq2Seq 模型。

简单来说，Seq2Seq 模型在机器翻译中的工作原理就是把源语言映射到目标语言，得到了目标语言的序列（也就是初步翻译完的句子）后再进行优化，保证语法和语义上的正确。虽然使用神经网路模型后，机器翻译的结果得到了很大的提升，但同时也非常复杂。

可视化机器翻译的过程

研究人员称研发 Seq2Seq-Vis 的初衷是想有一个类似于基于规则的传统翻译软件中的规则表，这样开发人员可以通过在规则表中对照得到错误信息就可以很简单地修改模型。

Seq2Seq-Vis.io 网站上给出了一个从德语到英语的演示程序。德语的“die längsten reisen fangen an , wenn es auf den straßen dunkel wird.”翻译成英语应该是“The longest journeys begin when it gets dark in the streets.”，但被机器翻译成了“the longest travel begins when it gets to the streets.”Seq2Seq-Vis 以可视化的方式呈现出了序列到序列模型翻译的每一步，这样用户就能像查找规则表一样来找出机器翻译翻译错误的原因。

Seq2Seq-Vis 另一个很有用的功能是它能找出与某个字词相关的训练集，这也是解决 AI 黑盒问题的一大难点。其实一个机器学习模型除了训练集一无所知，所以要解决机器翻译中的错误最终都要回到训练集中去。

将机器翻译过程可视化，用户就能确定翻译出错到底是编码器解码器使用的训练样本出了错还是注意力模型的设置或者其他环节出错了。

更正序列到序列模型

Seq2Seq-Vis 并不是第一个试图解决 AI 黑盒问题的工具，之前有很多大公司和研究机构都有进行尝试，甚至 IBM 自己也在这上面下过功夫。事实上，很多类似的工具需要的信息比 Seq2Seq-Vis 更少，比如有的工具只需要神经网络的输出就可以，而 Seq2Seq-Vis 还需要训练集，整个模型的架构和设置。但 Seq2Seq-Vis 却是第一个既能可视化模型的决策过程也能让开发人员直接修改模型的工具。开发人员可以通过可视化的方式对模型的决策过程进行修改并观察反馈来实现探索式的调试，比如修改输出序列的单词或者对注意力模型的配置进行修改。

听起来是不是很酷，不过 Seq2Seq-Vis 的目标群体是模型架构师或工程师而非机器翻译的终端用户。因为要让这一工具真正发挥作用需要用户对“序列到序列”模型有较为深入的了解。虽然目标这一工具还只是应用在IBM的内部项目中，但它是开源的，所以大家都可以来试试。

项目地址：http://seq2seq-vis.io
Github地址：https://github.com/HendrikStrobelt/Seq2Seq-Vis
原文地址: https://venturebeat.com/2018/11/01/ibm-harvard-develop-tool-to-tackle-black-box-problem-in-ai-translation/

本文由AI科技大本营翻译，转载请联系微信1092722531

2018 中国大数据技术大会

◆

BDTC 2018

◆

BDTC 2018中国大数据技术大会携主题“大数据新应用”再度强势来袭。本次大会由华东师范大学副校长、教授周傲英，百度商业智能实验室主任熊辉，阿里巴巴副总裁李飞飞三位会议主席对大会内容把关，多位两院院士参与指导，由最了解行业痛点的一线从业者为同行打造。

八折优惠仅最后一天，扫描二维码一键抢票，预定属于你的超强干货。点击「阅读原文」查看大会详情。

推荐阅读

程序员的江湖务必掌握这些黑话！

高达800万次下载量的npm包被黑客篡改了代码，你的设备或正成为挖矿机

开源 | IBM、哈佛共同研发：Seq2Seq模型可视化工具相关推荐

谷歌开源NLP模型可视化工具LIT，模型训练不再「黑箱」
视学算法报道编辑:陈萍.魔王转载自公众号:机器之心深度学习模型的训练就像是「黑箱操作」,知道输入是什么.输出是什么,但中间过程就像个黑匣子,这使得研究人员可能花费大量时间找出模型运行不正常的原因 ...
顶级分布式开源项目，配上这款可视化工具，真香！
ZooKeeper作为顶级分布式开源项目,应用非常广泛,Dubbo和Kafka这些知名的开源项目都在使用.之前只是听说过它,并没有仔细研究过.今天带大家来学习下ZooKeeper,主要从ZooKeep ...
模型可视化工具Netron手把手教学
文章目录模型网络结构可视化之 netron 工具总结网页版ONNX模型可视化测试操作如下 yolov5-s 可视化效果如下 yolov4-tiny.cfg.txt + yolov4-tiny.w ...
【netron】模型可视化工具netron
1.简介在实际的项目中,经常会遇到各种网络模型,需要我们快速去了解网络结构.如果单纯的去看模型文件,脑海中很难直观的浮现网络的架构.这时,就可以使用netron可视化工具,可以清晰的看到每一层的输入 ...
【Tools】神经网络、深度学习和机器学习模型可视化工具——Netron
背景有时候我们写完深度学习模型后,想看看代码实现的模型和我们预期是否一致,但是没有一个好的工具.最近发现有一个软件Netron支持对一部分深度学习模型可视化,源码地址.Netron 支持 ONNX. ...
模型可视化工具netron
目录 netron: 使用方法 yolov5中的使用 .pt模型模型转换 netron: 详情可见官方github:https://github.com/lutzroeder/netron 使用方法 ...
模型可视化工具-netron网页版
Netron
PyTorch-模型可视化工具TorchSummary
简介不同于TensorboardX对Tensorboard的支持以方便了PyTorch的训练可视化,PyTorch并没有很好的模型可视化工具,TorchSummary对此做出了补足,极大降低了模型可 ...
揭秘数据可视化工具的研究现状
人们获取信息的途径十分有限,我们从外界获得的信息有80%以上来自视觉系统.当数据通过可视化工具以可视化图表的形式呈现时,人们可以更加简洁明了的识别图形特点并将其转换为指定的信息.不得不说数据可视化工具 ...

开源 | IBM、哈佛共同研发：Seq2Seq模型可视化工具

开源 | IBM、哈佛共同研发：Seq2Seq模型可视化工具相关推荐

最新文章

热门文章