开源 | IBM、哈佛共同研发:Seq2Seq模型可视化工具
作者 | Ben Dickson
译者 | 刘旭坤
编辑 | Jane
出品 | AI科技大本营
近年来随着深度学习和神经网络技术的发展,机器翻译也取得了长足的进步。神经网络结构越来越复杂,但我们始终无法解释内部发生了什么,“黑箱问题”一直困扰着我们。我们不清楚程序在翻译过程中如何进行决策,所以当翻译出错时也很难改正。随着深度学习在各行各业中的广泛应用,深度学习的不可解释性已经成为其面临的严峻挑战之一。
今年,在德国柏林举办的 IEEE VAST 可视化分析大会上,来自 IBM 和哈佛大学的研究人员展示了为解决翻译中的 AI 黑盒问题所开发的调试工具。这款名为 Seq2Seq-Vis 的工具能将人工智能的翻译过程进行可视化,方便开发人员对模型进行调试。
Seq2Seq-Vis 主要针对机器翻译中最常用的 Seq2Seq 模型。这一模型能够将任意长度的序列,也就是原文的句子,映射到目标语言。除了机器翻译任务,在自动问答、文本摘要等任务中也都主要应用 Seq2Seq 模型。
简单来说,Seq2Seq 模型在机器翻译中的工作原理就是把源语言映射到目标语言,得到了目标语言的序列(也就是初步翻译完的句子)后再进行优化,保证语法和语义上的正确。虽然使用神经网路模型后,机器翻译的结果得到了很大的提升,但同时也非常复杂。
可视化机器翻译的过程
研究人员称研发 Seq2Seq-Vis 的初衷是想有一个类似于基于规则的传统翻译软件中的规则表,这样开发人员可以通过在规则表中对照得到错误信息就可以很简单地修改模型。
Seq2Seq-Vis.io 网站上给出了一个从德语到英语的演示程序。德语的“die längsten reisen fangen an , wenn es auf den straßen dunkel wird.”翻译成英语应该是“The longest journeys begin when it gets dark in the streets.”,但被机器翻译成了“the longest travel begins when it gets to the streets.”Seq2Seq-Vis 以可视化的方式呈现出了序列到序列模型翻译的每一步,这样用户就能像查找规则表一样来找出机器翻译翻译错误的原因。
Seq2Seq-Vis 另一个很有用的功能是它能找出与某个字词相关的训练集,这也是解决 AI 黑盒问题的一大难点。其实一个机器学习模型除了训练集一无所知,所以要解决机器翻译中的错误最终都要回到训练集中去。
将机器翻译过程可视化,用户就能确定翻译出错到底是编码器解码器使用的训练样本出了错还是注意力模型的设置或者其他环节出错了。
更正序列到序列模型
Seq2Seq-Vis 并不是第一个试图解决 AI 黑盒问题的工具,之前有很多大公司和研究机构都有进行尝试,甚至 IBM 自己也在这上面下过功夫。事实上,很多类似的工具需要的信息比 Seq2Seq-Vis 更少,比如有的工具只需要神经网络的输出就可以,而 Seq2Seq-Vis 还需要训练集,整个模型的架构和设置。但 Seq2Seq-Vis 却是第一个既能可视化模型的决策过程也能让开发人员直接修改模型的工具。开发人员可以通过可视化的方式对模型的决策过程进行修改并观察反馈来实现探索式的调试,比如修改输出序列的单词或者对注意力模型的配置进行修改。
听起来是不是很酷,不过 Seq2Seq-Vis 的目标群体是模型架构师或工程师而非机器翻译的终端用户。因为要让这一工具真正发挥作用需要用户对“序列到序列”模型有较为深入的了解。虽然目标这一工具还只是应用在IBM的内部项目中,但它是开源的,所以大家都可以来试试。
项目地址:http://seq2seq-vis.io
Github地址:https://github.com/HendrikStrobelt/Seq2Seq-Vis
原文地址: https://venturebeat.com/2018/11/01/ibm-harvard-develop-tool-to-tackle-black-box-problem-in-ai-translation/
本文由AI科技大本营翻译,转载请联系微信1092722531
2018 中国大数据技术大会
◆
BDTC 2018
◆
BDTC 2018中国大数据技术大会携主题“大数据新应用”再度强势来袭。本次大会由华东师范大学副校长、教授周傲英,百度商业智能实验室主任熊辉,阿里巴巴副总裁李飞飞三位会议主席对大会内容把关,多位两院院士参与指导,由最了解行业痛点的一线从业者为同行打造。
八折优惠仅最后一天,扫描二维码一键抢票,预定属于你的超强干货。点击「阅读原文」查看大会详情。
推荐阅读
程序员的江湖 务必掌握这些黑话!
高达800万次下载量的npm包被黑客篡改了代码,你的设备或正成为挖矿机
开源 | IBM、哈佛共同研发:Seq2Seq模型可视化工具相关推荐
- 谷歌开源NLP模型可视化工具LIT,模型训练不再「黑箱」
视学算法报道 编辑:陈萍.魔王 转载自公众号:机器之心 深度学习模型的训练就像是「黑箱操作」,知道输入是什么.输出是什么,但中间过程就像个黑匣子,这使得研究人员可能花费大量时间找出模型运行不正常的原因 ...
- 顶级分布式开源项目,配上这款可视化工具,真香!
ZooKeeper作为顶级分布式开源项目,应用非常广泛,Dubbo和Kafka这些知名的开源项目都在使用.之前只是听说过它,并没有仔细研究过.今天带大家来学习下ZooKeeper,主要从ZooKeep ...
- 模型可视化工具Netron手把手教学
文章目录 模型网络结构可视化之 netron 工具总结 网页版ONNX模型可视化测试 操作如下 yolov5-s 可视化效果如下 yolov4-tiny.cfg.txt + yolov4-tiny.w ...
- 【netron】模型可视化工具netron
1.简介 在实际的项目中,经常会遇到各种网络模型,需要我们快速去了解网络结构.如果单纯的去看模型文件,脑海中很难直观的浮现网络的架构.这时,就可以使用netron可视化工具,可以清晰的看到每一层的输入 ...
- 【Tools】神经网络、深度学习和机器学习模型可视化工具——Netron
背景 有时候我们写完深度学习模型后,想看看代码实现的模型和我们预期是否一致,但是没有一个好的工具.最近发现有一个软件Netron支持对一部分深度学习模型可视化,源码地址.Netron 支持 ONNX. ...
- 模型可视化工具netron
目录 netron: 使用方法 yolov5中的使用 .pt模型 模型转换 netron: 详情可见官方github:https://github.com/lutzroeder/netron 使用方法 ...
- 模型可视化工具-netron网页版
Netron
- PyTorch-模型可视化工具TorchSummary
简介 不同于TensorboardX对Tensorboard的支持以方便了PyTorch的训练可视化,PyTorch并没有很好的模型可视化工具,TorchSummary对此做出了补足,极大降低了模型可 ...
- 揭秘数据可视化工具的研究现状
人们获取信息的途径十分有限,我们从外界获得的信息有80%以上来自视觉系统.当数据通过可视化工具以可视化图表的形式呈现时,人们可以更加简洁明了的识别图形特点并将其转换为指定的信息.不得不说数据可视化工具 ...
最新文章
- 嫦娥五号样本研究登上Science:比阿波罗号样本“年轻”10亿年,填补了月球年龄研究空白期...
- Fragment的知识总结
- JSP程序设计实验报告
- iOS GPUImage 自定义美颜滤镜
- part5 vue和HTML5相关知识总结
- 人生十个阶段,每七年周期变化
- ERD Online 4.0.0 免费私有部署方案
- 高速公路联网收费ETC设备可维护性技术要求(征求意见)
- 放假在家/异地/无法使用学校局域网-如何快速登录知网/web of science等学术平台
- 如何制作一个U盘启动盘和重装window系统
- OneNav一为主题魔改教程(二):使用纯css增加网站Logo扫光效果--洞五洞洞幺
- 开源许可协议 Open Source License
- python爬取当当网商品评论
- ViSual Studio美化插件设置背景图片
- RHCE第五天 磁盘分区和管理 永久挂载
- 推动加密硬件性能改进的六项创新
- cocos2dx 图片资源加密解密
- 关于计算机英语翻译,计算机的英文翻译是什么
- 硬盘插到群晖上使用之后再插回Windows就不识别了,记录一次解决过程
- Kotlin调用JavaFx
热门文章
- 关于事务的传播特性和隔离级别的问题
- 再谈PowerPoint 2010导出幻灯片为图片
- 一张图带你了解 Spring Cloud 微服务架构!
- mysql临时表如何分页查询慢_数据量很大,分页查询很慢,怎么优化?
- java 查询sql_java如何实现sql连接和查询的代码?
- matlab有限域多项式除法_椭圆曲线密码学简介(二):有限域的椭圆曲线及离散对数问题...
- 面向对象与软件工程---团队作业1
- echarts相关设置
- 基于Python, Selenium, Phantomjs无头浏览器访问页面
- Parallels Desktop 重装系统