视学算法报道  

编辑:小咸鱼

【新智元导读】麻省理工学院媒体实验室(MIT Media Lab)的研究人员开源了一个虚拟角色生成工具。该工具结合了面部、手势、语音和动作领域的人工智能模型,可用于创建各种音频和视频输出,一举登上《Nature Machine Intelligence》。

这年头,用人工智能创建一个数字虚拟人感觉越来越容易了。

不过,关于数字人,不少言论都集中在「它有误导性」和「它背后的deepfake技术有潜在的隐私泄露风险」这两个观点上。

其实,这项技术也可以用于积极的目的,比如,让阿尔伯特·爱因斯坦复活,去教一堂物理课,或者与年长的自己聊一聊天。

为了鼓励这项技术所能带来的积极作用,麻省理工学院媒体实验室(MIT Media Lab)的研究人员开源了一个易于使用的虚拟角色生成管道。

该虚拟角色生成管道结合了面部、手势、语音和动作领域的人工智能模型,可用于创建各种音频和视频输出。

使用人工智能技术制作的蒙娜丽莎、玛丽·雪莱、马丁·路德·金、阿尔伯特·爱因斯坦、文森特·梵高和威廉·莎士比亚的动画

该虚拟角色生成管道还使用了可追踪的、人类可读的水印标记了其输出的结果。

这样一来,它生成的内容就可以与真实的视频内容区分开来,进而防止一些恶意的用途。

研究人员希望教师、学生和医疗保健工作者可以尝试一下,看看这个工具能否在各自的领域帮助到他们。

研究人员在《Nature Machine Intelligence》上写道,如果有更多的学生、教育工作者、卫生保健工作者和治疗师有机会构建和使用这些虚拟角色,那么,这些虚拟角色可能会为更多人带来福祉。

论文地址:https://www.nature.com/articles/s42256-021-00417-9

斯坦福虚拟人类互动实验室的创始主任杰里米·巴伦森(Jeremy Bailenson)表示:

「当人工智能和人类开始共享身份时,这将是一个奇妙的世界。这篇论文完成了令人难以置信的工作,描绘了在教育、健康、亲密关系等领域,AI生成角色的可能用途,同时给出了一个切实可行的路线图,说明了如何避免隐私泄露和虚假视频。」

该论文的第一作者Pat Pataranutaporn是Pattie Maes流体界面研究小组的博士生。

他说,「尽管世界上大多数人都是从deepfakes那里了解虚拟人技术的,但我们认为它有潜力成为创造性表达的工具。」

数字人的有趣妙用

生成性对抗网络(GAN),是两个相互竞争的神经网络的组合,使得创建极具真实感的图像、克隆声音和生成人脸动画变得更加容易。

Pataranutaporn与Danry一起,在一个名为Machinoia的项目中首次探索了生成人脸动画的可能性。

统一管道允许用户提供视频、语音或文本作为输入,以生成视频和实时面部滤镜

在这个项目中,Pataranutaporn创造了各个年龄段的自己:少年、青年、中年、老年,让他们从不同的角度和自己进行对话。

Pataranutaporn说:「这次不寻常的经历让我意识到自己作为一个人的旅程。这是一次非常新奇的体验——用你自己的数据来揭示你自己以前从未想过的东西。」

研究人员说,自我探索只是AI虚拟角色的积极应用之一。

实验表明,虚拟人可以使学生对学习更有热情,并提高认知任务的表现,并作为传统教学的补充。

Pataranutaporn解释说,这项技术为教学提供了一种「根据兴趣和个人背景进行个性化定制,并且可以随着时间的推移而改变」的方式。

Machinoia技术还可以用于在视频会议中隐藏自己的脸,但是还能保留面部表情和情绪。

如果人们要在会议上共享个人敏感信息(如健康和创伤经历),那这项技术会很有用。

在实时会议环境中使用人工智能生成的角色

Machinoia项目还有更多好玩的用例。

在今年秋天,由Maes和研究机构Roy Shilkrot共同教授的Deepfakes实验课上,学生们用这项技术将一幅描绘清明历史场景的中国画中的人物制作成了动画。

有的同学还用Deepfakes创建了一个「分手模拟器」。

法律和道德挑战

研究人员在论文中指出,随着技术的发展,虚拟人技术的蓬勃兴起也带来了不少法律和伦理问题。

例如,如何决定谁有权以虚拟数字化的形式重现一个历史人物?名人的AI克隆人在网上推广有害行为,谁承担法律责任?与人类相比,人们更喜欢与虚拟人互动,这有什么危险吗?

「我们这项研究的目标之一是提出问题,并就如何使用这项技术来造福社会展开公开讨论」,Maes说。

「通过分享AI虚拟人这项技术,同时明确标注由它生成的视频是合成的」,Pataranutaporn说,「就可以激发更多有创造性和积极的用例,这样才能让人们了解到这项技术的潜在好处」。

参考资料:

https://news.mit.edu/2021/ai-generated-characters-for-good-1216

https://www.nature.com/articles/s42256-021-00417-9

点个在看 paper不断!

DIY最美数字女友!MIT开源最强虚拟人生成器,登Nature子刊相关推荐

  1. MIT开源最强虚拟人生成器

    MIT虚拟人AI-generated Characters 一.项目简介 二.原理简介 三.代码实现 1. 数据准备 2. 函数定义 3. 人物选择/上传 4. 输入驱动选择/上传 5. 视频生成 一 ...

  2. 19个神经元控制自动驾驶汽车,MIT等虫脑启发新研究登Nature子刊

    本文经机器之心(almosthuman2014)授权转载,禁止二次转载. 选自Medium 作者:Louis Bouchard 机器之心编译 编辑:魔王.泽南 这种新型智能系统模仿线虫的神经系统来高效 ...

  3. 自制DIY 机器狗 完全教程 - MIT猎豹Cheetah

    自制DIY 机器狗 完全教程 - MIT猎豹Cheetah 背景 结构设计 模块化关节电机 性能考虑 关节结构 四足平台设计 腿部设计 身体设计 脚部设计 硬件设计 关节驱动器 通信总线板 供电系统 ...

  4. 重磅MIT开源人工智能算法评估和理解对抗Logit配对的稳健性

    重磅MIT开源人工智能算法评估和理解对抗Logit配对的稳健性摘要:我们评估了对抗性Logit Pairing的稳健性,这是最近针对广告范例提出的防御措施. 我们发现,使用Adversarial Lo ...

  5. 介绍一款贼美的Vue+Element开源后台管理UI

    点击上方 好好学java ,选择 星标 公众号 重磅资讯.干货,第一时间送达 今日推荐:又一程序员进了ICU:压垮一个家庭,一张结算单就够 个人原创100W+访问量博客:点击前往,查看更多 前言 Eu ...

  6. GPL协议与MIT开源协议的异同

     GPL协议(GNU通用公共许可证)和MIT开源协议都是开源软件许可证 要说异同,有以下几点: 相同点: 1. 都是开源协议,授权使用.修改.分发和再发布软件. 2. 要求使用协议的用户保留原有许可证 ...

  7. MIT 开源协议是什么意思?底层原理是什么?

    MIT开源协议是一种宽松的开源许可证,允许软件在保留版权和许可证声明的前提下,免费使用.复制.修改.合并.出版.分发.再授权和销售等.该许可证适用于几乎所有类型的软件,包括商业软件和专有软件. 该协议 ...

  8. VISTA -MIT开源基于数据驱动的自动驾驶仿真引擎

    引言 VISTA 是MIT开源的一个基于数据驱动的用于自动驾驶感知和控制的仿真引擎.VISTA API提供了一个接口,用于将真实世界的数据集转换为具有dynamic agents.sensor sui ...

  9. MIT开源协议,多端适用的租房小程序,带完整的管理员后台

    一.开源项目简介 多端适用的租房小程序,带管理员后台.是一个完整的项目,可以直接使用. 二.开源协议 使用MIT开源协议 三.界面展示 部分截图 1. 前台截图 2. 后台截图 四.功能概述 1.使用 ...

最新文章

  1. Windows Server 2012正式版RDS系列⑤
  2. 分享基于Entity Framework的Repository模式设计(附源码)
  3. org/springframework/core/MethodClassKey
  4. Jmeter测试普通java类说明
  5. 弗尤博客(十一)之搜索博文
  6. 不错的流量卡官网html源码
  7. 【优先队列】HDU 1873——看病找医生
  8. android activity从新打开,【Android开发-8】生命周期,Activity中打开另一个Activity
  9. Android IntentService使用
  10. Python与JavaWeb的第一次碰撞
  11. H.264的Slice及Slice类型
  12. 基于Android的海康威视的二次开发
  13. oneDrive登陆界面空白 的解决办法
  14. Mac Brew安装及换源教程
  15. 【图像分割】基于混洗Shuffled Complex Evolution实现图像分割附matlab代码
  16. 武林外传之勇夺金掌柜 【安卓游戏】
  17. 微信小程序——云开发的安全规则
  18. https://ac.nowcoder.com/acm/contest/317/D
  19. 人工智能的发展前景如何?做人工智能收入高吗?
  20. C++ 程序编译过程:从代码到程序

热门文章

  1. Ubuntu 系统 文件操作命令
  2. JS设计模式——3.封装与信息隐藏
  3. Java程序员从笨鸟到菜鸟之(五)java开发常用类(包装,数字处理集合等)(下)...
  4. 错误:Error #2032解决方案
  5. [转]笑死人的考试填空
  6. 技术图文:如何利用 C# 向 Access 数据库插入大量数据?
  7. android监听器在哪里创建,[转载]android开发中创建按钮事件监听器的几种方法
  8. 2021 IDEA大会开启AI思想盛宴,用“创业精神”做科研
  9. DeepMind 的新强化学习系统是迈向通用 AI 的一步吗?
  10. 快手王华彦:端上视觉技术的极致效率及其短视频应用实践 | AI ProCon 2019