内容导读

人脸识别也遇到坑了,识别得了三次元,却对二次元无效。迪士尼的技术团队,正在开发这一算法,以帮助动画制作者进行后期搜索。团队利用 PyTorch,效率得到很大的提高。

本文由公众号 PyTorch 开发者社区 编译整理发布

说到动画,不得不提起自 1923 年就成立的商业帝国迪士尼,以动画起家的迪士尼,至今引领着全球动画电影的发展。

每一部动画电影的背后,都凝结了数百人的心血与汗水。自第一部电脑3D动画《玩具总动员》的上映,迪士尼就开启了数字化动画创作的征程。随着 CGI、AI 技术的发展,迪士尼动画电影的制作、存档等方式也发生了极大的变化。
火遍全球的《疯狂动物城》历时五年制作完成

目前,迪士尼也吸收了一大批计算机科学家,他们正在用最前沿的技术,改变内容创作的方式,减轻电影幕后制作者的负担。

百年电影巨头,如何进行数字化内容管理

据了解,在华特迪士尼动画工作室中,大约有来自 25 个不同国家的 800 多名员工,包括艺术家、导演、编剧、制片人以及技术团队。

制作一部电影,需要经历从灵感产生,到故事大纲撰写,再到剧本拟定,美术设计,人物设计,配音,动画效果,特效制作,剪辑,后期等诸多复杂流程。

截至 2021 年 3 月,仅专业制作动画电影的华特迪士尼动画工作室已制作并上映了 59 部长篇动画,这些电影中的动画形象加起来就有成百上千个。

历史动画角色的相关素材数据,会在续集、彩蛋、参考设计时被高频使用

动画师在进行续集制作、或想参考某一角色时,需要在海量的内容档案库中,寻找特定角色、场景或物体。为此,他们往往需要花费数小时来观看视频,纯靠肉眼从中筛选自己需要的片段。

为了解决这个问题,迪士尼从 2016 年起,就开始了一项叫做**「Content Genome」**的 AI 项目,旨在创建迪士尼数字内容档案,帮助动画制作者快速、准确地识别动画中的面部(无论是人物或是什么物体)。

训练动画专用人脸识别算法

数字化内容库的第一步,是将过往作品中的内容进行检测与标记,方便制作者以及用户搜索。

人脸识别技术已经比较成熟,但是,同一套方法,能否用于动画中的面部识别呢?

Content Genome 技术团队进行试验之后,发现只在某些情况下可行。

他们选取《阿瓦勒公主埃琳娜》和《小狮王守护队》两部动画电影作品,手动注释了一些样本,用正方形标出数百帧影片中的面孔。通过该手动注释数据集,团队验证了基于 HOG + SVM pipeline 的人脸识别技术,在动画面孔(尤其是类人脸和动物面孔)中的表现不佳。

手动标注出动画形象的面部

团队分析后确认,像 HOG + SVM 这样的方法对于颜色,亮度或纹理变化具有鲁棒性,但所使用的模型只能匹配具有人类比例的动画角色(即两只眼睛,一只鼻子和一张嘴)。

此外,由于动画内容的背景通常具有平坦的区域和很少的细节,所以,Faster-RCNN 模型会错误地把简单背景下脱颖而出的所有事物,都认作是动画面孔。
《汽车总动员》中,两位「赛车」主角较为抽象的面部,就无法用传统的人脸识别技术进行检测与识别

因此,团队认为他们需要一种能够学习更抽象的人脸概念的技术。

团队选择用 PyTorch 训练模型。团队介绍道,通过 PyTorch,他们可以访问最先进的预训练模型,满足其训练需求,并使归档过程更高效。

训练过程中,团队发现,他们的数据集中,正样本是足够的,却没有充足的负样本来训练模型。他们决定使用不包含动画面孔、但具有动画特征的其他图像,来增加初始数据集。

在技术上为了做到这一点, 他们扩展了 Torchvision 的 Faster-RCNN 实现,以允许在训练过程中加载负样本而无需注释。

这也是团队在 Torchvision 核心开发人员的引导下,为 Torchvision 0.6 做出的一项新功能。在数据集中添加负样本示例,可以在推理时大大减少误报,从而得到出色的结果。

用 PyTorch 处理视频,效率提升 10 倍

实现动画形象的面部识别之后,团队的下一个目标是加快视频分析流程,而应用 PyTorch 能够有效并行化并加速其他任务。

团队介绍道,读取和解码视频也很耗时,因此团队使用自定义的 PyTorch IterableDataset,与 PyTorch 的 DataLoader 结合使用,允许使用并行 CPU 读取视频的不同部分。
视频被提取的 I-frames,被分割成不同的块(chunks),每个 CPU worker 读取不同的块

这样的读取视频方式已经非常快了,不过团队还尝试只通过一次读取就完成所有计算。于是,他们在 PyTorch 中执行了大部分 pipeline,并考虑了 GPU 的执行。每一帧只发送给 GPU 一次,然后将所有算法应用到每一个 batch 上,将 CPU 和 GPU 之间的通信减少到最小。

团队还使用 PyTorch 来实现更传统的算法,如镜头检测器,它不使用神经网络,主要执行颜色空间变化、直方图和奇异值分解(SVD)等操作。PyTorch 使得团队能以最小的成本将计算转移到 GPU,并轻松回收多个算法之间共享的中间结果。

通过使用 PyTorch,团队将 CPU 部分转移到 GPU 上,并使用 DataLoader 加速视频阅读,充分利用硬件,最终将处理时间缩短了 10 倍。

团队的开发者总结道,PyTorch 的核心组件,如 IterableDataset,DataLoader 和 Torchvision,都让团队得以在生产环境中提高数据加载和算法效率,从推理到模型训练资源到完整的 pipeline 优化工具集,团队都越来越多地选择使用 PyTorch。

人脸识别对动画无效,迪士尼打造动画专用人脸识别库相关推荐

  1. 迪士尼影视动画票房创新高

    2019独角兽企业重金招聘Python工程师标准>>> 2013年喜爱特效大片和动画电影的观众也是一饱眼福,好片不断成为了2013电影市场的一个让人兴奋的现象,也让网络渲染的市场逐渐 ...

  2. 一坐感受神奇!迪士尼打造魔术台

    如果您是迪士尼的忠实粉丝,这个消息应该会让您欣喜若狂:迪士尼研究所设计了一款 「魔术台」让您可以与动画人物进行身临其境的互动,整个互动过程不需要特殊的眼镜或耳机,而是依靠一张座椅来完成.座椅和显示屏为 ...

  3. 迪士尼机器人芭蕾舞_迪士尼乐园里的机器人又有新消息,这次是关于柔软皮肤...

    迪士尼最近公布了一项机器人专利,它们可能拥有高度类人的表面皮肤,就像美剧<西部世界>里的那些看起来和人类长得一模一样的机器人. 根据专利介绍,它是一个可移动并且可与人类进行交互的机器人.机 ...

  4. 迪士尼2016年压轴巨作---《海洋奇缘》观后感

    航向远方,我们探索,寻找线索,祖先传奇,世代相传,源远流长-- 今天晚上,我和妈妈一起看了迪士尼出品的年末压轴大作<海洋奇缘>,从开始看到现在,激动的心情久久无法平复,真的是amazing ...

  5. 真人版《美女与野兽》刚上映,迪士尼又推出同系列VR体验

    迪尼斯似乎对这个IP青睐有加,不仅推出真人版,还推出了VR内容. 最近,迪尼斯推出的真人版<美女与野兽>电影(由艾玛·沃森主演)已经在中国和美国上映,并拿下单日票房冠军.今天,迪士尼表示将 ...

  6. HTML期末大作业—— 迪士尼影视电影(6页) HTML+CSS+JavaScript 网页设计期末课程大作业 web前端开发技术 web课程设计 网页规划与设计

    HTML5期末大作业:影视电影网站设计-- 迪士尼影视电影(6页) HTML+CSS+JavaScript 网页设计期末课程大作业 web前端开发技术 web课程设计 网页规划与设计 文章目录 HTM ...

  7. 迪士尼真人经典巨制《小美人鱼》举行中国首映礼,单依纯、阿云嘎亮相

    美通社消息:北京时间5月24日消息,由迪士尼影业出品,根据迪士尼同名动画改编的真人经典巨制<小美人鱼>(The Little Mermaid)于5月23日在上海迪士尼度假区华特迪士尼大剧院 ...

  8. FRAY Studio为迪士尼的“冰雪奇缘 - 百老汇音乐剧”创造了一个不断变化的世界

    通过与领先的媒体服务器制造商伪装和实时特效软件Notch合作,FRAY联合创始人Finn Ross和Adam Young正在采用迪士尼的动画魔术,并为剧院提供完整的完整性. "冰冻是一场关于 ...

  9. 通过机器学习识别“迪士尼在逃公主”,程序员宠女的正确打开方式!

    到了庆祝的时候了!我们刚刚送走了圣诞老人.现在正等待新年的钟声敲响.所以我想到建立一个很酷的东西(至少我的七岁小公主会觉得)同时学一点机器学习.所以我们要做一个什么? 我借用的我女儿所有迪士尼公主人偶 ...

  10. 图解迪士尼发展史:华特·迪士尼建立的动画王国

    华特·迪士尼是个教科书案例一般的博学者.他集创新者,企业家,漫画家,配音员,动画师,工作室老板,主题公园的创建者兼所有者和电影制片人众多头衔于一身.他的抱负随着公司(由和哥哥罗伊一起成立于1923年的 ...

最新文章

  1. pytorch maxout实现
  2. elementui中同时上传多个文件_2019-12-19 element-ui文件上传 一次请求上传多个文件...
  3. android静态代码扫描,android 静态代码扫描
  4. 剑指OFFER之二进制中1的个数(九度OJ1513)
  5. Buildroot构建指南——Linux内核
  6. mac 显示隐藏文件_如何在Mac上显示隐藏文件?苹果mac显示隐藏文件夹方法
  7. Annaconda环境下查询Python 第3方包的版本号
  8. [USACO08OPEN]寻宝之路Clear And Present Danger
  9. android getresponsecode -1,getHttpResponseCode()在android 2.2中返回-1
  10. maven跳过单元测试
  11. Tapestry5 开发过程中问题收集
  12. 高等数学,线性代数 课后题解答
  13. matlab中数字分频器的,一种基于FPGA的数字分频器设计详解
  14. m115b linux 驱动下载,富士施乐m115b打印机驱动
  15. 数据库使用SHADOW系统实现高可用性
  16. MySQL基础篇——存储过程和函数中的变量
  17. mysql 2008降序排列_sql 升序降序排列
  18. [dp优化]个人对dp优化的理解
  19. 在线生成安卓签名证书
  20. IDEA重置maven配置的问题解决

热门文章

  1. VOLTE_SRVCC和ESRVCC
  2. Windows10动态壁纸Wallpaper软件
  3. rocketdock 打不开 有进程
  4. 7-6 厘米换算英尺英寸 (15 分)
  5. MessageBox--获知点击确认还是取消?
  6. 记jmeter测试千人在线并且保持10分钟登陆Case
  7. python交易是什么意思_py交易什么梗?起源及流行原因
  8. UVA1025 Thematic Contests
  9. 自主创新高科技IC企业的数字化转型 ——上海达策助力上海芯钛迈向企业发展新赛道
  10. Linux的常见问题解答和管理技巧