鱼羊 金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

我有一个动画形象,我有一套人体动作,可想要把它们组合成真正的动画,可不是 1+1 这么简单。

别看这体型迥异的三位动作整齐划一,支撑动画的骨架却差异甚大。

这也就意味着,想给新的动画角色套上已经做好的动作,依然需要对骨骼进行重构,费时费力。

好消息是,来自北大北京电影学院的最新研究,正在化繁为简。

根据这项研究结果,从左到右,一个动作迁移深度学习框架就能解决,并且,不需要任何配对示例。

也就是说,现在,同一个动作可以被更轻松地应用于不同的形象了。

这篇论文中了计算机图形学顶会SIGGRAPH,代码现已开源。

论文一作,分别是北京电影学院研究科学家Kfir Aberman,和北大图灵班大三本科生李沛卓

对于这一成果,论文通讯作者陈宝权教授诙谐地表示:这是最懂骨骼的卷积网络

而且据说,论文和代码发布之后,就有相关工业界公司来跟研究团队接洽了。

所以这究竟是怎样一个“骨骼惊奇”的神经网络?

最懂骨骼的卷积网络

论文的主要技术贡献,是提出了全新的骨骼卷积骨骼池化算子

这些算子都是骨骼感知的,也就是说,它们能显式地考虑骨骼的层次结构和关节的邻近关系。

据作者李沛卓介绍,由于骨骼不具有和图片(image)一样规整的结构,但又拥有相对于一般的图(graph)更特殊的结构,新算子的设计亦是整个研究过程中最棘手的环节。

研究人员使用静态骨骼位置+动态关节旋转来表示骨骼上的动作,并把不同骨骼之间的动作迁移视作无配对的域转移任务,将动态静态部分分别处理,构建了用于同胚骨骼之间无需配对示例的动作迁移深度学习框架。

框架结构类似于GAN,包含两对自动编码器构成的生成器,在共同的隐空间中实现不同骨骼之间的动作迁移。还引入了判别器,以提高生成结果的质量。

在这其中,研究人员利用骨骼卷积算子来充分利用骨骼的拓扑结构。

具体而言,在对一个关节及其对应的单个骨骼做卷积时,将其所有距离为 d 的邻接骨骼对应的通道提取出来。同时将静态部分和动态部分的通道进行拼接,进行时间轴上的1维卷积。

骨骼池化,则是将不同拓扑不同的同胚骨骼合并到一个公共基本骨骼的过程。

研究人员介绍,这是不同骨骼的自动编码器能达到统一隐空间的基石。

效果更“服帖”

那么,“骨骼如此惊奇”的神经网络,效果如何?

接下来,我们就一起看下与其它方法比较的结果。

这个运动处理框架,是在Pytorch中实现,实验是在配备了NVIDIA GeForce GTX Titan Xp GPU(12 GB)和Intel Core i7-695X/3.0GHz CPU(16 GB RAM)的PC上进行的。

在做测试时,编码器的输入是源动作,而解码器的输入,是编码器输出的隐变量目标骨骼信息

而后,根据目标骨骼的拓扑结构选择相应的解码器,得到迁移后的动作。

主要做比较的方法包括:CycleGANNKN

而做比较实验的情况也分为两种:

  • 只使用一个自动编码器,但使用不同的骨骼信息,进行同拓扑骨骼之间的动作迁移。

  • 使用完整的两个自动编码器,实现不同拓扑结构之间的动作迁移。

首先,来看下第一个情况下的比较:同一拓扑结构的源骨骼、目标骨骼。

下图从左至右,依次表示输入、CycleGAN、NKN和研究人员的方法。

不难看出,根据输入的这段鬼步舞,研究人员方法的“贴合度”更高。

另外,是第二种难度更高的情况:不同拓扑结构的源骨骼、目标骨骼。

同样的,从左至右依次为:输入、CycleGAN、NKN和研究人员的方法。

在这种情况下,在小人儿“踉跄”和“打斗”动作中,该方法也完胜CycleGAN和NKN。

看完定性比较,再来看下定量比较。

不难看出,在两种情况下,都达到了最优。

北大大三本科生一作

这篇SIGGRAPH论文,有两位共同一作。

其中一位,是北大图灵班大三本科生李沛卓。

李沛卓毕业于重庆一中,2016年入选重庆信息学竞赛省队,2017年以高考总分687分的成绩,北大信息科学与技术学院录取。

目前,李沛卓师从陈宝权教授,研究方向是深度学习和计算机图形学,正在北京大学视觉计算与学习实验室和北京电影学院未来影像高精尖创新中心(AICFVE)实习。

另一位,是北京电影学院AICFVE的研究科学家Kfir Aberman。

他博士毕业于以色列特拉维夫大学,现在从事深度学习和计算机图形学研究。在今年的SIGGRAPH 2020上,他有两篇一作论文入选。

另外,据论文通讯作者陈宝权教授透露,今年的SIGGRAPH上,“亮相”的北大本科生还不止李同学一位:

李沛卓(图灵班17级)、翁伊嘉(图灵班17级)、倪星宇(图灵班16级)、蒋鸿达(博士19级)四位同学与国内外学者合作……相关成果将发表在7月份的 SIGGRAPH 会议。

因为疫情,今年的 SIGGRAPH 会议改为在线,第一次“出道”的四位同学遗憾不能现场享受传统的视觉盛宴。基于 SIGGRAPH 的创意基因,这次虚拟会议更值得期待。

而作为一名本科生,拿到顶会论文是相当不容易的事情,在我们专访李沛卓时,他表示:

作为一个大三学生能收获一篇SIGGRAPH是很幸运的。

一方面有我自己努力的成果,但更重要的是我们团队中教授以及学长的帮助指引和付出。

我对图形学本来就特别感兴趣,能收获这篇论文更加鼓励了我继续这方面的研究。

后生可畏,后生可畏啊。

最后,也祝愿几位同学,在科研的道路上再创佳绩~

传送门在此:

项目地址:
https://deepmotionediting.github.io/retargeting
https://github.com/DeepMotionEditing/deep-motion-editing

中文版论文:
https://mp.weixin.qq.com/s/Af-1RIIuTeVUcl54ixRypA

作者系网易新闻·网易号“各有态度”签约作者

报名 | 不会写代码如何开发对话机器人

5月29日下午14:00,竹间智能Bot Factory™平台发布,0代码开发对话机器人,机器人工厂开盒即用,支持文本、语音、图像情绪识别。

扫码可围观直播~

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

北大图灵班本科生带来动画CG福音,「最懂骨骼的卷积网络」,无需配对样本实现动作迁移 | SIGGRAPH...相关推荐

  1. 非香农类信息不等式_ICLR2020|北大图灵班本科生满分论文:计算约束下有用信息的信息论...

    机器之心转载 来源: 北京大学前沿计算研究中心 作者:许逸伦 本文是第八届国际表征学习会议 (ICLR 2020) 入选口头展示论文 (oral)<基于计算约束下的有用信息的信息论 (A The ...

  2. 北大图灵班本科生获STOC最佳论文奖!这个对标清华姚班的人才计划,正在频频交出答卷...

    乾明 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI ACM计算理论年会(STOC)正在线上举办中. 最新消息,一位江苏常州的小哥哥一口气中了2篇论文,还拿下了最佳论文奖. 而且他还是名本 ...

  3. 北大图灵班本科生吴克文获STOC 2020最佳论文奖

    来源|机器之心 今天,北京大学前沿计算研究中心官方公众号报道称,在全球计算机理论顶会 STOC 2020 上,北大本科生吴克文有两篇论文发表,其中一篇获得了最佳论文奖. 根据北京大学前沿计算研究中心官 ...

  4. 3D人体模型自动生成算法,连肌肉颤动都清晰可见!一作来自北大图灵班

    子豪 发自 凹非寺 量子位 报道 | 公众号 QbitAI 我们在打游戏.看动漫的时候,遇到过不少这样的情况: 感觉哪里不太对-- 现在,这些3D人体模型可以得到改进了~体态更逼真.褶皱更自然.肌肉更 ...

  5. 姚班和北大计算机哪个更牛,北大图灵班与清华姚班到底选择哪一个?

    原标题:北大图灵班与清华姚班到底选择哪一个? 北京大学新开的"图灵班"!与清华大学"姚班"形成竞争之势.清北学堂信息学金牌教研团今天给您整理看看北大图灵班和清华 ...

  6. 模拟水面表面张力,效果自然、真实,北大图灵班研究入选SIGGRAPH

    十分自然的表面张力模拟效果. 樱桃落在水面,你能分辨出这张图是真实还是模拟的吗? 因为表面张力的存在,落叶可浮于水面.水黾得以在水面爬行,这是十分自然的现象. 而计算机模拟表面张力,也可以达到十分真实 ...

  7. 北大图灵班对比清华计算机系,清华姚班闻名国内,却不知道北大有“图灵班”,实力不输清华...

    清华姚班闻名国内,却不知道北大有"图灵班",实力不输清华 自从计算机问世后,在世界各国发展中,这都是一项重要技术,在这个领域掌握了尖端技术,国家的发展将会很超前,科研是离不开计算机 ...

  8. 北大图灵班学子斩获全球竞赛本科生第一名,攻关EDA“卡脖子”技术难题

    近日,2022年度国际计算机学会(ACM)学生科研竞赛 (SRC) 全球总决赛获奖名单正式出炉!其中,来自北京大学图灵班的郭资政凭借其在芯片设计自动化(EDA)领域的贡献,斩获了本科生组全球第一名(F ...

  9. 北大图灵班学子斩获全球竞赛本科生第一名,攻关EDA“卡脖子”技术难题!

    整理 | 于轩 出品 | 程序人生(ID:coder_life) 近日,2022年度国际计算机学会(ACM)学生科研竞赛 (SRC) 全球总决赛获奖名单正式出炉!其中,来自北京大学图灵班的郭资政凭借其 ...

最新文章

  1. 部署war包到阿里云liunx的tomcat时报错:zip END header not found
  2. Sh“.NET研究”arePoint开发笔记-SharePoint2010添加ASP.NET应用程序
  3. 2018年计算机CPU纳米制程,AMD发大招,推出7纳米制程CPU与GPU
  4. 实战:Redis 主从同步
  5. 信息学奥赛一本通 1039:判断数正负 | OpenJudge NOI 1.4 01
  6. 图像处理-二值形态学运算
  7. java excel 晒新年操作_JAVA使用POI操作excel
  8. 复制粘贴之后出现问号怎么办_网页没办法复制粘贴?老司机传授这3招太赞了,全网任意免费复制...
  9. Sentinel 哨兵 实现redis高可用
  10. 开发你自己的XMPP 续 - Openfire 插件开发
  11. 【Java算法】Java抽奖算法,适用于各种抽奖
  12. SQL触发器编写与查看
  13. python pgm 转 bmp
  14. 生态保护重要性评价之防风固沙重要性评价
  15. golang 腾讯AI 机器翻译调用 实现中英互译服务
  16. 主流温度测量方案对比分析(含国产温度传感器芯片GX18B20)
  17. 773-780---DOM事件高级(常用鼠标事件,案例:跟随鼠标的天使,常用的键盘事件,案例:模拟京东按键输入内容,案例:模拟京东快递单号查询)
  18. JavaCV - 调整图像饱和度
  19. 安卓自定义View画钟实现转动
  20. 腾讯云自定义配置购买云服务器图文操作教程 新手必看!

热门文章

  1. 深入Phtread(三):线程的同步-Condition Variables
  2. 如何搭建一个功能复杂的前端配置化框架(一)
  3. request.servervariables参数
  4. React Native学习总结第一天
  5. 编程之基础:数据类型(二)
  6. 论信息系统的项目范围管理
  7. 【Boost】timer、progress_timer和progress_display
  8. DataTable、DataView、ListBox 数据绑定与查询
  9. java 规则引擎_GitHub - javaso/rulegin: 分布式规则引擎系统,重构于开源IOT项目thingboard...
  10. jvm类加载过程_JVM知识点——深入理解JVM的类加载