我于2019年8月至2020年1月在学校和课题组的资助下,前往新加坡国立大学交流访学。以下是我访学期间详细情况。

出访背景

近些年随着算力的提高和数据的增长,以深度学习为基础的各种方法在计算机视觉领域、自然语言处理或者音频的众多任务中取得非常好的效果甚至超出人类的水平。与此同时,多模态相关的任务引起研究者越来越多的兴趣和关注,比如视觉问答任务,图像中定位音源等等。新加坡国立大学冯佳时教授在机器学习以及计算机视觉,音频等领域颇有建树。此次访学主要希望在多模态问题——视觉和听觉信息的问题上与冯老师进行交流学习,具体问题上就是自动编舞问题,自动编舞涉及到音频和人体姿态的数据,希望可以在这个多模态的自动编舞问题上有所成果。

出访任务

此次访学主要是研究自动编舞的任务,具体来说,根据一段完整的音乐和少量初始舞蹈动作,模型可以持续预测接下来的舞蹈动作。整个任务流程如下图所示:

图1.任务流程示意图。给定探戈乐曲“Billie Jean (Philharmonic Edit)”和初始动作,我们模型预测接下来的卡通人物的舞蹈动作。

详细内容

在开始的一个月,我和冯老师探讨确定下来研究的主要方向——自动编舞或者说听音乐跳舞。在这一个月中,我调研最近几年关于自动编舞方面的相关论文,以及其他相关的工作,比如动作预测等等。非常关键有幸的是,我找到一个刚刚公开的编舞方面的数据集,包括4类国际舞蹈,有探戈、恰恰、华尔兹和伦巴,舞蹈动作都采集自专业的舞蹈演员,数据集质量非常高。在接下来一个月中,我开始着手确定研究问题的数学表达以及初步的模型设计。随后的两个月,我就开始不断尝试,做实验,找到问题,并且针对问题进行有针对性的修改。

此次访学,我主要研究自动编舞这一任务。具体来说就是,给定一首完整的乐曲和少部分初始舞蹈动作,模型需要预测接下来,舞者跟随乐曲所跳的舞蹈动作。编舞是一种复杂的艺术形态,包含编舞者灵感和创作。自动编舞问题有着很多的娱乐上的应用场景,比如人机交互、AR/VR的应用。举例来说,在AR/VR的应用上,可以利用用户给定的乐曲,来驱动动漫人物跟随乐曲跳舞。AR应用如下图所示,我们可以把卡通人物放在桌子上,然后播放乐曲,让卡通人物跳舞。

具体来说,在自动编舞任务中,已知一首完整的乐曲和少部分初始舞蹈动作,目标是预测接下来的舞蹈动作。我们把整个人简化为18个人体关键点,分别表示头、手、肘、脚踝以及膝盖等部分。同时,我们用人工设计的音频特征(梅尔频率倒谱系数、音频起始强度等)来表示最原始的音波信号。自动编舞问题最大的困难,以及和其他任务明显的区别在于,如何保证生成的舞蹈动作是符合给定乐曲的节奏的。通俗来讲,就是生成的舞蹈动作是要踩点,而不是随意乱动的。为此,我们设计一种名为DancingPose的方法,它包括三个模块,分别是Motion Encoder Module, Audio-guided Attention Module and Displacement Prediction Module。首先,Motion Encoder Module模块是用来编码舞蹈动作信息和提取动作特征。在Audio-guided Attention Module模块,我们首先计算当前乐曲片段和过往历史乐曲片段的相似度,找到那些和当前乐曲片段最为类似的过往历史片段,然后,我们就找到这些类似乐曲片段相对应的舞蹈动作,用这些舞蹈动作来帮助接下来舞蹈动作的预测。Displacement Prediction Module模块就是利用提取的动作特征和音频引导的动作特征来预测接下里的舞蹈动作。

我们的提出的方法,在这个编舞数据集上取得了很好的效果,相关成果已经投稿到计算机视觉顶级会议CVPR2020。

收获和意义

在访学期间,我在冯教授的指导下完成自动编舞的工作,取得一些成果,并且把相关内容整理总结,于2019年12月投稿到计算机视觉顶级会议CVPR2020上。访学期间,我和冯老师课题组其他同学交流频繁,相互学习,接触到很多的其他领域的问题以及方法,极大地开阔视野。现在我已经结束访学回到学校,今后我继续在计算机视觉领域以及多模态问题上投入热情持续的研究,不负课题组与学校的栽培。

新加坡国立大学NUS校园一角

新加坡国立大学计算机系访学,高盛华课题组徐衍钰(博)2019年8月-2020年1月于新加坡国立大学交流访学...相关推荐

  1. 博士申请 | 美国佛罗里达州立大学计算机系王广老师招收人工智能全奖博士生...

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 佛罗里达州立大学 佛罗里达州立大学(Florida State Unive ...

  2. 博士申请 | 新加坡国立大学刘谦雄老师招收机器学习方向全奖博士/博后/RA

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 新加坡国立大学 新加坡国立大学(National University o ...

  3. 美国大学计算机系学什么,最新美国大学计算机专业排名介绍

    近日USNEWS更新领导美国大学计算机专业的排名情况,下面就是最新的美国大学计算机专业排名,希望能对申请美国大学计算机专业的同学有所参考和帮助! 1 Massachusetts Institute o ...

  4. 南京大学知名计算机系教授周志华否认“出走”传闻 | 最新

    ▼ 点击上方蓝字 关注网易智能 聚焦AI,读懂下一个大时代! 1月3日,国内人工智能领域的顶尖学者.南京大学计算机与科学技术系教授周志华通过个人实名认证微博就"出走传闻"做出回应. ...

  5. 匹兹堡大学计算机系世界排名,2019上海软科世界一流学科排名计算机科学与工程专业排名匹兹堡大学排名第101-150...

    2019上海软科世界一流学科排名计算机科学与工程专业排名指标 首先计算大学在每项指标上的得分,具体为大学在一项指标上的数值除以该项指标的最大值(开根号)再乘以100.然后各指标得分除以100再乘以相应 ...

  6. 计算机系活动主题,大学计算机系的活动方案范文2016

    大学生是社会的一个特殊群体,是指接受过大学教育而还未完全走进社会的人,作为社会新技术.新思想的前沿群体.国家培养的高级专业人才,代表着最先进的流行文化.下面是小编收集的计算机系的活动方案范文,希望大家 ...

  7. 211大学计算机系分数,这四所211大学,分数线超过不少985,分数低的还真不敢轻易报考...

    在我国的高等院校中,有一些211大学比985高校还要难考.今天给大家盘点最难考的四所211大学,这四所大学的录取分数线超过不少985高校,分数低的考生还真不敢轻易报考. 第一所是北京邮电大学 虽然在不 ...

  8. 哈尔滨工业大学 计算机系教授,哈尔滨工业大学计算机科学与技术学院导师简介:张田文...

    对考生而言,充分了解高校.专业以及师资情况是一项最基础.最关键的工作.以下是中公考研小编为大家整理的"哈尔滨工业大学计算机科学与技术学院导师简介:张田文"的相关信息,希望对同学们有 ...

  9. 犹他州计算机科学,美国犹他州立大学计算机系终身教授承恒达博士访问学科部...

    4月4日-5日, 美国犹他州立大学计算机系终身教授,电子工程系教授,哈工大计算机学院教授.博士生导师承恒达博士应学科部主任王晓龙教授的邀请访问了计算机及信息技术学科部.与院领导和学科部的老师就计算机学 ...

最新文章

  1. win10下pycharm安装opencv tensorflow anaconda
  2. 线性回归与多项式回归的区别,如何判断他们的使用场景
  3. 设计模式(二)工厂模式
  4. 5G商用将在“十三五”时期内启动
  5. spring 源码分析之BeanPostProcessor
  6. 如何从BugFree升级到禅道
  7. 【TensorFlow】稀疏矢量
  8. qt中调整弹出框的位置
  9. LeetCode 69. Sqrt(x)
  10. Android 系统(261)---SIM卡不识或者掉卡简单分析
  11. 述 SQL 中的 distinct 和 row_number() over() 的区别及用法
  12. CentOS connect:fail, reason: connect server 22 port fail
  13. windows电脑自动安装第三方软件-联想客服建议解决办法
  14. Java I/O系统之Object流
  15. 小程序源码:装B神器P图修改微信流量主小程序源码下载趣味恶搞图制作
  16. Android虚拟机、模拟器识别
  17. 什么是 ASP.NET
  18. 吹牛前请看这篇:“智能”物流 VS “智慧”物流
  19. 【数学建模】十二(最后一篇):MATLAB CUMCM真题求解实例三:机理建模型
  20. python精彩编程200例 pdf-Python创意编程200例turtle篇

热门文章

  1. 智能电子秤方案测脂肪模块设计
  2. 1335 工作计划的最低难度(动态规划)
  3. ios 真机运行:The app ID cannot be registered to your development team
  4. 获取百度网盘真实链接
  5. MVG读书笔记——几何变换续
  6. 支付宝支付报 invalid-app-id : 无效的AppID参数
  7. Zynq LTE基站设计与实现
  8. 英语单词:through; fall through; write through
  9. mysql为什么尽量不要存null
  10. Ubuntu16.04深度学习环境搭建