转载自:腾讯AI实验室

5月21日,腾讯 AI Lab 虚拟人艾灵再秀出新技能,首次展示AI作诗、AI书法等国风才艺,并与青年歌手白举纲跨次元合作,共同演唱国风新歌《百川千仞》。

AI“艾灵”诞生于团队的实验性、探索性技术项目“多模态虚拟人”。机器学习、计算机视觉、自然语言处理等多种核心AI能力融合,让艾灵能“歌”善“言”,饱读“诗书”。

此次最新发布的艾灵写诗技能,来自于文本创作模型 SongNet,针对任意关键词,艾灵都能快速“作出”藏头、藏中的诗词。而依托腾讯 AI Lab 的前沿图像生成技术,艾灵得以拜颜真卿、柳宗元、米芾、苏轼等中国书法大家为师,运用最新的图像生成对抗网络,“写下”神形兼备的书法字体。在2021年春节,她运用这项技能为上千万人写下寓意美满的春联。

目前,团队已经通过公开论文发表了 DurIAN 和 SongNet 的核心技术细节,SongNet 代码也已开源。未来,腾讯 AI Lab 将把该项技术能力开放给业界,共同探索AI数字人与数字内容生成和教育等现实场景的结合,携手更多创作者一起传承中华优秀文化。

谁是“艾灵”

传统虚拟偶像一般是通过对真人演员的“动作捕捉+配音”来实现的,但让艾灵这样的 AI 虚拟人能够动起来、与真人对话,技术难度更大、也对技术的协同性提出了更高的要求。

艾灵背后由一套腾讯 AI Lab 自研的复杂系统支撑,系统首先要从文本中提取不同信息,包括动作、表情、情感、重音位置、和激动程度等;之后,这些信息被输入到模型中,生成动作和表情,再同步生成语音、口型和表情参数,最终才有了艾灵自然生动的表现。

腾讯“多模态虚拟人”项目希望把计算机视觉、语音/歌声合成和转换、图像/视频合成和迁移、自然语言理解等多模态的AI能力和技术融为一体,生成清晰、流畅、高质的可交互内容,推进AI在虚拟偶像、虚拟助理、在线教育、数字内容生成等领域的应用。

相较于传统方法,应用多模态合成技术打造的虚拟人,无论是在自然度、鲁棒性、可控性、泛化能力以及实时性等方面都取得了更好的效果。

深度学习:秒学才艺的魔法

艾灵所具备的唱歌、表情、作词、书法等多项才艺,均来自于对海量数据的深度学习,这帮助她快速掌握更多技能,向全能 AI 不断接近。

“气贯长虹”、“充满未来之感”的歌声,来源于腾讯 AI Lab 研发的 DurIAN 声学模型。不同于其他虚拟歌姬的“机器合成+人工调教”模式,给艾灵输入一段曲谱,无需人工调教,她就可以合成非常自然和拟真的歌声。

首先,研究者以音素为基本发音单元将任意歌曲描述为一连串音素的序列;然后通过分析歌谱,从文字、旋律、节奏等多个维度分别提取和预测词曲中每个音素的发音、时长、停顿、音高、风格和演唱技巧等特征;最后使用由真人(中国网络声优龟娘)演唱的歌声训练得到的深度神经网络声学模型和声码器模型,合成出与真人声线高度相似歌声音频。

艾灵为嘉宾们写藏头诗的能力,来自文本创作模型 SongNet。模型的基本骨架是一个自回归语言模型,腾讯 AI Lab 研究员针对格式、韵律、句子完整性设计了特殊的符号来进行标识和建模。词粒度和句粒度的掩码训练策略可以增强模型给定上下文补全缺失内容的能力。借助于经典的预训练和精调模式,可以进一步提升模型生成诗词的质量。

艾灵根据嘉宾出题作藏头诗

书法则是艾灵最近掌握的新技能。腾讯 AI Lab 依托前沿的图像生成技术,通过训练AI书法学习模型,模仿书法的形体及神韵。实验室投入了大量精力,运用最新的AI图像生成对抗网络,同时训练了两个“学徒”——AI 书法学徒和 AI 鉴定学徒来帮助艾灵学习。

首先,AI书法学徒通过提取字形结构等基本信息,捕捉并融入书法的风格韵味;而书法鉴定学徒则学习成为一个书法鉴定师,在对字帖真迹和AI模拟生成的字体进行比较分析之后,反馈两者的差别及“AI模拟字”的不完善之处,从而进一步鞭策书法学徒完善模仿能力。

用AI探索“科技+文化”的未来

“我是一个喜欢中国文化的国风AI……目前还在努力学习,立志点亮更多技能,成为全能AI,把中华文明的美好传递给更多观众!”正如艾灵的自我介绍,腾讯 AI Lab 打造“AI艾灵”,正是希望用科技与二次元的结合,做好传统文化的“传承者”,让更多青年人爱上中华文化。

腾讯 AI Lab 研究员表示,随着不断学习,后续艾灵还将学会很多新技能,比如在唱歌方面,团队正在努力让艾灵掌握不同的腔调,还可以学习传统戏曲、不同方言等更多歌唱方式。

重磅!DLer-CVPR2021论文分享交流群已成立!

大家好,这是CVPR2021论文分享群里,群里会第一时间发布CVPR2021的论文解读和交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

???? 长按识别,邀请您进群!

从唱歌到作诗书法,腾讯AI Lab虚拟人艾灵技能再进化相关推荐

  1. 实习推荐 | 腾讯AI Lab虚拟人中心招聘算法工程师实习生

    PaperWeekly 致力于推荐最棒的工作机会,精准地为其找到最佳求职者,做连接优质企业和优质人才的桥梁.  如果你需要我们帮助你发布实习或全职岗位,请添加微信号「pwbot02」. 腾讯 AI L ...

  2. 【ACL 2020】腾讯AI Lab解读三大前沿方向及入选的20篇论文

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来源:腾讯AI实验室 自然语言理解是腾讯 AI Lab 的主要研究方向之一,研究能力也 ...

  3. ACL 2020 | 腾讯AI Lab解读三大前沿方向及入选的20篇论文

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要20分钟 Follow小博主,每天更新前沿干货 来源:腾讯AI实验室 自然语言处理领域顶级会议 ACL 2020 将于 7 月 5 日至 10 ...

  4. 腾讯国风AI虚拟人学会作诗书法,背靠开源模型SongNet

    5月21日,腾讯AI虚拟人艾灵再秀出新技能,首次展示AI作诗.AI书法等国风才艺,并与青年歌手白举纲跨次元合作,共同演唱国风新歌<百川千仞>. AI"艾灵"诞生于腾讯A ...

  5. 腾讯 AI Lab 2021 年度回顾

    感谢阅读腾讯AI Lab微信号第136篇文章.本文将进行2021年度回顾,祝大家新年快乐! 2021年,腾讯 AI Lab 迈入第 5 个年头.作为一个尚属「年轻」的实验室,在未知而广袤的科学世界中, ...

  6. 腾讯AI Lab:深度解读AI辅助翻译的研究及应用

    11月13日,深圳 - 腾讯AI Lab今日发布了一款AI辅助翻译产品 - "腾讯辅助翻译"(Transmart),可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量.该产 ...

  7. 腾讯AI Lab刘霁谈机器学习,异步计算和去中心化是两大杀器

    本文转载自「AI科技评论」,搜索「aitechtalk」即可关注. 编者按:并行计算是提高计算机系统计算速度和处理能力的一种有效手段.它的基本思想是用多个处理器来协同求解同一问题,即将被求解的问题分解 ...

  8. 【AAAI 2018】腾讯 AI Lab 11篇论文精选:图像描述、NMT 模型、图卷积神经网络、DNN优化等

    背景:AAAI 2018 将于2月2日至 7日在美国新奥尔良举行,在本届大会上,腾讯 AI Lab 有 11 篇论文被录用,涉及图像描述.更低计算成本的预测表现.NMT 模型中的特定翻译问题.自适应图 ...

  9. 顶会 | 腾讯AI Lab 9篇入选论文解读

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:腾讯AI Lab微信(tencent_ailab) AI博士笔记系列推荐 周志华<机器学习>手推笔 ...

最新文章

  1. 【B/S实践】解决:vs中修改样式表后不起作用的问题
  2. 美团分布式服务治理框架OCTO之一:服务治理
  3. 解决apache配置问题小结
  4. [LeetCode] Linked List Cycle
  5. c++小项目_编程初学者的练手小项目(Pythonamp;C/C++)
  6. 复选框操作checked选中为true,反之为False,也可以赋值为true,false
  7. CORS 请求未能成功_当遇到跨域开发时, 我们如何处理好前后端配置和请求库封装(koa/axios版)...
  8. unity 3d换装之 SkinMeshRenderer
  9. 2017年值得学习的3个CSS特性
  10. python指纹识别_指纹识别是目前最成熟的识别技术!Python能分分钟做出一个来!...
  11. FlexSIM.ED v4.0 1CD(生产排程,虚拟管理,能力平衡软件)
  12. Tomcat9安装及配置步骤
  13. 2011年 最新Gmail改版后 申请免费的Gmail企业邮箱图文教程
  14. 2019牛客多校第八场 BBeauty Values dp
  15. 基于强化学习的中间商赚差价指导手册
  16. 张博涵清华大学_2009年北大,清华提前录取保送生人数最多的 33所中学
  17. 仙人掌之歌——直播业务立项(2)
  18. 会员等级进度功能前端实现
  19. Improving Multimodal Fusion with Hierarchical Mutual InformationMaximization for Multimodal Sentimen
  20. 【测试源】bbb_sunflower_1080p_30fps_normal.mp4 等下载地址

热门文章

  1. 信号频域分析方法的理解(频谱、能量谱、功率谱、倒频谱、小波分析)
  2. 前端使用国密sm2和sm4进行加解密
  3. codeforces 750 (Div2)ABCD
  4. 智慧旅游建设包含了哪些内容?
  5. 颠覆与创新,区块链将成音乐产业的下一个风口
  6. 牛逼!我竟然能在 VS Code 里逛知乎、发文章
  7. 微信调用updateAppMessageShareData问题
  8. MySQL_5 有丶牛逼的查询语句
  9. WSL安装ubuntu18.04+2016VCS+Verdi——记录安装过程错误
  10. 马云郭广昌演讲:过冬靠自己 熬过挑战的企业才有抗体