从《阿凡达》到《流浪地球》,从好莱坞科幻 3D 电影之最到中国科幻 3D 电影之最,从 2009 年到 2019 年,近十年的岁月,见证了中国 3D 影视制作的快速成长和繁盛,也刺激着赵天奇探索人工智能与影视制作结合应用的信心。

影视制作中,科幻电影的火爆让全球影迷感受到了 3D 特效的魅力,这与近年来人工智能技术的突破性进展密不可分。

“比如《流浪地球》的每一个镜头都需要手工制作,这个过程十分复杂,耗费的人力成本也非常之高。人工智能影视制作就是用 AI 替代影视行业中大量的比较枯燥、高成本、低创造性的工作。”聚力维度创始人、CTO、Qualcomm AI 荣誉技术大使 赵天奇如是说。

多年来,赵天奇一直专注人工智能与影视行业的结合创新。北邮读博期间,他创立了一家名为十二维度的公司,定位于数字图像及 AI 在 3D 影视方面的应用,当时,VR 市场的火爆让 3D 找到了最佳落地方向,但他并不满足,在赵天奇的带领下,2016 年,科幻成真实验室首个人工智能 2D 转 3D 平台 “峥嵘” 上线,而他现在还是清华大学人工智能影视方向的博士后。

自动实现 2D 转 3D 有何难?

2011 年开始,随着谷歌、微软研究团队先后将深度学习应用到语音识别领域,2019 图灵奖获得者 Geoffrey Hinton 团队在 ImageNet 大赛中利用深度学习将图片识别的错误率大幅降低,由深度学习技术推动的人工智能开始得到更多科研机构、工业界的高度关注。

尽管那时人工智能的概念还没有如今这么火爆,但赵天奇敏锐地察觉到深度学习背景下语音识别、计算机视觉在影视行业所变革的潜力。

传统的 3D 内容制作技术主要有两种:一种是 3D 双机实拍,一种就是 2D 后期转 3D,但仍需要耗费巨大的资金、人力和时间成本。而技术的瓶颈直接导致 3D 内容的匮乏,目前国产 3D 电影呈扎堆之势,但成熟者却不多。那么,将 2D 视频渲染成 3D 有哪些技术难点?

赵天奇强调,一是影视内容的类别十分复杂,例如人物场景、自然场景、历史场景、想象场景等,每增加一个维度就上升一个级别;二是对观影效果的要求非常高,将丝毫的抖动误差排除到最小。为此,他们针对性地设计了多级神经网络、时空复用信息、对抗神经网络等技术,最终达到了院线级的水平。

很多算法是 “玩具级”的,只能用来娱乐

目前,聚力维度在 3D 领域的产业化已经非常成熟了,包括院线电影、电视剧、视频直播等 ToB 领域,以及涉及个人短视频、2D 转 3D 的 ToC 领域。

谈及此前争议颇多的 “AI 换脸” 技术,在赵天奇看来,“有很多算法都是‘玩具级’的,娱乐可以,但没有人用它来生产内容。

他认为,如果将人工智能的应用分为识别、决策、生成、理解几种任务的话,聚力维度是一家专注于影视产品生成的公司。怎么理解呢?“就是给人去看、去听,而不是帮人决策。”

聚力维度还联合 Qualcomm 共同为终端用户提供语音技术服务。赵天奇认为,Qualcomm 本身在移动端的基因非常深厚,也是非常符合场景需求的,对于 AI 技术快速落地到移动端,也是最有发言权的。

当然,这只是一个起点,未来在 ToC 领域像变脸、面部捕捉、动作捕捉、3D 转换等(技术)双方都可以进行更全方位的合作。而且,赵天奇团队也在积极探索真人级的面部捕捉、动作捕捉技术,计划与电视台等合作落地“虚拟主播” 项目。

不久前,赵天奇被评为 Qualcomm AI 荣誉技术大使,这无疑是对其团队的一种肯定。赵天奇强调:“我们做这个方向在 AI 领域确实也是一个比较独特的方向,相对于大热的安防人脸识别、自动驾驶决策等领域,影视生成并不是所有人都能理解的。但我们也发现:不管是影视传媒还是互联网领域的合作伙伴,都可以与之合作加速 AI 影视制作的落地。”

“人人都可以做影视作品”,是赵天奇对当下 AI 在影视行业产生变革的愿景。例如,定制化电影、时效性电影、多结局交互游戏式电影都是他们正尝试突破的方向。未来,赵天奇还希望利用 AI 技术将面部捕捉、声音捕捉、动作捕捉、动作生成全流程覆盖,真正实现“视频作家”,并将全流程服务在产业中快速落地。

专用人工智能是没有泡沫的

据英国风投基金 MMCVentures 发布的最新研究报告显示,欧洲 2830 家标榜为 AI 的公司中,有 1580 家符合 AI 公司的定义,也就是说,近四成的公司其实和 AI 没有任何关系。当时,这一数字的公布,引起了圈内不小的震动。

“从现阶段来讲,如果大家对通用人工智能 / 强人工智能有所期待的话,这件事情应该是有泡沫的;相反,专用人工智能,从本质上是没有泡沫的。”赵天奇认为。

他还建议:专注于高校里的研究人员,更适合研究通用人工智能,因为企业拥有数据,在盈利压力之下,可能会在某个专项问题上比高校内的研究人员取得更为突出的成果;但同样企业需要盈利,就无法专门去研究通用人工智能,所以新的技术就可能出现在纯研究人员的高校群体中,“尽量往需要小数据,不需要数据,通用人工智能这条路上去研究;如果是创业者,一定要针对他自己熟悉的领域以及对应的专用人工智能结合,彻底地分析这件事情的可行性、局限性。”

当然,AI 算法只是意味着开了个好头,真正考验的是创新企业如何结合自身业务将算法进行商业落地。要知道,AI 的实际技术门槛很高,在发展过程中,真正的 AI 公司也可能遇到数据和技术的挑战。在这一点上,对于持续高涨的中国 AI 企业来讲更是挑战巨大。

对技术与行业时刻保持深刻理解,一定要两者结合才能形成真正落地的项目。”对于赵天奇而言,从最初 2012 年创立团队,经历了 2016 年颠覆创新,现在已经能准确把握人工智能与影视行业结合的痛点,让人人都能做电影,科幻般的人工智能影视制作方式成为现实。

特别提示:

Qualcomm 荣誉技术大使所发表的内容及观点均属原作者个人意见,并不必然代表 Qualcomm 或其分支机构的立场。这些内容仅供信息参考,并非获得 Qualcomm 或其他任何一方的认可或代表其观点。

普通人也能用AI拍出3D大片?这位清华博士后这么做相关推荐

  1. 从量子物理到AI医疗,这位清华博士后想用十年弥补病理医生的百年缺口

    来源:大数据文摘 本文约3800字,建议阅读5分钟. 全球首个AI病历辅助诊断系统:好的事情,总是慢慢来的. 根据WHO下属"国际癌症研究机构"公布的最新全球癌症数据报告,2018 ...

  2. ai如何旋转画布_「AI教程」使用AI制作3D立体文字效果

    今天macdown小编要通过AI制作一种3D立体字体,主要的知识点是混合工具的使用.Shift键.Alt键的灵活运用.3D旋转命令.投影效果的创建等,学会后可以应用在需要的设计中,比如海报设计,log ...

  3. 谷歌AI最新3D数据集,1.5万张动图,让AR主宰你的生活

    谷歌AI最新3D数据集,1.5万张动图,让AR主宰你的生活 这是谷歌的开源3D物体数据集Objectron,包含15000份短视频样本,以及从五个大洲.十个国家里收集来的400多万张带注释的图像. 作 ...

  4. 再也不愁渲染素材了?AI 生成3D纹理 #Polycam3D 推出新功能

    最近有不少群友运用 AIGC 工具来提升工作效率,我听说连 3D 数字资产的渲染贴图素材都能生成了. Mixlab 小杜 3D 内容制作工具也是我非常感兴趣的领域,Polycam3D 本是一款扫描建模 ...

  5. Android激光投影3d效果,激光那些事③:影院看3D大片其实被坑?

    13D影片的亮度不够是为省钱 自己买3D电视看大片不太靠谱,因为普通消费者没有丰富的片源.很多人还是选择去了电影院看3D大片.现在不管什么时候去电影院,你几乎都可以找到一部3D电影在上映,但是3D效果 ...

  6. 生成式AI结合3D、XR怎么玩?NVIDIA、Niantic等公司已入局

    最近生成式AI风头有点大,这种技术只需要用文字就能作画,而且效果惊艳,堪比专业画师的作品.其中一些热门的方案包括DALL-E 2.Midjourney.BariumAI.D-ID AI.Stable ...

  7. 教你自制3D眼镜--在家看3D大片!

    别以为只有去电影院才能享受3D大片那种身临其境的效果,安坐家中也一样可以看3D影片,你只需要自己动一下手,花几分钟时间制作一个色分3D眼镜,就可以在家观看采用色分法制作的3D影片了. 自己动手做3D眼 ...

  8. 全网痛心!巴黎圣母院请让AI、3D打印来守护最后的文明瑰宝...

    浩劫之后,文明仍需流传,我们能做的还有很多. "时间和人使这些卓绝的艺术遭受了什么样的摧残?关于这一切,关于古老的高卢历史,关于整个哥特式艺术,现在还有什么存留给我们呢?"--雨果 ...

  9. 使用Ai做出3D筛子

    使用Ai的3D 功能做出3D筛子,如下图. 第一步,先做出筛子的点数. 然后在筛子后面加上深红到浅红的径向渐变 第二步,点击窗口的符号,把准备好的筛子符号拖进去. 然后准备一个正方形,在窗口处找到3D ...

最新文章

  1. 记录一个比较完整的python项目分析架构
  2. 表单提交、页面注册案例
  3. C#设计模式(23种设计模式)
  4. linux suse 时区设置,suse设置时间服务器
  5. PM2 node进程管理工具 自动部署小结
  6. 算法与数据结构(python):树与二叉树
  7. Ajax联动下拉框的实现例子
  8. 华为鸿蒙与magic,如果荣耀Magic3搭载了屏下镜头和鸿蒙系统,你会做第一批吗?...
  9. 剖析数组名、函数名(不是指针常量,更不是指针)
  10. 数据结构中的堆和操作系统里的堆不一样为什么都叫堆呢?
  11. 【宇宙探秘】物理角度分析,蚂蚁从万米高空掉下会摔死吗?
  12. 【OpenCV】轮廓与凸包
  13. 【汇编语言与计算机系统结构笔记18】MIPS指令集与汇编程序设计 异常处理
  14. Java面试必看的18个开源项目
  15. git submodule update报错: error: Server does not allow request for unadvertised object
  16. 用 JAVA 开发游戏连连看
  17. SQlException 对象名无效
  18. 史上最全的Java面试题集锦在这里,带你碾压面试官!
  19. Sherman-Morrison-Woodbury,SMW恒等式
  20. Symantec赛门铁克官网下载地址

热门文章

  1. 云计算设计模式(十)——守门员模式
  2. [译]怎样用VisualStudio查看非托管代码
  3. Cyber​​ RT开发人员工具
  4. android中存放程序资源,Android 工程中存放各种程序资源的目录是()
  5. 论文《一种金融市场预测的深度学习模型:FEPA》(3)--EMD+PCA
  6. 新建ROS工作工作空间
  7. NOIP模拟 蛋糕(DP+Dilworth定理)
  8. 搭建基于Spring Cloud的微服务应用
  9. python-Django-01基础配置
  10. Linux 环境 搭建Git 服务器,并且修改SSH端口使用