(图片付费下载自视觉中国)
文 / LiveVideoStack主编 包研
在8月的LiveVideoStackCon2019北京开场致辞中,我分享了一组数据——把2019年和2017年两场LiveVideoStackCon上的AI相关的话题做了统计,这是数字从9.3%增长到31%,超过三成的大会演讲内容与AI相关。多媒体技术生态只是真实世界的缩影,反映出AI正在与各行业、各种结束结合。包括CSDN在内,大大小小的机构推出各种AI学习课程、图书正迎合了这一趋势。
相对而言,AI的学习曲线比较友好,上手相对容易,只要会Python或其他高级语言,掌握1-2个机器学习的框架,可以很快跑出结果。不过学习多媒体就没那么美好了,据说搞多媒体的研究生,先要用1-2年把H.264标准通读并理解,真正的研究还没有开始。我相信,同等水平的学生用同样的时间去搞AI,出几个paper,拿若干大厂的offer是可能的。我记得在4月的LiveVideoStackCon上海大会上,一名北大的教授就感叹:
你只要想多媒体技术,学编解码,别说是数学专业的,就算是英文专业、历史专业的我也收。
那么AI与多媒体技术有哪些结合的地方呢?
内容理解:AI内容理解并不限于生成封面图,精彩剪辑,或者只看某个角色的镜头,这在内容推荐、广告平台有帮助。此外,内容理解还能帮助更好的处理视频,比如可以针对不同的视频内容选择不同的Codec,以及相关的编码工具。
图像增强:比如,将SDR转换为HDR视频,视频超分(将720p变成1080p),每秒30帧视频变换为每秒60帧等等。
AI与ABR:AI的出现可以进一步提升ABR的效果,最著名的要数MIT提出的Pensieve。
语音识别与语音合成:从Siri到小冰,从智能手机到智能音响,语音识别已经无处不在。而语音合成则是让电脑把文本变成语音,比如Google开源的Tacotron已经可以实现99%的人声还原。
回声消除:在一些低端的Android设备上,如果只有一个麦克风就需要利用AI来帮助消除回声,效果非常不错。
声纹——人声识别与音乐识别:DNN可以掌握更多的声音特征,从而降低风险。而在音乐识别方面则没有那么高风险,各大音乐App都集成了相关的功能。
在LiveVideoStackCon 2019深圳上,自然少不了AI相关的话题:
  • 香港城市大学计算机科学系助理教授王诗淇——基于视觉感知特性的视频编码

  • 51talk高级技术总监陈靖——深度学习在语音降噪中的应用

  • 网易易盾 资深算法专家李雨珂——音视频内容审核中的人工智能

  • 相芯科技 资深图形引擎开发经理蔡锐涛——AI驱动的沉浸体验新玩法

  • 学而思网校技术总监李金瑞——学而思网校QoE优化实践

了解更多讲师信息可点击阅读原文,使用邀请码【CSDN】购票更可获得惊喜优惠!

从多媒体技术演进看AI技术相关推荐

  1. 小明医声发布,看AI技术秀得飞起

    "小明医声"是百诺明医说旗下的一款家庭智能健康机器人,内置语音交互式人工智能系统,专为整个家庭成员设计,上至老人.下至小孩,是一款综合性的集娱乐.甲醛监测.健康教育.健康管理为一体 ...

  2. AI 技术越来越平民化,程序员不想被淘汰该怎么办?

    不久前,B站上独立游戏开发者大谷上传的一则"修复100年前老北京影像"视频带火了一项技术--AI修复.通过AI技术手段,100年前的老旧黑白影像变得更加清晰,还原了彩色世界,让人一 ...

  3. 阿里巴巴开源AI技术:强化学习在阿里的技术演进与业务创新

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 当前的机器学习算法大致可以分为有监督的学习.无监督的学习和强化学 习(Reinforcemen ...

  4. 「技术综述」有三AI不得不看的技术综述

    https://www.toutiao.com/i6715153780863664653/ 文/编辑 | 言有三 最近遇到了很多新手来交流,网上资料甚多,筛选有时候是个大问题,一般遇到一个新方向,找技 ...

  5. 【杂谈】篇篇精华,有三AI不得不看的技术综述(超过100篇核心干货)

    文/编辑 | 言有三 有三AI很少写零散的报导,因为我们的文章通常都是提炼与总结,一般遇到一个新方向,找技术综述读一读是最合适的开始,大家也可以拓展一下自己的知识边界,今天总结一下有三AI迄今为止发过 ...

  6. 【杂谈】循序渐进,有三AI不得不看的技术综述(超过100篇核心干货)

    文/编辑 | 言有三 有三AI很少写零散的报导,因为我们的文章通常都是提炼与总结,一般遇到一个新方向,找技术综述读一读是最合适的开始,大家也可以拓展一下自己的知识边界,今天总结一下有三AI迄今为止发过 ...

  7. 【总结】循序渐进,有三AI不得不看的技术综述(超过100篇核心干货)

    文/编辑 | 言有三 有三AI很少写零散的报导,因为我们的文章通常都是提炼与总结,一般遇到一个新方向,找技术综述读一读是最合适的开始,大家也可以拓展一下自己的知识边界,今天总结一下有三AI迄今为止发过 ...

  8. 【杂谈】有三AI不得不看的技术综述(超过100篇核心干货)

    文/编辑 | 言有三 有三AI很少写零散的报导,因为我们的文章通常都是提炼与总结,一般遇到一个新方向,找技术综述读一读是最合适的开始,大家也可以拓展一下自己的知识边界,今天总结一下有三AI迄今为止发过 ...

  9. 【技术综述】有三AI不得不看的技术综述

    文/编辑 | 言有三 最近遇到了很多新手来交流,网上资料甚多,筛选有时候是个大问题,一般遇到一个新方向,找技术综述读一读是最合适的开始,今天总结一下有三AI发过的技术综述. 25篇CV工程师进阶文章 ...

最新文章

  1. IDEA中引用不到HttpServlet的解决方案
  2. hadoop 启动提示输入password的问题
  3. 关于showmodaldialog的问题处理
  4. 计算机能模拟图灵机吗,关于计算机科学:图灵机与冯诺依曼机器
  5. MDK寄存器地址映射分析
  6. Linux Unbunt 安装显卡驱动 简单方法
  7. Oracle中随机抽取N条记录,使用Oracle分析函数随机抽取N条记录
  8. JQuery插件让图片旋转任意角度且代码极其简单 - 摘自网友
  9. WCF如何使用X509证书(安装和错误)(二)
  10. 易宝典文章——玩转Office 365中的Exchange Online服务 之二十八 怎样过滤病毒***邮件...
  11. 第十节 直流变直流电路(DCDC)芯片选型
  12. iOS 音乐播放器的实现
  13. webpack 5.5.1 compiled with 1 error in 63 ms
  14. python爬虫笔记五:汽车之家贴吧信息(字体反爬-动态映射)
  15. flume高并发优化——(9)配置文件交由zookeeper管理
  16. 有关vue转换时间为年月日格式
  17. 机器学习中,如何判断蕴含式值的真假?
  18. 计算机右键属性 资源管理器崩溃,Win7资源管理器崩溃,真凶竟是右键菜单
  19. Facebook如何用大数据
  20. 如何用 Sprite Kit 和 Swift 制作一个逃逸游戏-第一部分

热门文章

  1. InstallShield 2015 LimitedEdition VS2012 运行bat文件
  2. [AWK]使用AWK进行分割字符串以及截取字符串
  3. jQuery EasyUI 表单插件 - Datebox 日期框
  4. IHttpHandler 在SharePoint中的应用
  5. 回到未来 – 大胆畅想如何追赶并超越腾讯模式
  6. Android Studio Day03-1(Android studio 系统界面简介)
  7. OSPF 提升 一 ----基础
  8. 20169211 2016-2017-2 《移动平台开发实践》 第十周实验总结
  9. Behave step matcher
  10. C语言程序设计50例(一)(经典收藏)