人工智能为多媒体服务带来了更多、更有价值的新功能,让你的媒体、你的video更加智能化,帮助用户获取更好的体验。微软大中华区创新技术合作事业部 (CSE)资深技术顾问梁建为我们分享了人工智能与媒体服务的契合以及未来的发展方向。

class="video_iframe" data-vidtype="2" allowfullscreen="" frameborder="0" data-ratio="1.7647058823529411" data-w="480" data-src="http://v.qq.com/iframe/player.html?vid=u0539ufnht0&width=638&height=358.875&auto=0" style="display: block; width: 638px !important; height: 358.875px !important;" width="638" height="358.875" data-vh="358.875" data-vw="638" src="http://v.qq.com/iframe/player.html?vid=u0539ufnht0&width=638&height=358.875&auto=0"/>

大家好,我是来自微软创新技术合作事业部的梁建,很高兴接受LiveVideoStack的邀请,跟大家一同介绍和畅想媒体服务video在未来2018年可能的发展。

2017年,我们经历了整个媒体行业视频服务、视频处理的快速发展,与此同时人工智能和区块链也是去年的热点话题,那我们就一起来看下人工智能和我们的媒体服务如何进行结合。

人工智能帮助我们实现更多场景

传统的媒体服务都会做哪些事情?比如线上直播、编解码、内容保护等等的服务,但随着人工智能技术的发展,很多媒体行业或者媒体业务处理行业的朋友,也在探索如何将人工智能应用到现在的媒体技术和行业发展上,包括视频的发展上。

大家可以思考下在哪些场景上人工智能技术能帮助我们实现更多的场景?比如如何在越来越多的视频中发现更好的、更需要的内容;如何让视频内容里人物之间产生关系;在视频编辑和处理过程中,如何增加字幕的信息以及多语言的支持;如何让视频自动的增加评论,像大家熟知的视频里中比较流行的弹幕;以及如何让视频里产生更多的价值,比如在视频里如何更好的嵌入广告,让视频自动的把对用户的洞察力、想法展现出来。

人工智能让媒体服务更“聪明”

这里我也想跟大家介绍在微软的Azure云平台上有一个Media Services媒体服务,它不仅仅包括了传统的视频直播、Encode、Decode这种编解码能力、内容保护能力,以及多渠道、多设备的Player的能力。它还提供了Video AI的能力。也就是除了在这个传统的Midea Services架构上,我们可以能帮助大家产生支持多种设备的流媒体Streaming的格式。同时它还 提供了Media Analytics媒体分析,它能够从视频汇总产生一些洞察力,帮助大家降低人工成本,同时自动拿到更多的信息。

在微软的Media Analytics服务中,它融入了非常丰富的人工智能技术:Audio Transcript能够通过语音视频自动生成字幕信息;通过人脸检测知道视频中出现了哪些人物;通过视频OCR把视频中非数字的信息转化为数字的文字信息;根据视频中人脸的信息,选取人物自动增加人脸修正;通过Video summaries智能生成视频的总结或片段,比如一个小时的视频生成出一分钟的预告或者介绍;Content moderation可以智能审核内容信息,比如成人信息、用暴力等等;以及通过比较流行的DNN深度学习算法、神经网络来实现物体的识别。此外还有视频的稳定、情绪识等等。由此我们可以预见在2018年,除了传统的视频编解码、视频流以及最新的视频格式外,人工智能技术会给我们产生更多的价值,同时帮助我们降低成本。除了以上介绍的10种AI服务,我们也相信在2018年微软还将提供更多的智能服务,也欢迎大家持续关注微软Azure Media Services平台。

除了传统服务,微软还提供了五大方面29类的认知服务,而这29类服务又分别都提供了自己相关的API,它不仅可以用在传统的图片、语音识别、知识搜索,你可以非常方便地将它应用到自己的媒体服务中。特别的,我们还有一个最新的服务Video Indexer,我们前面提到的10种人工智能服务都包含其中,包括translater——无论文字或者语言的,这样对于一个视频,它就会自动根据你的需求去进行说语音识别、人脸识别、字幕翻译、多语言翻译、视频内容总结、场景分析等等。那如果你希望视频有更多的拓展,比如知识搜索就非常重要,你可以根据视频去搜索相关的视频、图片,同样的你还可以进行新闻的搜寻。

这里我们还提供了Custom Services——从视觉、到语言理解、到语音服务、到搜索都有一个定制化的体验。其实我们的API都是通用的,只不过定制化的场景、训练的数据是需要大家来提供。比如你希望在视频服务中为用户做更多的拓展搜索,但又并不希望进行全网搜索找到一些不想要的信息,那么此时你就可以利用Custom Search定义相关的网站和希望的内容,从而得到你规定的信息。语言理解上,大家可以很方便地把一些用户在视频聊天对话中,给他的关键词、用户所要的意图、定义一些场景,通过自然语义理解抽取出来。包括我们说的Custom Vision可以通过frame这种方式把视频中的一些场景、物体识别、场景给他抽取出来,让我们的视频不仅仅是传统中的观看、编码、streaming,同样的你也可以通过人工智能拿到更多的信息。

最后,我也希望在2018年有越来越多的媒体制作、开发的合作伙伴一定将人工智能技术用起来,让你的媒体、你的video更加智能化,拿到更多的信息。同样,我相信在2018年我们和LiveVideoStack音视频技术社区会有非常多的合作,也特别希望把更多的人工智能技术、更多的Media Services的服务给大家介绍出来,帮助大家更好的工作,同时带来更多的体验。也预祝LiveVideoStack社区越办越好,吸引更多的开发者,能够汇集开发者、汇集我们这些做人工智能、做媒体服务的合作伙伴,谢谢大家!

展望2018:人工智能为媒体服务赋能相关推荐

  1. “人工智能+新媒体”论坛热议媒体智能之道,AI推荐系统成转型关键

    11月6日,第四范式主办的 "2018人工智能+新媒体论坛"在京召开.本次论坛聚集了众多资深媒体人士及AI行业代表,对人工智能与传媒技术相融合的创新案例进行了分享与研究.论坛上,针 ...

  2. 信通院2018人工智能发展白皮书技术篇重磅发布

    来源:网路大数据 9月6日,2018中国人工智能峰会(CAIS2018)在南京国际博览会议中心召开.斯坦福客座教授吴恩达以Landng.ai创始人.CEO的身份出席了峰会,并在主论坛上做了题为< ...

  3. 平安好医生王涛:“互联网+人工智能”重塑医疗服务

    -让中国人每人都有一个家庭医生 上海2018年11月9日电 /美通社/ -- 在互联网和人工智能技术飞速发展的今天,不断涌现的新技术.新业态.新产品.新服务,切切实实改变了人们的生活.然而,看病难.排 ...

  4. 【每日新闻】迅雷创始人程浩:互联网下半场的三大关键词,人工智能、企业服务和线上线下融合 | 商务部:中英将共建雄安金融科技城

    每一个企业级的人  都置顶了 中国软件网 中国软件网  为你带来最新鲜的行业干货 小编点评 人工智能 企业服务 线上线下融合 记住关键词 下半场 我们要抓住时机啊! 趋势洞察 迅雷创始人程浩:互联网下 ...

  5. 学会动态丨中国人工智能学会重磅发布《2018人工智能产业创新评估白皮书》

    来源:中国人工智能学会 摘要:<2018人工智能产业创新评估白皮书>由中国人工智能学会.国家工信安全中心.华夏幸福产业研究院.思保环球联合发布.白皮书聚焦人工智能的使能技术与应用场景两个层 ...

  6. Gartner:2018人工智能技术成熟度曲线

    https://www.secrss.com/articles/4392 人工智能被广为关注,但是一些想法恐难达到预期.本成熟度曲线将追踪AI基本趋势和未来创新,以确定人工智能技术发展的范围.状态.价 ...

  7. 埃森哲全球“技术展望2018”报告解析(附下载链接)

    <埃森哲技术展望>报告融合了顶尖技术研究团队.行业领袖以及全球数据调研结果,发布未来三年内或将对各行各业产生重大影响的技术趋势判断,作为企业布局新战略的指导(关注公众号,在公众号回复&qu ...

  8. 展望2018音视频技术:AV1,AI,区块链,WebRTC

    编者按:音视频技术的历史可能要追溯到19世纪末--特斯拉与爱迪生的伟大时代.直到今天,他们的发明依然伴随我们生活的每时每刻.2018年音视频技术将有哪些突破?来自学霸君的资深架构师袁荣喜从编解码器.客 ...

  9. 大数据早报:路桥率先利用“人脸识别”技术监管医保 亚马逊与微软联合开发人工智能,打造服务大众的AI(10.19)

    数据早知道,上乐投网看早报! 『数据安全』微软内部Windows漏洞数据库曾被入侵:后果可怕 作为这个星球上覆盖率最高的操作系统,Windows的一举一动都影响着大家的使用体验,对于它的安全微软也是相 ...

最新文章

  1. 《JavaScript 闯关记》之原型及原型链
  2. AI框架你只会调包,这种想法很危险!
  3. 如何获取FragmentTabHost中指定标签页的Fragment
  4. Android之Base64
  5. php算法两数之和 复杂度,每天一道leetcode算法题:两数之和-php版
  6. swift获取图片像素颜色值
  7. jupyter notebook安装相关问题
  8. SLAM_BA中重投影误差e 关于相机位姿扰动量δξ 的雅克比矩阵J 公式推导
  9. android测试中如何控制wifi
  10. [zz] 海洋环境的光能传递
  11. 学习《华为基本法》(8):人力资源管理准则
  12. 洛谷P3373线段树2
  13. 微信小程序渲染图片报错:[渲染层网络层错误] Failed to load local image resource
  14. 31游戏。(Geoffrey Mott-Smith(1954)) 分析
  15. 文件中查找并删除feff
  16. 查看Linux系统有几块网卡
  17. excel、kml相互转换升级日志
  18. 时间序列预测:指数平滑法及python实现
  19. 高德地图使用、echarts地图等地图设置
  20. WUSTOJ 1279: Wallace and His Pet(Java)

热门文章

  1. 自动化测试和手工测试
  2. 五周第四次课(4月23日)
  3. 剑指offer 回溯法 面试题12 矩阵中的路径 面试题13 机器人的运动范围
  4. Java7的异常处理新特性-addSuppressed()方法等
  5. 运维监控之Nagios实战(五)Nagios QL3.11
  6. 洛谷 - P1989 无向图三元环计数(思维建图)
  7. CodeForces - 1321B Journey Planning(思维)
  8. HDU - 5667 Sequence(矩阵快速幂+费马小定理降幂)
  9. android 点击item跳转页面,Android RecyclerView Item 点击事件,简单
  10. 特征值与特征向量_机器学习和线性代数 - 特征值和特征向量