一部手机、一位主播,成就了2020年消费领域最流行的新玩法——直播带货。除了薇娅、李佳琦等带货 KOL,很多明星、主播、甚至是企业 CEO 们也开始进入直播间带货。

在娱乐圈,直播为明星和粉丝提供了距离更近的互动平台,更是迎来了火爆的发展。例如近年来大火的歌手周深,在28岁生日当天直播唱歌,和粉丝一起过生。

2018年,国内所有直播平台的日活用户加在一起不到5000万,如今直播行业用户已达4.33亿。正如过去十年电商的崛起,离不开交通、物流等领域的持续投入,直播间经济的火爆,与人工智能、物联网等新技术的赋能密不可分。

直播中的AI技术

从主播进入直播间开始,人工智能技术就开始为人像、互动、内容监测等各个环节赋能。一场直播的顺利完成,离不开以下几项关键AI技术的支持:

人脸关键点定位与人脸分割

人脸关键点检测就是定位人脸特定位置,并通过关键点位置组合获得抽象的人脸姿态信息。而人脸分割技术可以实现从不同背景的图像中自动提取出人体目标,为后续处理算法提供基本的执行条件。

直播中的美颜功能是对人脸关键点检测+人脸分割的一个典型应用。

直播美颜就应用到了关键点检测和人脸分割

对主播进行美颜时,首先就需借助人脸关键点检测实现对人脸轮廓以及五官特征的精准定位。当人脸各个关键部分的精确位置已经确定,就可以将不同的美妆特效渲染到人脸图像上。

人脸关键点定位与人脸分割

表情识别技术支持在静态图像或动态视频序列中分离出特定的表情状态,以便确定被识别对象的心理情绪。

基于表情设计互动内容,是提升互动质量的重要途径,为人熟知的表情特效是人脸表情识别的典型应用。

去年,快手上线了一系列以“年龄渐变”为主题的魔法表情特效,利用生成式技术,一系列魔法特效可以让用户有极强的真实感体验从幼年到老年的全过程。

快手的表情特效是对人脸表情识别技术的应用

除了丰富互动的趣味性,表情识别技术的应用还有助于主播判断用户对商品或者直播内容的感兴趣程度。

手势识别

手势是一种人类的基本特征,手势识别技术的发展为主播和观众的互动以及对设备的无接触控制提供了可能。

直播课堂中的手势识别功能,图片来自InfoQ

在作业帮直播课“小组直播间”中,手势识别功能收获一众“粉丝”,成为学生互动满意度最高的功能:只要对着屏幕竖起拇指,不到 1 秒,屏幕上便会回应同样的手势,完成一次“点赞”。这就是“手势识别”AI 功能带给用户的互动体验。

人体行为识别

人工智能可以做到直播风控管理,实时检测主播人体姿态,判断其是否需要休息、动作是否具有危险性等。

行为识别有助于直播的风险管控,图片来自网络

行为识别有助于建立预警机制,提前向平台工作人员反馈信息,从而赋予直播平台感知能力。

内容识别

直播行业的弹幕审核、直播内容监管也有望通过AI技术持续改善。

当下,敏感信息审核已经广泛运用于文字和图片领域中。未来,随着视频信息审核技术和音频敏感检测技术的完善,直播视频和音频内容也有望做到实时审核。

直播的弹幕和内容审核也可以通过AI技术持续改善

在保证审核准确率达标的前提下,AI赋能内容识别将有助于改善巡管审核的不及时、人力不足、覆盖面不到位等问题。

数据助力“AI+直播”

直播的交互性和流畅感是这一互动方式爆火的重要原因之一,人工智能技术的支持更是提升了观众的体验感。数据堂在深刻理解直播场景的基础上,针对关键技术环节,推出了系列训练数据集,为“AI+直播”的发展提供助力。

数据堂严格遵守相关规定,建立了健全的安全合规体系,所采集的数据均已获得被采集人授权。

《15万张人脸106关键点数据》

该数据覆盖了多人种、多年龄段的人脸数据,能够有效提升人脸关键点定位的准确性。

](https://img-blog.csdnimg.cn/0e583de9d50b4ff9a93e306aad9ffe98.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5pWw5o2u5aCC5a6Y5pa56LSm5Y-3,size_20,color_FFFFFF,t_70,g_se,x_16)

人脸106关键点数据样例,已获得被采集人授权

综合考虑了不同场景、不同难度下的人脸特征,为了增加数据集分布的多样性,采集人员采集了多个角度的完整人脸数据以及局部遮挡人脸数据(戴墨镜或其他佩饰)。

数据还包括嘟嘴、惊讶、愤怒、蔑视等复杂表情,是一套相对完备的人脸关键点检测数据集。

《70,846张人脸抠图数据》


6张人脸抠图数据》涵盖了多人种、多年龄段的人脸五官、身体及佩饰的语义分割数据。

人脸抠图数据样例,已获得被采集人授权

该数据集部分原始数据与《15万张人脸106关键点标注数据》重合,同样考虑了不同角度、不同表情、不同佩饰下的人脸数据分布。

在标注方面,该数据集主要侧重对于人脸五官、身体、佩饰等24个局部模块的语义分割标注,是一套高质量的人脸分割数据集。

《26,129人多人种7种表情识别数据》

针对直播中表情识别的技术应用,数据堂推出了《26,129人多人种7种表情识别数据》。该数据由17,945位黄种人、3,546位白种人、3,727位黑种人、911位棕色人(墨西哥人)参与录制。

多人种7种表情识别数据样例,已获得被采集人授权

工作人员采集每位被采集者正常、高兴、惊奇、悲伤、愤怒、厌恶、恐惧的7种表情,数据多样性涵盖了不同脸部姿态、不同光照和不同场景。以表情准确度为准,精度超过97%,表情命名准确率也在97%以上。

《314,178张18种手势识别数据》

该数据集包括静态手势83,013张和动态手势97,705张,采集多样性涵盖多种场景、41种静态手势、95种动态手势、多种拍摄角度和多种光照条件。

18种手势识别数据样例,已获得被采集人授权

工作人员对21个关键点(每个关键点有可见不可见属性)、手势类别和手势属性(左手或右手)进行标注。在x,y方向上的点位置误差均控制在3个像素内,按关键点为单位,数据标注准确率超过95%。

AI+直播更多应用方向

AI与直播行业的结合实际上才刚刚开始,多家科技企业在扎实的基础上不断创新,紧跟潮流,挖掘了更多实用、有趣的应用。

AI合成主播

去年,新华社智能化编辑部与搜狗公司联合研发了新的智能产品——小微。她能随时变换发型,随时更改服装,穿梭于演播室的不同虚拟场景中……然而,小微却不是真人,她是全球首位人工智能驱动的3D版AI合成主播。

全球首位人工智能驱动的3D版AI合成主播小微

直播领域备受关注的AI合成主播技术,给直播平台带来了颠覆性的内容拓展思路。只要真人主播在镜头前说一段口播,AI技术就可以提取主播的声音、动作表情等行为特征,再结合算法的深度学习,便可诞生一个AI合成主播。

AI+直播个性化推荐

现在许多直播平台把AI技术实际运用到了直播之中,利用其进行内容分析,并作出智能优化,为观众提供更加优质的内容。

就比如拿目前最受欢迎的游戏之一绝地求生来说,虎牙直播运用AI技术建立了全新的观看模式,自动分析直播内容,让玩家更加直观的找到想看的内容。比如:决赛圈、单排、双排等功能。

依托AI技术赋能的直播产业,在内容拓展、用户体验和平台监管等方面有望再上台阶。随着AI技术与直播行业合作的不断深入,在未来,更多直播定制化的AI技术将逐步推出,并应用于各大直播平台,这将显著提高平台内容质量和服务效率。

直播还有哪些新想象?AI+直播打造更有趣的直播间相关推荐

  1. 油管与脸书皆强化直播服务功能 打造更专业的直播平台

    油管宣布强化直播服务YouTube Live以追赶市场领导者Amazon Twitch,Facebook Live及推特的Periscope. 油管逐渐放宽带道订阅户启用YouTube Live的门坎 ...

  2. JAVA商城 B2B2C商城系统 小程序 多用户商城系统 直播带货 新零售商城 o2o商城 电子商务 分销商城 直播商城 短视频商城 springcloud商城 spring cloud商

    1. 涉及平台 平台管理.商家端(PC端.手机端).买家平台(H5/公众号.小程序.APP端(IOS/Android).微服务平台(业务服务) 2. 核心架构 Spring Cloud.Spring ...

  3. Facebook称其新的AI技术可以更快发现仇恨言论

    https://3w.huanqiu.com/a/c6eeda/7Mlgbk1M9Bm?agt=20 2019-05-02 08:52 Facebook的人工智能工程师已经研发出一种称为自我监督学习的 ...

  4. 【新星计划python赛道】pygame让你一步步实现翻牌游戏(金币旋转、大头贴等),打造更有趣的新星之旅

    最近参加了新星计划,玩一下,然后我们的导师@梦想橡皮擦就提到,看能不能把我们赛道的博主的头像整成一个消消乐的翻牌游戏,我觉得挺好玩的,所以也就借这个机会试一把. 效果演示一把: 嘻嘻,有兴趣的朋友欢迎 ...

  5. 直播预告 | ChatGPT会引领AI新范式吗?

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! ChatGPT  火爆全网的ChatGPT究竟是什么?为什么这么强? ChatGPT会取代搜素引擎吗? ChatGPT凸显的能力会是me ...

  6. 互联网日报 | 理想汽车交付量突破30000辆;美团王慧文正式退休;寺库打造首个奢侈品直播基地...

    今日看点 ✦ 美团联合创始人王慧文正式退休,美团同时宣布新一轮组织调整 ✦ 百度CTO王海峰:百度技术生态已培养超过100万AI人才 ✦ OPPO Reno5系列正式开售,首销10分钟线上销售额破亿 ...

  7. 电商直播风暴来了,AI虚拟偶像彻底革命李佳琦、薇娅?

    虽说在电商直播时代"万物皆可卖,人人皆可播",但在KOL.明星.企业家等一一下场直播卖货之后,AI虚拟偶像直播卖货仍显得独树一帜. 近期,国内知名虚拟歌手洛天依.乐正绫直播卖货的消 ...

  8. 打开新经济大门 淘宝直播如何打造最有价值的直播平台?

    直播购物,已经成为当前电商市场发展的主潮流.主播生动的解说,实时与消费者互动沟通,直播让网购打破了空间上的障碍,促进了线上消费的同时,也催生出诸如李佳琦等超级网红. 作为国内首批入局电商领域的公司,阿 ...

  9. 直播电商都用上 AI 实时翻译了!歪果仁也能听懂李佳琦

    来源 | HyperAI超神经 头图 | 视觉中国 今年的「双 11」,似乎比往年来得更早一些.距离「双 11 」还有半个月,各大电商平台早已经开始摩拳擦掌,纷纷将预售时间提前,抢占先机.而每年剁手党 ...

最新文章

  1. OceanBase是如何解决城市级故障容灾的
  2. 【80端口占用】win7下80端口被(Pid=4)占用的解决方法
  3. python处理文本格式_python linecache 处理固定格式文本数据的方法
  4. UWP Composition API - GroupListView(一)
  5. 双向TVS二极管 8KP33CA参数详解
  6. oracle隐藏游标,Oracle 存储过程隐藏游标
  7. junit junit_使用junit做其他事情
  8. hive mysql元数据表说明
  9. php读取mssql中文乱码,PHP读取mssql json数据中文乱码的解决办法
  10. NMF(非负矩阵分解)
  11. Windows7配置docker配置registry-mirrors国内镜像地址,运行hello-world
  12. 针对rnnoise vad 分享
  13. 鹅厂web前端实习面经
  14. 英语单词: entropy;熵
  15. Android9中cache分区作用,清除cache分区是什么意思?
  16. 湖泊水库水雨情监测预警系统解决方案
  17. Tornado框架简介
  18. MFC界面 插入透明图片(logo)
  19. 变频器内部有C语言吗,总结变频器的常用算法,看看你是不是都知道
  20. 兔子繁殖问题,兔子有寿命限制

热门文章

  1. DX 纹理像素格式转换算法 R10G10B10A2 转 R8G8B8A8
  2. yolov3-tiny 训练。以及yolov3 画图。
  3. sap入门--配置中文界面
  4. 该模型为PMSM的脉振高频注入法识别电机在低速下的位置,注入d轴,信号进在q轴进行幅值调制经LPF得到转子误差信号
  5. 【计算机科学基础】程序的编译与运行
  6. KITTI VOC COCO 在线国内下载/百度云
  7. 乌班图安装docker
  8. 计算机打字手怎么放,打字时如何正确放置手指
  9. WPS表格 - Excel数据按颜色求和
  10. 推荐几款通用的数据库管理工具