头图 | 下载于ICphoto

出品 | AI科技大本营(ID:rgznai100)

互联网内容越来越朝着视频化方向发展,短视频处于爆发期,一些不法分子试图利用视频风口牟利。3月底,深圳警方打掉了一起以短视频APP为载体,大肆从事淫秽传播、网络赌博以及网络诈骗等犯罪活动。

最近,阿里安全图灵实验室发布了一项关于社会文化的研究,这是一种新型视频描述方法(SGR),可用于视频内容安全和视频检索等场景,助力建设互联网清朗环境。该研究成果已经被人工智能国际顶会CVPR2021(oral)收录。

1

让AI做“阅读理解”

现有的密集型视频描述生成方法采用自底向上的方式,即先生成大量的事件候选片段,再为每个片段独立的生成描述,从而组合得到密集型视频描述。然而,视频中事件具有很强的多样性,既可以简单到是一个动作,也可以复杂到是若干事件的组合,这导致事件候选片段的生成目标不明确,对应的密集型描述不够连贯和准确,且充斥着大量冗余。

对此,研究者提出了自顶向下的密集型视频描述方法,即SGR。

SGR可以实现两类基本功能,一是让AI对视频内容做“阅读理解”,生成一段长文本描述视频中心内容,二是可以根据描述性的文本精准匹配视频中的相关片段。

此前,必须人工定义关键词词库后才能“指挥”AI命中检索,这项AI技术的目标是仅通过输入自然语言就能实现检索,对AI“说句话”,就能找到相应片段。

“视频中如果有人拿起鼠标,点击电脑,然后脱掉衣服,呈现黄赌毒等相关违规信息,以前的技术路径上,AI可能还要分析脱掉衣服之前的动作,其实拿鼠标和点击电脑与后面的违规内容没什么关联,无需提取这些信息。”该研究第一作者、阿里安全图灵实验室实习算法工程师青崧介绍道。

SGR解决了这个问题。给定一个视频,AI可对视频的关键候选片段无缝衔接成一个完整的故事,保证了密集型描述的连贯性,且减少了冗余。

为了进一步增加视频片段的描述细节,研发人员设计了描述提升模块,以初步得到的密集型视频描述和视频片段为基准,提出专用于描述质量提升的强化学习策略,来生成细节更丰富的密集型视频描述。方法结构如下图所示:

输入一段视频,本方法首先使用一个视频编码器()来为所有视频帧提取表征。接着,段落解码器()根据视频帧的表征生成一段由多句描述组成的段落。然后,由描述定位器()对段落中的每句描述在视频中的发生时刻进行定位。最后,描述提升模块,即描述解码器()接受由输出的视频片段描述和由定位出的视频片段表征,并输出细节更丰富的视频片段描述。

该项研究的共同作者、阿里安全图灵实验室高级算法工程师雍秦介绍,虽然目前这个技术还无法做到“1分钟讲清楚一部电影”,但可做到“两句话讲清楚一个10分钟以内的短视频”,这意味着通过该技术未来可迅速判断整个视频的关键信息是否包含黄赌毒等违规内容。

2

更快更准识别违规风险内容

通过这两个功能,AI能快速识别、准确定位违规片段,无需人类鉴黄师反复回看确认。

雍秦透露,在SGR技术研究基础上,阿里安全近期还将研发低门槛、高可用的“鉴黄”AI工具,让AI对视频不同片段打出“危险指数”,依赖信息提取直接关联高亮风险片段,让AI鉴黄更智能、高效。

未来,在实际应用场景中,通过AI来进行不良内容识别的研判准确性和效率将大幅提高,比如判断视频内容中是否有“一个穿着暴露萝莉装的女孩鸭子坐着在录吃播”,以往要形成“暴露萝莉装”“鸭子坐”“吃播”三个标签,每次依据一个标签进行一轮审核,判断视频内容是否涉嫌低俗,三轮审核交叉验证。创新工具应用后,AI只用输入“一个穿着暴露萝莉装的女孩鸭子坐着在录吃播”这句话进行一轮研判,准确性也更高。

图说:阿里安全近期将研发低门槛、高可用的“鉴黄”AI工具,该图为示意模型。

阿里安全图灵实验室资深算法专家华棠指出,阿里安全一直希望从源头守护安全,这是阿里安全方法论“新一代安全架构”的核心理念。“互联网上每天产生海量视频,单靠人力无法维护互联网清朗环境,违规视频危及大众心理健康和财产安全,创新算法可以有更多用武之地,构建美好安全的网络生活。”

作者简介:邓超睿,阿里安全实习生,阿德莱德大学一年级博士,主要研究视频理解、图像理解,物体检测等方向,在TPAMI、CVPR、ECCV等学术期刊和会议上发表多篇文章,目前从事视频物体检测和检索的研究工作,利用创新算法提升视频内容安全的审核技术。

加入问答 VIP
领域专家将为您耐心解惑
千万开发者与您同行!
????????????扫码添加小助手
即可免费领取问答机会

阿里研发 AI 黑科技,有望替代人工鉴黄师相关推荐

  1. AI黑科技 | 宏碁研发智能穿戴设备:智能佛珠

    你好,欢迎走进本期AI黑科技栏目.请问最近工作顺利吗?家庭幸福吗?生活美满吗?宏碁刚发布的智能佛珠要不要了解一下? 是的,你没走错片场,作为老牌电脑厂商的宏碁( ACER ),的确发布了这样一款产品- ...

  2. 详解冬奥冠军背后的AI黑科技

    在北京冬奥会上有一项黑科技引发了广泛的关注,就是英特尔® 3DAT三维运动员追踪技术(3D Athlete Tracking,3DAT).中国速度滑冰队夺取北京冬奥会速度滑冰男子500米比赛金牌并刷新 ...

  3. 速围观!上千款“AI黑科技”在此集结

    尬舞机器人.AI虚拟主播.自动驾驶车.5G无人机.仿生人形机器人,在 AIExpo 展会上可谓吸足了眼球. 8月14日,全球人工智能产品博览会(AIExpo 2020)在苏州国际博览中心盛大启幕. 为 ...

  4. 北京冬奥会“科技感”拉满,有这些AI黑科技你了解吗?

    2022年2月20日,随着闭幕式圆满举行,2022北京冬奥会也正式落下帷幕. 让我们先来恭喜一下中国代表团:9金4银2铜! 这是什么概念?首先,9枚金牌已经是中国代表团参加冬奥会有史以来最好的成绩!其 ...

  5. 【学习求职必备】百度AI和它的7大AI黑科技

    jenny 在读研究生一枚~ 作者 | jenny 编辑 | jenny 接着上一篇介绍国内的重要研究院,这是第二期的介绍,也是国内最大的AI生态 01 简介 百度研究院隶属于百度AI技术平台体系(A ...

  6. 【行业进展】谷歌4大AI黑科技部门,你可知

    李毅 吉林大学 计算机视觉方向 作者 | 李毅(微信号:wxid_gdsyjoprueeaq12) 编辑 | 言有三 作为科技界的执牛耳者,谷歌在人工智能领域的实力有目共睹,本文将介绍谷歌AI黑科技产 ...

  7. 当AI黑科技撞上大数据日:清华大学第四届大数据日成功举办

    春风送暖,万物芳华,清华大学迎来了她107岁生日:值此之际,清华-青岛数据科学研究院(以下简称"数据院")在2018年4月26日C楼前广场举办了主题为--"AI黑科技进清 ...

  8. 楚留香ai人脸识别_戴口罩居然也能人脸识别?这些AI黑科技真的藏不住了.........

    当人工智能遇见影像技术,将会释放出多少意想不到的巨大能量? 「喔图·知图实验室」瞄准当下的影像痛点,持续发力升级AI黑科技,带来两大必杀技--人脸识别再度升级.AI智能旋转校正. 戴口罩也能识别--人 ...

  9. 七夕新浪漫,让AI黑科技带你们提前看看爱情的结晶

    关注公众号,发现CV技术之美 七夕不知道如何表白?送花吃饭太没新意又太露骨? 今天小编给大家介绍一个AI黑科技,能够完美融合任意两张人脸,并带有丰富的表情,让你不仅凡尔赛地炫个技,还能巧妙风趣地表个白 ...

最新文章

  1. sql对应C#的类型
  2. 成功解决AttributeError: Parent variable ‘<Variable: ID (dtype = numeric)>‘ is not the index of entity En
  3. 复杂网络表示的原理,算法和应用
  4. 前端工程化系列[03]-Grunt构建工具的运转机制
  5. (*长期更新)软考网络工程师学习笔记——Section 18 计算机硬件基本知识
  6. Eclipse plugin folder
  7. go 语言 php并发,go 语言并发
  8. 解决win7下打不开虚拟机的情况
  9. jquery版本之间的冲突
  10. 2018.3.3idea破解(亲测可用)
  11. FMS3.5的安装使用
  12. Datawhale组队学习周报(第034周)
  13. POJ 3097 Falling Ice 笔记
  14. SCSS 和 Sass 有什么区别?
  15. 转载 : 10大H5前端框架
  16. Android应用开发性能优化完全分析,移动应用开发课程报告
  17. 浅谈MB、Mb、MBps、Mbps - 计算机常识
  18. 基于智能和视觉的火灾检测系统:调查 (论文翻译)
  19. 联发科heli p90_“如果您是Java开发人员并且正在编写微服务,那么Helidon是一个不错的选择”
  20. 响应键盘的上下左右键

热门文章

  1. Kotlin——高阶函数详解与标准的高阶函数使用
  2. C Traps and Pitfalls
  3. 利用MATLAB进行数据的批量拟合和预测
  4. vscode配置ESLint+Prettier - Code formatter+Vetur
  5. 【FXCG】人民币中间价报6.3401,下调58点
  6. 软件设计师6:多媒体
  7. Top-k高效用项集挖掘_学习笔记(三) TKO
  8. 最后一次谈开源与免费
  9. 变分自编码器VAE ——公式推导(含实现代码)
  10. GlobalMapper20:10分钟根据CAD、shp等离散高程点生成一份精准边界的地形数据