作者 | Rachel、Just

出品 | AI科技大本营(ID:rgznai100)

移动互联网时代催生了大量的多媒体数据,每天在社交平台、长短视频、直播平台、新闻资讯等内容平台产生了数以亿计的图片和视频,这些数据的内容审核面临严峻的挑战。人工审核显然费时又费力,这时,以计算机视觉为代表的 AI 技术开始大显身手。

诸多相关业务的平台推出了相应技术平台,有着庞大内容生态的腾讯也不例外。成立于 2012 年的腾讯优图实验室承载着腾讯在计算机视觉领域的研究内容,专注于图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地,因此,优图也推出了基于深度学习算法的自研内容审核一站式平台:DeepEye。

该平台集色情内容识别、暴力恐怖内容识别、涉政敏感内容识别、低俗行为识别、Logo 识别等业务于一身。如此庞杂的识别业务背后,我们不禁要问:DeepEye 平台与其他内容审核平台相比有何技术特点?优图在图像和视频理解领域又有哪些技术创新?多模态机器学习是否会成为视频内容理解技术的主要研究方向?

作为 5 月 25 日-5 月 27 日即将在杭州举办的 CTA 大会(官网:https://dwz.cn/iSZ7BQUR)机器学习论坛的演讲嘉宾,AI科技大本营就上述问题采访了腾讯优图实验室高级研究员彭湃。

彭湃,2016 年加入腾讯,负责优图实验室深度学习和图像理解方向的技术研究和项目落地,主导包括 Qzone 相册、腾讯觅影、优图天眼、DeepEye 等重点项目的研究与落地。曾发表多篇研究论文,并被 CV 领域国际顶级会议和期刊(SIGIR x3、TKDE、UbiComp、MM、CIKM、ICMR等)收录。

以下为采访内容实录:

AI科技大本营:您个人在腾讯优图发表了一些高水平会议论文和期刊文章,目前最满意的是哪一篇?在发表论文方面,有什么经验可以分享?

彭湃:关于论文发表方面,其实优图实验室非常鼓励大家在平时的工作中,把一些在项目中发现的好用的模型、方法、Trick 沉淀为高水平论文,一方面是升华对问题更加深刻的理解,另一方面也提升了自己和部门在学界业界的影响力。

AI科技大本营:近几年,你们在图像和视频理解领域取得了哪些新的技术进展?

彭湃:优图实验室近期在场景化的方向取得了比较大的进展,比如一个关键的核心技术就是行人重识别的技术,我们创新性地提出了基于金字塔结构的行人视觉特征学习算法,该算法发表在计算机视觉领域顶级会议 CVPR 2019 上,并在行人重识别的 3 大数据库刷榜第一。

AI科技大本营:优图内部主要的的考核目标是怎样的?你们是如何平衡科研和工程落地的?

彭湃:优图实验室的理念是做“实用”的前沿技术,这里的“实用”是指我们探索和沉淀出来的核心前沿技术,是要能够用在实际项目落地中去,真正地服务好用户和企业。因此,我们大多时候都是从我们手头上正在做的实际项目出发,思考当前场景下核心的技术挑战和难点是什么,这样抽象出来的问题非常具有实用价值,我们把这种模式的科研思维称为业务导向的研究思路。

AI科技大本营:您个人获得过公司级业务突破奖以及技术突破奖各 2 次,能否具体介绍下内容审核技术上取得了何种突破?

彭湃:我觉得所有的奖项授予的并不是个人,而是团队。在内容审核中,尽管当前的深度学习模型几乎都在高性能 GPU 上训练,但是业务落地大规模部署的场景,大量的 GPU 成本昂贵,因此 CPU 部署通常是业务上性价比更高的选择,但缺点是推断(Inference)耗时长。考虑实际业务中,正常图片还是占比较大,因此我们的解决思路是训练一个浅层的小模型和深度的大模型,小模型用来过滤掉大多数的正常图片,只让有异常的图片进入到大模型。这样的级联模型部署方式可以大大降低业务方的部署成本。

AI科技大本营:内容审核对于视频网站而言是非常重要的工作内容,腾讯优图针对视频审核开发了专门的平台 DeepEye,该平台与其他企业的内容审核平台相比有哪些独特性?

彭湃:DeepEye 是优图实验室维护互联网内容生态健康而打造了一套基于深度学习算法的内容审核平台,该平台具备色情内容识别、暴力恐怖内容识别、涉政敏感内容识别、低俗行为识别、Logo 识别等。考虑到内容审核场景面临的大都是数据吞吐量较大的业务,大量的 GPU 部署将提高业务成本,因此在算法设计和选型上,我们并没有过分依赖于单一的深度模型,而是采用了浅层小模型和深层大模型级联的方式,这种部署方式可以快速在 CPU 上实现大规模的并行部署,大大降低成本。

AI科技大本营:未来几年,多模态机器学习会是视频内容理解技术的主要研究方向吗?

彭湃:是的,多模态的信息融合要比单一模态来的更加有效果。以内容审核场景为例,有时候不仅仅是某张图像本身的视觉内容有问题,而是图像上面的文字、数字出现了涉黄、涉政字眼,这时候只有图像语义理解的单一能力就无法搞定此类 case,而结合 OCR 以及词库过滤就可以更好地解决这类问题。

(*本文为 AI科技大本营原创文章,转载请联系微信1092722531

CTA核心技术及应用峰会

5月25-27日,由中国IT社区CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会将在杭州国际博览中心隆重召开,峰会将围绕人工智能领域,邀请技术领航者,与开发者共同探讨机器学习和知识图谱的前沿研究及应用。

更多重磅嘉宾请识别海报二维码查看。CTA深度培训已经开课,主会议倒计时 1 天,少量余票即将售罄,欢迎点击阅读原文购票参会!更多详细信息15101014297,备注“CTA”,了解票务以及会务详情。

推荐阅读

  • 危机加剧:ARM釜底抽“芯”,华为腹背受敌

  • 面对996,程序员如何利用“碎片时间”涨薪?

  • 权威解读 GitHub、Apache 疑云:主流开源软件究竟是否会被闭源?

  • Kaggle季军新手笔记:利用fast.ai对油棕人工林图像进行快速分类(附Python代码)

  • 程序员连拿3份Offer,每份高达45K?他说做对了这些!

  • ARM到底是一家什么样的公司?

  • 为什么你写了一万小时的代码,却没能成为架构师?| 程序员有话说

  • 别怀疑,孩子在家里也能学编程!

  • 百花村区块链山的选民们, 超有趣!

点击阅读原文,了解CTA核心技术及应用峰会」

色情低俗、暴力恐怖内容...如何用AI“一网打尽”?相关推荐

  1. 抖音运营规则讲解系列(3):色情低俗内容具体划分丨国仁网络

    亲爱的朋友,大家好,我是猫哥,专注互联网创业项目8年之久,至今也还在这条道路上向前驰行,也是我们唯一弯道超车的机会. 短视频自媒体也是我们团队从18年年初开始操作的项目之一,到现在也还在运营中,因为我 ...

  2. 以微信为例,聊聊在内容推荐上AI的一些应用实践

    本文由作者 吾某 发布于社区 内容推荐一直是流量分发中十分常见的应用方向,如头条的资讯.抖音的短视频.网易云音乐等等. 而微信也从去年开始逐渐推出更多内容产品服务,包括视频号.直播.看一看等等.对于微 ...

  3. 以ChatGPT写诗为例,教你如何用AI软件创新性提问?

    想用AI软件创作出动人的诗篇吗? ChatGPT 是一款人工智能软件,可以帮助你创作鼓舞人心的诗歌.它为您提供了一个强大的平台来探索您的创意方面.通过一组简单的问题,您只需点击几下就可以生成令人惊叹的 ...

  4. 如何用AI玩转IG广告,打造高互动的引流营销?

    如何用AI玩转IG广告,打造高互动的引流营销? 相信做引流的卖家,都有接触过IG广告,然而流量引过来了,怎么处理客户的私信? 私信对话是你与粉丝培养深度关系的管道,好的互动不仅能养成高黏着度的铁粉,更 ...

  5. AI落地:如何用AI做出可用的PPT?

    ChatGPT问世以来,很多工具都有了AI版.原来让我们头疼的PPT,这不现在也能一键生成了. 看了网友分享的各种一键生成PPT技术,真是牛. 很快没错,但是...缺点你是一句不提啊. PPT做成这样 ...

  6. 微信群充斥低俗暴力 互怼岂能突破道德法律底线

    互喷群对骂群互撕群等微信群充斥低俗暴力专家提出 微信互怼岂能突破道德法律底线 □ 本报记者 陈磊 "群里的信息太辣眼睛了." 回忆起前几天被拉进一个微信对骂群的经历,在北京工作的白 ...

  7. Unity AI副总裁Danny Lange:如何用AI助推游戏行业?

    本文讲的是Unity AI副总裁Danny Lange:如何用AI助推游戏行业? , 10月26日,在加州山景城举办的ACMMM 2017大会进入正会第三天.在会上,Unity Technology负 ...

  8. 机器学习模型 知乎_知乎CTO李大海:谢邀,来分享下内容社区的AI架构搭建与应用...

    谢邀!知乎 CTO 来分享下内容社区的 AI 架构搭建与应用. 「在信息爆炸的互联网海洋中,有价值的信息仍然是稀缺的」.知乎的诞生源于这样一个非常简单的初心. 而在挖掘真正有价值的信息过程中,知乎很好 ...

  9. 怎么用ai做出适量插画_平面插画图文教程,如何用AI制作矢量人像插画

    原标题:平面插画图文教程,如何用AI制作矢量人像插画 平面插画图文教程,如何用AI制作矢量人像插画 下面品索教育就分享了一篇关于插画的图文教程,这里应用的软件是AI,教你如何用AI制作矢量人像插画,这 ...

最新文章

  1. 我竟然用OpenCV实现了卡尔曼滤波
  2. 全国计算机等级考试c语言程序设计真题,历年全国计算机等级考试二级C语言笔试选择真题...
  3. 基于Element ui 实现输入框只能输入数字并支持千分位
  4. 拼多多、微博等在新一轮经济变化中将做出更大贡献
  5. 蚂蚁金服做区块链:我们绝不发空气币,要做就服务民生!
  6. RocketMQ系列实战
  7. 原生js制作PC端轮播图
  8. php用pkcs1还是pkcs8,PKCS1与PKCS8的小知识
  9. 电脑在登陆界面如何打开计算机管理,无线路由器管理界面如何登录 无法进入管理界面怎么办...
  10. Halcon 3D点云和深度图的相互转化
  11. 送什么礼物给小学生比较有纪念意义?适合送小学生的小礼物
  12. 计算广告概述【计算广告】
  13. Spark 学习入门教程
  14. 红黑树调整(漫画版)
  15. From RankNet to LambdaRank to LambdaMART: An Overview
  16. html、js实现facebook、twitter分享
  17. 社交图片分享应用Instagram
  18. 微信 SHA1 签名_2020年关于女生伤感的微信签名100条
  19. [Python] 如何证明两组样本有显著性差异(t-test假设检验)
  20. java生成微信支付sign 及校验签名封装

热门文章

  1. 浅谈“闭包”,什么才是“闭包”思想!—— javascript
  2. php mysql sql mode_Mysql之SQL Mode用法详解_MySQL
  3. 状压DP Hiho-1044 状态压缩
  4. Window环境下,Qt中文出现乱码解决办法
  5. 在CentOS上把MySQL从5.5升级到5.6
  6. 7.Odoo产品分析 (二) – 商业板块(3) –CRM(1)
  7. Python爬虫案例-获取最新的中国行政区域划分
  8. 083 HBase的完全分布式的搭建与部署,以及多master
  9. Datawhale组队学习周报(第047周)
  10. 【青少年编程】黄羽恒:Python