人工智能取代人类的言论一直甚嚣尘上,而深度学习算法通过大量的样本数据也能帮助人工对图像、视频、音频中的信息做出识别,本次采访邀请到网易易盾的资深算法专家李雨珂,他将会为大家解答深度学习在实际应用中的样本攻防问题以及短期内人工审核在内容安全领域的不可替代性。
文/ 李雨珂
整理 / LiveVideoStack
LiveVideoStack:李雨珂你好,感谢接受LiveVideoStack的采访,能否向LiveVideoStack的读者简单介绍下自己和负责的工作?
李雨珂:LiveVideoStack的读者你们好,我是来自网易易盾的人工智能算法工程师,网易易盾是国内领先的内容安全和业务安全服务商。我个人很长时间都在从事算法应用相关的工作,目前主要负责推进人工智能算法在多媒体内容审核中的应用,包括了借助深度学习方法自动鉴别图像、视频、音频中的不良信息。
LiveVideoStack:从个人经历来看,你曾从事过电商领域会员营销的算法工作,与现在的深度学习图像算法相比两者在工作内容上有哪些不同?
李雨珂:会员营销算法主要针对用户未来行为、偏好的预估,目前往往是传统机器学习方法和深度方法结合使用。图像算法和会员营销算法相比在特征、模型和评估上会有一些差异。特征方面,图像的特征都是从整图中提取的,不在需要额外输入信息,而会员的属性、历史行为等特征需要额外进行关联和收集,从因果关系上来说,一张图片的内容决定了它的性质,而一个用户的属性、历史行为信息和他未来将要发生的行为之间的关联性其实不是很强。模型方面,图像更多是空间上的建模,而会员算法需要考虑时序方面的建模。评估方面,图像任务往往可以构建出相对充分的测试集,而会员营销算法的评估更依赖线上的AB测试。
总体来说,会员营销算法的难度在于问题本身的不确定性,而内容安全领域内图像算法的难点主要在于小目标、模糊目标和多尺度问题。实际上,除了图像算法外,网易易盾在用户相关的算法方面也有较好的积累,在内容安全、业务安全场景中也发挥着重要的作用。
LiveVideoStack:提到深度学习大众往往都会将其和人脑智能联系起来,两者在你看来有哪些相同和不同的地方?
李雨珂:我们对大脑的认识是是极其有限的,深度学习和大脑的工作机制能够建立一定的联系,比如感受野、层级结构的概念等等,但这种联系更多是感官上的联系,生物大脑的复杂程度是现有的深度学习网络不可比拟的,单独一个神经元的结构和性质已经足以让科研工作者投入长期的研究了。
从学习过程来看,深度网络学习认识猫和狗的区别需要非常大量的样本,而大脑只需要学习少量几个例子就可以做推理了。我个人觉得深度学习是一个非常好用的拟合器、分类器,而生物智能有更加全面的能力和潜力,包括推理方面。
LiveVideoStack:所有的深度学习模型在上线后都会存在样本攻防问题,网易易盾在这方面有哪些独到的应对策略?
李雨珂:网易易盾在这方面确实有很多投入。主要是从两个方面来做的,一个是前期预防,另一个是后期学习升级。预防方面,我们会从数据扩充、数据增强、训练方法、算法流程等方面着手,使我们的算法模型天然地可以应对一部分对抗的情况。但由于攻击的成本相对较低,样本变化新型多样,所以在后期我们会结合其他图像维度、用户维度等技术手段进行更全面的分析,从而快速有效地缓解这一类问题,此外,我们同时会回流数据进行分析、优化,继续加强模型的对抗能力。
LiveVideoStack:目前的在数据层面深度机器学习还不能做到对数据100%准确率的识别,对小部分嫌疑类型数据通过模型后还需要进行人工的二次审核,随着技术的发展,深度学习能否做到完全替代人工审核?
李雨珂:从审核准确率上来看,我们发现机器其实在图像任务上是可以接近甚至超过人类的,但机器可能会在人类容易判断的例子上犯错,结合刚才提到深度学习和人脑关系的问题,机器更像是死记硬背,而人工拥有举一反三的优势。
我觉得实际操作过程中需要机器和人工更加有效地配合来提升审核的效果,机器可以协助人工减轻审核负担,人工可以帮助机器提升自动化效果。由于内容安全领域对审核结果有非常高的要求,而人工有不可替代的优势,例如人工在简单样例上不容易犯错,并且没有样本攻防的问题,所以机器完全取代人工短期来看并不现实。网易易盾拥有专业的内容审核团队,拥有完善的审核运营策略,是易盾服务效果的重要保障。
LiveVideoStack:网易易盾的深度学习图像算法在内容安全领域相比其他厂商有哪些核心优势?
李雨珂:网易易盾图像算法在内容安全领域长期深耕细作,根据实际业务需求高效地、集中地进行了效果优化。在数据层面,我们积累了海量的UGC数据并进行了有效的样本挖掘;在算法层面,我们针对业务场景做了很多网络结构、训练方法、模型融合上的定向优化,能够召回大量困难样例;在效果保障方面,我们拥有可靠的算法效果测试经验和完善的测试流程。我觉得我们的核心优势并不是某一个小点,而是在解决内容安全相关问题的过程中对每一个算法细节都有高质量的把控。
LiveVideoStack:5G商用会致使数据流量爆发式增长,这会给深度学习算法带来哪些挑战?网易易盾对此都做了哪些准备?
李雨珂:这个问题也正是网易易盾正在关心的问题,数据的爆发式增长会给算法服务带来巨大的压力,易盾算法团队在保证算法效果的同时也持续关注算法性能的提升,方法上主要是从模型压缩和算法流程优化两方面来进行的,目前来看,我们的算法服务每过一个季度都会产生非常显著的性能提升。另一方面,数据的增长也对算法的确定性提出了更高的要求,否则留给人工二次审核的数据量会非常庞大,易盾算法团队也在不断努力来提高机器正确识别的比例。通过算法性能和算法输出确定性的提升,网易易盾有信心迎接爆发式增长流量的考验。

LiveVideoStack 秋季招聘

LiveVideoStack正在招募编辑/记者/运营,与全球顶尖多媒体技术专家和LiveVideoStack年轻的伙伴一起,推动多媒体技术生态发展。同时,也欢迎你利用业余时间、远程参与内容生产。了解岗位信息请在BOSS直聘上搜索“LiveVideoStack”,或通过微信“Tony_Bao_”与主编包研交流。

网易易盾李雨珂:服务性能+算法确定性优化,迎接5G时代内容安全爆发式流量增长...相关推荐

  1. 场景多、变种快、粒度细,网易易盾是如何有效解决这些内容安全难题的?

    广电一年一度的开年大展CCBN已经拉开帷幕,3月19日,2019IPTV&OTT产业高峰论坛在北京维景国际大酒店召开. 网易易盾人工智能首席科学家方正 作为产业一年的风向标,"201 ...

  2. 浙江经信公布人工智能5大榜单 网易易盾内容安全解决方案上榜

    ​​ 浙江经信微信公众号 昨日,浙江省经济和信息化厅(以下简称:"浙江经信")发布了人工智能5大榜单,网易易盾榜上有名. 据悉,本榜单评选是经企业自愿申报,各地经信部门推荐.浙江省 ...

  3. 网易易盾验证码移动端迎来新版本 开始支持智能无感知验证

    近日,网易易盾验证码移动端迎来新版本,该版本支持智能无感知验证码,对整体交互及性能等方面进行了优化和提升. 移动端智能无感知验证码交互流程图 验证码移动端最新版本开始支持智能无感知验证码,极致用户体验 ...

  4. 网易易盾的“外挂对抗战”,游戏出海之路如何走得更安全?

    过去二十年,被称为"第九艺术"的游戏成为中国互联网的重要趋势,正前所未有地占据和改变着我们的生活.放眼未来,中国游戏确定了"走出去"的增长目标,在更广阔的海外市 ...

  5. 国内首家!网易易盾加固第一时间适配Android Q Beta

    北京时间3月14日消息,谷歌在今天正式发布Android Q首个开发者预览版本,并对Pixel用户提供更新.而在发布后的第一时间,网易易盾加固已经完美适配. 由于兼容性以及对未来趋势的把握上做的非常到 ...

  6. 为物联网代码安全而生 网易易盾公测IoT安全编译器Maze

    ​​IoT时代的到来,让我们生活中物联网设备越来越多,然而设备的代码安全是一切安全的基础,如果设备代码不加以防护或防护不够,将会造成核心技术泄露,给IoT设备稳定运行带来威胁. 与此同时,当下仍有不少 ...

  7. 全面升级!网易易盾发布设备DNA指纹系统

    随着移动互联网的应用不断深入,特别是互联网金融.电商.IoT行业的迅猛崛起,黑产的欺诈技术也快速发展.他们通过模拟器.群控平台.刷号软件.自动化脚本.打码平台.短信接口和代理服务器等一整套技术,实现自 ...

  8. 听运营者们分享背后的故事 2017网易易盾成就内容安全王道

    [51CTO.com原创稿件]2017年1月8日,天公作美吹散了漫天雾霾,网易大厦在周末的下午迎来了一百多位互联网运营小伙伴,共聚"亿级互联网产品背后的故事"线下沙龙,一起讨论互联 ...

  9. 网易易盾饶晓艳:内容安全“第三方”这条路,曾经不好“走”...

    1999年,出于对网易内部产品安全保护的需求,网易成立了安全部,那时候饶晓艳还没有加入网易,而网易易盾更是还没"出生".当时的她不会想到,17年后的自己将与网易易盾结缘. &quo ...

最新文章

  1. mysql有没有批量游标_MySQL使用游标批量处理进行表操作_MySQL
  2. 机器学习算法进阶——决策树和随机森林
  3. 简书markdown支持html,简书上使用Markdown(超详细)
  4. 为什么SAP UI5框架在应用整个生命周期只调用onBeforeRendering一次
  5. 借助实时数据推送快速制作在线对战五子棋小游戏丨实战
  6. linux下undefined reference to 、`pthread_create‘,undefined reference to `pthread_join‘
  7. Java编程经典10道_10道经典java编程笔试题
  8. mysql存储php数组_mysql数据库存储PHP数组、对象的方法
  9. 【linux】知识点总结
  10. atitit.报表最佳实践oae 与报表引擎选型
  11. 显色指数(CRI)计算软件-升级版可视化界面
  12. 铁威马NAS搭建邮件服务器教程
  13. Linux与Windows命令行杀死端口命令
  14. Helio X30剩魅族一家客户 联发科恢复元气要一年半
  15. workbook 读取excel表格
  16. 「ことから」と「ことだから」
  17. android 新闻功能列表,android listview实现新闻列表展示效果
  18. CS115 - Computer Simulation, Assignment
  19. Switch开关控件.
  20. Java实现第十届蓝桥杯特别数的和

热门文章

  1. php编译安装与配置
  2. 嵌入式产品开发设计需要考虑的问题总结
  3. UEFI Shell 常用命令
  4. 修改hosts立刻生效不必重启
  5. VB.NET实现DirectDraw9 (1) 托管的DDraw
  6. python发送文件到服务器_python 使用poster模块进行http方式的文件传输到服务器的方法...
  7. Python爬虫-代理ip池建立
  8. java instanceof 动态_Java关键字instanceof用法及实现策略
  9. bms中soh计算方式_BMS电池管理系统由浅入深全方位解析
  10. 一个DDOS病毒的分析(二)