我们知道,AI 技术将在很长一段时间占据互联网技术时代的风口。但是,有代码的地方就有缺陷,提到技术很难不讲安全,那么AI会不会碰到安全问题呢?

AI安全

试想一下,未来的某个早晨,当你像往常一样打开无人驾驶的汽车车门,报出目的地,然后坐在后座上舒舒服服地浏览推送给你的各种新闻,汽车突然失控,在本该停止的红灯前飞驰而过撞向了正在过马路的行人,那将是怎样一场灾难。

人工智能技术给生活带来便利的同时,其自身的安全问题(AI安全)也不容忽视,AI安全问题可以归纳为内外2方面原因:

  1. 自身缺陷导致的模型出错:例如,模型结构本身存在缺陷、或者训练数据和真实场景数据之间的偏差,都可能导致模型预测错误。
  2. 外部攻击导致的模型风险:例如,来自外部的对抗样本攻击可诱使算法识别出现误判漏判,输出错误结果。

本文,我们会针对第2点的对抗样本技术结合其在阿里巴巴安全领域中的实际应用给大家做展开介绍。

对抗样本技术

对抗样本由 ChristianSzegedy[1]等人提出,他们发现通过深度神经网络训练得到的模型,在输入与输出之间的映射往往不是线性的。这样就存在一个问题: 在输入数据中通过故意添加肉眼不易察觉的细微扰动,可以生成对抗样本,导致AI模型以高置信度给出一个错误的输出。如下图所示:

目前的对抗样本根据是否需要指定攻击的类目可以分为无目标攻击(non-targeted attack)和目标攻击(targeted attack)。前者不指定具体类目,只要让AI识别错误即可。后者不仅需要使AI识别错误,还需要使AI识别到指定的类别。

生成对抗样本,最直接的方法是在给定扰动量的范围内修改样本,使得修改后的样本在AI模型上的损失函数最大化(非定向攻击)或最小化(定向攻击),这样就可以把生成对抗样本的问题归纳为空间搜索的优化问题。基于不同的优化算法,学术界提出了很多对抗样本生成算法,有兴趣的朋友可以自行检索,此处不具体展开。

对抗样本应用场景

对抗样本技术提出后引发了学术界和工业界对于深度学习模型在安全方面的广泛关注,成为目前深度学习领域最火热的研究课题之一,新的对抗攻击方法不断涌现,应用场景从图像分类扩展到目标检测等。

阿里安全一直以来致力于用技术解决社会问题。为了保障整个生态圈中7亿多消费者和千万商家的信息安全,AI技术很早就被应用到了阿里安全体系建设中。安全领域一个重要的特点就是存在很强的对抗性,日常防控中,黑灰产会尝试使用各种对抗样本攻击我们部署的AI防控大坝。对此,一方面,阿里安全图灵实验室的算法专家们提出了若干种提升模型安全性能的方法,强化自身堡垒;另一方面,算法专家们也会以战养战,开展针对对抗样本的攻防研究,利用对抗技术去防御攻击者的模型。下面我们结合实际业务,介绍两种对抗样本的应用场景:

1.人脸识别

人脸识别技术已经在生活的各个场景普遍应用,手机解锁要靠脸、移动支付要靠脸,机场安检要靠脸……一脸走天下的时代逐渐到来。

然而,Bose 和 Aarabi[2]发现通过在原始图像中加入人眼不可区分的微量干扰对人脸识别算法进行攻击后,能够使人脸无法被检测算法定位到。如下图所示,左列为原始图像,检测算法可以准确定位,右列为对抗样本,已经成功绕开了人脸检测算法,而在我们肉眼看来两幅图画基本没有差别。

更进一步,采用对抗样本攻击人脸识别系统,还可以使算法把人脸识别成指定的错误类别[3]。下图第一列为目标类别,第2和第4列为原始样本,对其加入干扰生成的对抗样本在第3和第5列,它们均被算法错误识别为第一列目标类别。

2.对抗验证码

如同网络通信的基础安全设施——防火墙,互联网业务安全也有其基础安全设施——图片验证码和短信验证码。互联网业务广泛使用图形验证码用于区分人类和机器的操作行为,使用短信验证码过滤黑灰产批量账号及提供二次校验功能。现在随着深度学习的门槛越来越低,黑灰产会利用深度学习技术构建模型自动识别验证码,突破算法模型设置的人机识别防线。下图的文本验证码基本都可以被AI模型轻松识别。

针对文本验证码面临的挑战,阿里安全图灵实验室的算法专家们将原始验证码替换成增加扰动后的对抗验证码。为了增加对抗验证码的识别难度,又不影响正常用户的体验,算法专家们又在图像区域和生成方式上进行了组合扩展,最终生成的对抗样验证码有效抵御了黑灰产的批量破解,成为阿里业务安全的一道铜墙铁壁。采用该组合扩展生成的对抗验证码如下图所示:

针对点击式的图文验证与行为辅助验证码,阿里安全图灵实验室的算法专家们首先在验证码中结合了NLP的问答技术,再将全部问答转换成图片,最后利用对抗技术生成对抗问答图片。使用商业的OCR引擎进行对此类对抗问答图片样本进行识别测试,和原始样本的识别率相比,对抗样本的识别率大幅降低,且并没有对用户的体验带来很大的影响,由此可见AI结合安全能为业务带来巨大的价值。

原文链接
本文为云栖社区原创内容,未经允许不得转载。

AI 安全在阿里业务中的实践,你了解吗?相关推荐

  1. Java线程池实现原理及其在美团业务中的实践

    来自:美团技术团队 随着计算机行业的飞速发展,摩尔定律逐渐失效,多核CPU成为主流.使用多线程并行计算逐渐成为开发人员提升服务器性能的基本武器.J.U.C提供的线程池ThreadPoolExecuto ...

  2. 【有料】Java线程池实现原理及其在美团业务中的实践

    随着计算机行业的飞速发展,摩尔定律逐渐失效,多核CPU成为主流.使用多线程并行计算逐渐成为开发人员提升服务器性能的基本武器.J.U.C提供的线程池:ThreadPoolExecutor类,帮助开发人员 ...

  3. Java线程池实现原理及其在美团业务中的实践(转载加总结)

    我们知道线程有5种状态分别是新建,就绪,运行,阻塞,死亡,而对应的线程池也有5种状态RUNNING运行,线程池创建就是该状态,SHUTDOWN 不接受新任务,但是处理已存在的任务,STOP不接受新任务 ...

  4. 企业中台最佳实践--阿里业务中台最佳实践(八)

    00 一切业务数据化,一切数据业务化. "中台"概念这几年非常火,特别是阿里.腾讯.百度.京东等互联网公司最近频繁的基于中台调整组织架构,把"中台"的热度又上升 ...

  5. 设计模式在外卖营销业务中的实践

    来自:美团技术团队 业务策略多变导致需求多变,是业界很多技术团队面临的最具挑战的问题之一.那么如何设计一套易于扩展和维护的营销系统呢? 今天的文章来自美团外卖营销技术团队,他们分享了从领域模型到代码工 ...

  6. 设计模式在美团外卖营销业务中的实践

    一.前言 随着美团外卖业务的不断迭代与发展,外卖用户数量也在高速地增长.在这个过程中,外卖营销发挥了"中流砥柱"的作用,因为用户的快速增长离不开高效的营销策略.而由于市场环境和业务 ...

  7. 美团技术:设计模式在美团外卖营销业务中的实践

    1.前言 随着美团外卖业务的不断迭代与发展,外卖用户数量也在高速地增长.在这个过程中,外卖营销发挥了"中流砥柱"的作用,因为用户的快速增长离不开高效的营销策略.而由于市场环境和业务 ...

  8. 单元测试在高德在线导航业务中的实践

    导读:TDD(Test Driven Development)是一种强调测试先行的开发方式,通过编写单元测试用例,有效保障存量复杂系统在开发.重构上的质量.在本文中,高德智能技术中心的同学通过分析现有 ...

  9. 《大数据+AI在大健康领域中最佳实践前瞻》---- 以元数据管理角度出发看人工智能医疗器械标准数据集的构建

    文章大纲 元数据治理 构建思路 我国数据集构建的规则 外国数据集构建思路参考 构建过程中需要注意的问题 数据收集SOP(Standard Operating Procedure) 元数据收集 数据收集 ...

最新文章

  1. UIBezierPath和CAShapeLayer创建不规则View(Swift 3.0)
  2. 将二维数组保存为.csv格式
  3. FPGA设计心得(8)Verilog中的编译预处理语句
  4. 开启Android Q DarkMode | 开启Android Q深色模式 夜间模式
  5. leetcode17 电话号码的字母组合
  6. oracle 次月,Oracle日期查询:季度、月份、星期等时间信息
  7. java 可变参数_90.Java可变参数
  8. 老肖有话说:如期而至的Swarm新工具Crane开源解读
  9. BIGEMAP APP离线卫星地图数据应用
  10. 关于数位板怎么用,电脑绘画入门篇
  11. PR转场预设 模仿纸张翻转特效PR视频转场PR预设
  12. eNSP下园区网综合实验分步配置(1)Eth-Trunk、Vlan、Trunk
  13. 模电——极性电容与非极性电容的异同
  14. JavaScript闭包的个人理解
  15. 蔡康永的201堂情商课
  16. Windows10设置任务栏透明化
  17. 谷歌眼镜开发Mirror API之Go语言开发
  18. 研究生学历含金量知多少?他的价值可能比你想象的还要大!
  19. “2014全球未来网络与SDN技术大会”精彩剪辑(上)
  20. 例9003 火星上的加法

热门文章

  1. 浏览器无法运行java_window_浏览器无法运行JAVA脚本的解决方法,1、浏览器无法运行JAVA脚本的 - phpStudy...
  2. 技术交底软件_【干货分享】软件类产品如何进行专利挖掘与技术交底书撰写?...
  3. 计算机网络 --- 数据链路层CSMA协议
  4. 操作系统信号量和管程
  5. grasp设计模式应用场景_grasp设计模式笔记回顾
  6. vue ui框架_「webAPP」记录几款比较好用的vue 移动端的ui框架
  7. plsql无监听程序_详细!看看顶级互联网公司都在研究的无服务器架构!
  8. 院士袁亚湘:莫把数学当语文来教
  9. 全面取消校园全封闭管理!这个省发通知了!那北京呢?
  10. 数学 :追求真和美的学问