我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的、自己不知道的东西。

已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-notes

本节内容综述

  1. 本节课由助教黄冠博讲解。将分为影像与语音两部分讲解。
  2. One Pixel Attack,仅仅改变一个像素,就进行了攻击。着重讲了 Differential Evolution
  3. 接下来是 Adversarial Attack Outline 部分。
  4. 第一小节是 Attacks on ASR。Automatic Speech Recognition,自动语音识别技术。
  5. 第二小节是 Attacks on ASV。Automatic Speaker Verification,自动演讲人识别技术。
  6. 稍微提及了 Wake Up Words
  7. 第三节是重点,Hidden Voice Attack。比如,制作一段噪音,人类听不出,但是可能是某个机器指令,如Hey, Siri

文章目录

  • 本节内容综述
  • 小细节
    • One Pixel Attack
      • Differential Evolution
    • Attacks on ASR
    • Attacks on ASV
    • Wake Up Words
    • Hidden Voice Attack
      • Psychoacoustics
      • Signal Preprocessing
      • Perturbation
        • Time Domain Inversion (TDI)
        • Random Phase Generation
        • High Frequency Addition(HFA)
        • Time Scaling (TS)

小细节

One Pixel Attack


如上,为两种攻击所产生的噪音。两者优化目标一样。

如上,都是One Pixel Attack的例子。


如上,与上节所讲的内容相同,分为 untargeted attack 与 target attack 。One Pixel Attack的特点是,只能有一个 xxx 与之前不同。

如果遍历每一个像素,则耗时太长。因此,我们使用 Differential Evolution 。或者说,我们无需找到最好的像素。

Differential Evolution

During each iteration another set of candidate solutions(children)is generated according to the current population (parents). Then the children are compared with their corresponding parents, surviving if they are more fitted(possess higher fitness value) than their parents. In such a way, only comparing the parent and his child, the goal of keeping diversity and improving fitness values can be simultaneously achieved.

有些类似保留精英的遗传算法,其优势在于:

  • Higher probability of Finding Global Optima: due to diversity keeping mechanisms and the use of a set of candidate solutions
  • Require Less Information from Target System: 相比 FGSM,DE 不需要算 gradient ,因此不需要攻击对象 model 太多细节;independent of the classifier used

整体来说就是:

  • Initialize Candidates
  • Select Candidates and Generate
  • Test Candidates and Substitute

后两步不断重复。

DE 并非将一个图片的一个数值当成一个“个体”,而是将一个像素的全部信息作为攻击目标:(x,y,R,G,B)(x, y, R, G, B)(x,y,R,G,B)。

由此可推测,图片越大,则攻击成功率越低。

Attacks on ASR

可参考:https://nicholas.carlini.com/code/audio_adversarial_examples

如上,与图片攻击类似,加上一段杂音,让神经网络错误判断。

Attacks on ASV


如上,语音识别的分类问题同理,也可通过加噪音攻击。

Wake Up Words

Hidden Voice Attack


如上,助教播放了一段杂音,实际上代表的是"turn on the computer"。

Psychoacoustics

心理声学,研究人对于声音的感知程度跟反应。

Signal Preprocessing


对于声音信号的处理,我们进行了:

  • 声音信号的采样;
  • 预处理,滤掉高低频的内容;
  • 对信号进行运算处理;
  • 输入模型。

Perturbation


如图,将介绍四种方式,进行攻击。

Time Domain Inversion (TDI)
  • 利用了 mFFT(magnitude fft) 多对一的性质;
  • two completely different signals in the time domain can have similar spectra
  • modifying the audio in the time domain while preserving its spectrum, by inverting the windowed signal
  • inverting small windows across the entire signal, removes the smoothness

意义是什么呢?

  • 我们虽然对音讯进行了修改;
  • 但是其 mFFT 还是与原音讯相同。
Random Phase Generation


如图,调整 aaa 与 bbb ,但是仍保证 a2+b2\sqrt{a^2 + b^2}a2+b2​ 不变。

High Frequency Addition(HFA)
  • Signal processing 的过程中, low-pass filter 会把相较于人耳高很多的频段滤掉以增加 VPS(Voice Processing System) 的准确率
  • add high frequencies to the audio that are filtered out during the preprocessing stage
  • create high frequency sine waves and add it to the real audio
  • If the sine waves have enough intensity, it has the potential to mask the underlying audio command to the human ear.

Time Scaling (TS)
  • 将音讯快放到 model 能正确辨识但是人又听不太懂在说什么
  • compress the audio in the time domain by discarding unnecessary samples and maintain the same sample rate
  • the audio is shorter in time, but retains the same spectrum as the original

什么是 sample rate ?波由好多点组成,simple rate 就是每秒有几个 data point 。

【李宏毅2020 ML/DL】P43-44 More about Adversarial Attack | Images Audio相关推荐

  1. 【李宏毅2020 ML/DL】P1 introduction

    [李宏毅2020 ML/DL]P1 introduction 本节主要介绍了 DL 的15个作业 英文大意 Regression: 回归分析 Classification: 分类 RNN: 循环神经网 ...

  2. 【李宏毅2020 ML/DL】P86-87 More about Domain Adaptation

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 本节内容综述 本节课由助教 Chao Brian 讲解. 首先讲解些领域适配的基础内容,包括名词.定义等. 接 ...

  3. 【李宏毅2020 ML/DL】P59 Unsupervised Learning - Auto-encoder

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  4. 【李宏毅2020 ML/DL】P58 Unsupervised Learning - Neighbor Embedding | LLE, t-SNE

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  5. 【李宏毅2020 ML/DL】P15 Why Deep-

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...

  6. 【李宏毅2020 ML/DL】P14 Tips for training DNN | 激活函数、Maxout、正则、剪枝 Dropout

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...

  7. 李宏毅svm_李宏毅2020 ML/DL补充Structured Learning Structured SVM

    李宏毅2020 ML/DL补充Structured Learning Structured SVM [李宏毅2020 ML/DL]补充:Structured Learning: Structured ...

  8. 【李宏毅2020 ML/DL】P35-42 Attack ML Models

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  9. 【李宏毅2020 ML/DL】补充:Support Vector Machine (SVM)

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 本次笔记补充视频 BV1JE411g7XF 的缺失部分.在另一个UP主上传的2017课程BV13x411v7U ...

最新文章

  1. 她,诗人拜伦之女,英国数学家,历史上第一位程序员
  2. java ajax 点赞功能_Ajax+jQuery+bootstrap+Java实现异步点赞功能,并限制点击次数
  3. 关系代数基本运算_关系代数的基本和附加运算
  4. 第十一届蓝桥杯省赛C++组试题 第4题 选择题判定
  5. 电信主机托管费用_电信服务器托管价格
  6. CSS篇 Process Document第7章 Technical Report Development Process翻译
  7. javascript去除空格回车符
  8. Ubuntu软件商店下载速度慢
  9. AUTOCAD——圆弧命令
  10. NOI模拟(5.14) JSOID1T3 绝地反击 (bzoj5316)
  11. Xcode 报错及解决办法汇总
  12. 如何在数据验证单元格区域禁用粘贴
  13. 骗子公司 黑中介 黑到几时?
  14. 嵌入式课程学习 嵌入式硬件工程师需要学习哪些内容?
  15. CANoe-第3个仿真工程-总线仿真- 3-2 工程实现
  16. 【考研】操作系统:2019年真题43(同步互斥问题)
  17. 关于App置灰黑白化的探索
  18. 都2020年了,还有必要学Arduino吗
  19. lua 反汇编工具 ChunkSpy 的使用
  20. 关于win7 打kb4012212补丁失败问题。

热门文章

  1. 关于Excel中的【照相机】功能。(我们通过此功能,可以通过Excel在图片上面画上一些内容后,连同图片和内容一起弄出来)
  2. 移动前端自适应解决方案和比较
  3. 跨站点脚本编制-XSS 描述及解决方法
  4. 应用phpexcel导出excel文件后打不开的问题解决方法
  5. 无法从Windows上的资产index.android.bundle加载脚本
  6. 如何保护Python代码?
  7. 重装 Windows 7 系统后电脑出现乱码怎么办
  8. rosweb,roslib,ROS2D.PolygonMarker 绘制多边形
  9. pdf数据填充,JaspersoftStudio,JasperReport
  10. 统一返回码,返回结果实体类