新研究训练小老鼠充当分类器，识别Deepfake假声音，比计算机更靠谱

大数据文摘出品

来源：The Wall Street Journal

编译：林苗、易琬玉

人们一般都认为狗是自己最好的朋友。然而，当要分辨一段录音的真假时，小老鼠才是我们的好帮手。

本周，美国网络安全会议Black Hat在拉斯维加斯举行。会上，研究人员提出，小动物们，特别是小老鼠，在识别自然语音元素方面很有天分。

这项成果可能会影响技术公司通过人工智能来构建系统，去检测电脑合成的声音。

"Deepfake"的发展令人担忧

“小哥哥网恋吗？我萝莉音。”

在一大波变声器和修音软件的风潮下，变声萝莉音、御姐音、正太音几乎只需要手动调调软件参数。对于游戏直男来说，游戏连麦时听到萌萌妹子音，想要点开个人主页勾搭却发现是个抠脚大汉的概率不低。

变声这件事情，本身就带有娱乐性。斗鱼大热的游戏主播Zard有一个关键时期，就是他开着变声器变身萌妹聊天，软萌又调皮的人设吸粉无数。

然而，玩乐归玩乐。随着"深度伪造"的发展，伪造的你的声音可能亲妈也听不出端倪，一旦被犯罪分子利用便会造成大问题。

对声音的伪造从1999年就开始了，从Microsoft Mike 到谷歌的Tacotron 2，每一次发展迭代都变得更加像人。

因为"Deepfake"的出现，我们再也不能相信“眼见为实”。

近来，专家们非常担心"Deepfake"类产品的发展速度。通过"Deepfake"应用，计算机可以对数百份照片或录音进行采样合成，伪造一些人们没有说过的录音或是照片。

前段时间，美国众议院议长Nancy Pelosi的一段深度伪造的谈话视频出现在社交媒体上，这段视频经由特朗普总统分享，在Facebook上获得了超过250万次的浏览量。早些的时候，美国前总统奥巴马的脸被“借用”来攻击特朗普总统，该视频在网站上也获得480万的浏览量。

特朗普总统本人也难逃一劫，西雅图电视网曾播放过一段深度伪造的特朗普演讲视频，视频中特朗普总统满脸通红，还不时做一些滑稽的表情。

视频地址：

https://www.youtube.com/watch?v=jzKlTKsHeus

由于深度伪造技术可以运用在包括总统在内的任何官员身上，美国两党开始担心该技术将成为针对美国和其他西方国家发起虚假信息战争的最新武器；不法分子很可能会利用这项技术，模仿高层管理人员或某位候选人的言行，再对他们进行网络攻击，从而影响各级选举。

利用人类思维制造“假声”

人类在语言加工处理过程中，总是倾向于用标准化的思维来表述，并对语音进行压缩。新型的"Deepfake"机器学习技术正是利用了这一规律，用听起来非常像人说话，实际上来源不一的声音来鱼目混珠。

“在一个关键的时机，假冒某位CEO或某位政治家说一些或者做一些他们并没有说过、做过的事，可能会引发某种程度上的灾难，比如破坏全球金融市场的秩序，或者引发民事或军事上的冲突。”GSI科技公司数据科学主管、小老鼠研究项目成员之一，George Williams如是说。

这个项目的其他研究人员包括金融信息公司Bloomberg LP的数据科学家Alex Comerford，以及俄勒冈大学的研究生Jonathan Saunders。

Jonathan Saunders认为，“如果你想进一步优化、形成通用版本的'Deepfake'检测算法，那就需要深入语音学和神经科学来了解声音听起来是什么样的，以及大脑是如何分析和处理声音的”。

小鼠具有与人类相似的听觉系统

研究人员们训练小老鼠来区分不同的音素，比如与爆破音P、B、T相关的声音。英语中的48个音素，经常被用于模拟语音方面的研究，也产生了一些比较有挑战性的研究成果。早期在"Deepfake"方面的尝试，听起来都很像机器人。

在识别复杂声音的能力方面，小老鼠具有与人类相似的听觉系统。因此，研究人员假设，可以利用小老鼠在合成声音的数据集上进行测试，以区分哪些声音是真实的。

研究人员利用条件反射对小老鼠进行训练强化——听到真实的音频片段时，跑向某个位置；听到合成的音频片段时，则跑向另一个位置。如果跑对了，会得到奖励。久而久之，小鼠就学会了如何区分真假两种声音。

在测试中，小老鼠检测到合成声音的正确率为75%。如果研究人员在实验中添加一些意外的变量，比如新的声音或元音，小老鼠的正确率会随之下降。然而，小老鼠们还是能够在训练数据中，把新的、复杂的语音模式区分出来。

一些研究团队都在利用人工智能对抗"Deepfake"。然而，数据算法一般都是在训练集数据范围内运行的，这也就意味着它们非常容易受到新技术或者超范围数据的冲击。本文介绍的团队用小老鼠进行训练，却可以适应这种新的变化。

Jonathan Saunders表示，“目前在听觉研究领域，小老鼠们还是一张白纸。他们能学习复杂的特征集，可能也可以学习新的分类问题。”

当然，这并不意味着Youtube需要通过喂养大堆小鼠来识别深度伪造的视频。但是通过弄明白小鼠是如何具有这样的识别能力，可以让我们更好的训练计算机，进而能够更好地对抗"Deepfake"。

我们曾如何对抗"Deepfake"

在对抗"Deepfake"这件事上，很多科技公司都进行过努力。

比如DARPA花费数年的MediFor计划，汇集世界顶尖的研究人员开发自动评估图像或视频完整性的技术，并将这些技术集成到端到端。MediFor平台将自动检测并分析媒体上的伪造，并推断视觉媒体的完整性，以便于确定可疑图像或视频。然而根据项目参与人员Farid的说法，这个项目目前依旧需要大量的人工分析和筛选。

阿姆斯特丹的Deeptrace就是通过深度学习大量虚假视频，来喂养、打磨一个深度伪造识别系统。它不仅能够识别视频是否是伪造的，还能揭露伪造视频的制作过程。通过追踪算法的痕迹，Deeptrace能够得到了解生成伪造的算法信息。例如，知道整个视频只是伪造了面部信息还是伪造了整体。

当人们发现一些寻常的东西（比如一通电话或者是一段视频）可以被轻易伪造时，就像打开了潘多拉的魔盒。我们现在还没能找到完美对抗"Deepfake"的解决方案。小鼠在听觉方面的天赋或许能帮我们前进一步，然而对抗深度伪造，依旧任重道远。

新研究训练小老鼠充当分类器，识别Deepfake假声音，比计算机更靠谱相关推荐

使用OpenCV训练好的级联分类器识别人脸
一.使用OpenCV训练好的级联分类器来识别图像中的人脸当然还有很多其他的分类器,例如表情识别,鼻子等,具体可在这里下载: OpenCV分类器 import cv2 # 矩形颜色和描边 color ...
吴恩达团队新研究：用X光片识别14种疾病，AI准确度部分超越人类
栗子射线发自凹非寺量子位报道 | 公众号 QbitAI 最近,吴恩达的斯坦福团队发布了一个X光诊断算法,基于深度神经网络. 与曾经的肺炎检测专门算法不同,这次的CheXNeXt模型,可以诊断 ...
模式识别新研究：微软OCR两层优化提升自然场景下的文字识别精度
模式识别新研究:微软OCR两层优化提升自然场景下的文字识别精度发表于2015-03-30 23:46| 6209次阅读| 来源CSDN| 8 条评论| 作者霍强模式识别微软亚洲研究院微软OCR文字 ...
老鼠也会跟着音乐「蹦迪」，最喜欢Lady Gaga的歌｜日本新研究
丰色发自凹非寺量子位 | 公众号 QbitAI 一听到带感的歌就会跟着节奏摇头晃脑,这不是咱人类的专属. 日本东京大学的一项研究发现:老鼠也会踩点打节拍,并且和人类一样,对120-140bpm节 ...
MIT新研究：AI仅靠看X光片就能准确识别患者种族，但没人知道为什么
本文共2500字,建议阅读5分钟仅从一个人的胸部X光片.肢体CT扫描和乳房X光片等影像资料,就能判断出他/她的种族,你相信吗? 人类对于某人是黑人.亚洲人还是白人的判断主要来自于某些外貌特征:皮肤.头 ...
NAACL 2021 | 担心GPT-3被喂假消息？谷歌新研究，将知识图谱转成“人话”用于训练...
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达萧箫发自凹非寺量子位报道 | 公众号 QbitAI 还在担心 ...
担心GPT-3被喂假消息？谷歌新研究，将知识图谱转成“人话”用于训练丨NAACL 2021...
萧箫发自凹非寺量子位报道 | 公众号 QbitAI 还在担心大语言模型"啥都吃",结果被用假信息训练了? 放在以前,这确实是训练NLP模型时值得担心的一个难题. 现在,谷歌 ...
我用24小时、8块GPU、400美元在云上完成训练BERT！特拉维夫大学新研究
丰色发自凹非寺量子位报道 | 公众号 QbitAI 大型语言模型BERT,熟悉NLP领域的同学没人不知道它的名气吧? 只可惜它太太太贵了! 之前有做过统计,使用谷歌云TPU或英伟达GPU训练完 ...
DL之CNN：基于CRNN_OCR算法(keras,CNN+RNN)利用数据集(torch,mdb格式)训练来实现新图片上不定长度字符串进行识别—训练过程
DL之CNN:基于CRNN_OCR算法(keras,CNN+RNN)利用数据集(torch,mdb格式)训练来实现新图片上不定长度字符串进行识别-训练过程目录输出结果设计思路核心代码输出结果 ...

新研究训练小老鼠充当分类器，识别Deepfake假声音，比计算机更靠谱

新研究训练小老鼠充当分类器，识别Deepfake假声音，比计算机更靠谱相关推荐

最新文章

热门文章