最近AI换脸术与AI假新闻叠加在一起,造成了不少乌龙事件,比如最近美国的议长南希·佩洛西就的一段醉酒视频就在Facebook上流传甚广,视频中的议长明显是状态晕沉,醉意十足,不过这后来被证明是一段是由deepfake生成的假视频。

后来Facebook创始人马克.扎克伯格的一段视频也开始疯传,在其中小扎说“让我们快速地想象一下,一个人手握偷窃来的数十亿人的隐私信息,他们的所有秘密、生活和未来等等 ”,不过这也是deepfake的杰作。

无独有偶,一名叫做Katie Jones的女政治家,似乎正在美国政坛冉冉升起,她在顶级智库工作,拥有由一批专家和权威人士组成的关系网。她与一名助理国务卿、一名参议员的高级助理以及经济学家 Paul Winfree 都有联系,而且搜索引擎上也能查到相应的新闻报道,不过这位女士其实并不存在,对此美联社已经作出确认,其面部信息是合成的,其相关新闻都是AI捉刀写的。

打假神器 GROVER 横空出世

在OpenAI 推出文本生成模型 GPT-2 后,其文稿所中流畅自然的文笔引发各界广泛的关注,尤其是最近《权力的游戏》烂尾,硬核程序员用GPT-2重写了比电视剧更好的结局,这也让GPT-2算法名声大噪,不过由于这个模型内置 15 亿个参数(你没看错15亿个),其算力门槛让我们这些普通玩家望而却步。不过一种简化的GP2-2-SIMPLE模型已经在 GITHUB 上开源,有机会笔者也会向读者们分享一下这个项目的使用心得。

那么面对这些假新闻包装出来的假人、假事,华盛顿大学和艾伦人工智能研究所的研究者提出了一种名为Grover 的鉴定模型,这个模型本身并没有什么特别值得一提的创新,其思路就是把AI写的文章与人工写的文章分为两组,喂给GPU进行模型训练。论文中最重要的一段如下:“Training Grover-Mega is relatively inexpensive: at a cost of $0.30 per TPU v3 core-hour and two weeks of training, the total cost is $25k”也就是人家为了训练Grover花了20万人民币。所以这又是一次算力上的碾压。

不过虽然Grover的作者并没有开源模型,不过读者还是可以通过他们提供的网页,来感受Grover的强大,

在GENERATE的标签下,随便输入一个标题,点击generate,一会AI就能给你一篇完整的文章,我输入的标题是why china will win the trade war而且写的有理,有据,甚至比很多大V的观点更有见识。所以打假能手,本身也是个造假能手,大家也可以去感受一下。

地址:

https://grover.allenai.org/

GENERAT旁边的标签DETECT则可以发现假新闻。随便把我们刚刚让GROVER写的假新闻拷进去,点击“DETECT FAKE NEW"就能得到结果

GROVER的打假原理

由于Grover是使用典型深度学习模型,开发者也并不能了解其工作的具体机制,其原文是这么说的“Why does Grover perform best at detecting its own fake news? We hypothesize that the reason may be due in part to exposure bias”.也就是本文的作者认为Grover是通过检测exposure bias来预测文章是否是由AI生成。

其实到底是不是exposure bias并不重要,我们上次说的VP-VAE-2当中VP其实就是一种压缩算法,而每种机器学习算法中几乎都存在池化或者非全链接层,以此来减低计算量,这样的存在也就给AI赋予了风格,而Grover其实就是通过海量的训练,来感知AI的风格(style)并以此给出自己的预测概率。

参考阅读:

https://blog.csdn.net/BEYONDMA/article/details/92143438

https://blog.csdn.net/BEYONDMA/article/details/91129700

(*本文为 AI科技大本营转载文章,转载请联系原作者)

公开课精彩推荐

想跟NVIDIA专业讲师学习TensorRT吗?扫码进群,获取报名地址,群内优秀提问者可获得限量奖品(定制T恤或者技术图书,包邮哦~)

NVIDIA TensorRT是一种高性能深度学习推理优化器和运行时加速库,可以为深度学习推理应用程序提供低延时和高吞吐量。通过TensorRT,开发者可以优化神经网络模型,以高精度校对低精度,最后将模型部署到超大规模数据中心、嵌入式平台或者汽车产品平台中。

推荐阅读:

  • 拍照技术烂?实时在线AI构图模型VPN,让你变身摄影大神!

  • 新技术“红”不过十年,半监督学习为什么是个例外?

  • 苹果宣布加入CNCF;华为要求美国运营商支付专利费;微软删除最大的公开人脸识别数据集

  • 继往开来!目标检测二十年技术综述

  • 阿里巴巴杨群:高并发场景下Python的性能挑战

  • 为Python回测代码提升10倍性能,具体做了哪些?

  • 独家对话V神! 质疑之下的以太坊路在何方?

  • 那些去德国的程序员后来怎么样了?

  • Python 分析在德的中国程序员,告别 996 ?

你点的每个“在看”,我都认真当成了喜欢

AI假新闻满天飞,打假神器GROVER帮你看清一切相关推荐

  1. 【NLP】使用NLP检测和对抗AI假新闻

    作者 | MOHD SANAD ZAKI RIZVI 编译 | VK 来源 | Analytics Vidhya 概述 由AI生成的假新闻(神经假新闻)对于我们的社会可能是一个巨大的问题 本文讨论了不 ...

  2. 10本书,帮你看清未来的科技趋势

    导读:尽管全球防疫形势仍不容乐观,但在2021年,科技领域取得的进展并未停滞.发现和理解未来5-10年大格局的科技趋势,更有利于为个人发展抓住机会.在不远的未来,人人都在谈论的关键词将有哪些?也许是量 ...

  3. 假新闻遇上AI,祸兮福兮?

    硅谷Live / 实地探访 / 热点探秘 / 深度探讨 近日,一则"机器人受尽欺压奋起反抗"的视频刷上了各大平台的排行榜.视频中,为了测试机器人的平衡性,测试人员用脚踹.凳子砸等方 ...

  4. python识别虚假新闻的分类器_使用NLP检测和对抗AI生成的假新闻

    作者|MOHD SANAD ZAKI RIZVI 编译|VK 来源|Analytics Vidhya 概述 由AI生成的假新闻(神经假新闻)对于我们的社会可能是一个巨大的问题 本文讨论了不同的自然语言 ...

  5. 使用NLP检测和对抗AI生成的假新闻

    作者|MOHD SANAD ZAKI RIZVI 编译|VK 来源|Analytics Vidhya 概述 由AI生成的假新闻(神经假新闻)对于我们的社会可能是一个巨大的问题 本文讨论了不同的自然语言 ...

  6. 生成假人脸、假新闻...AI虚拟世界正形成

    整理 | 一一 出品 | AI科技大本营(ID:rgznai100) AI 正在创造一个独特的虚拟(虚假)信息世界. 一个人脸喂养生成网站火了.这个网站可以生成随机人脸图像,这些人脸没有姓名,在现实世 ...

  7. 2020 美国大选在即,又到了 AI 花式打击假新闻的季节

    来源 | HyperAI超神经 近年来,「假新闻」一词的出现频率开始攀升,尤其在 2016 年的美国大选,更是将「假新闻」推至舆论中心,让其使用率增加了三倍多. 据统计,当时在 Facebook 上, ...

  8. 20 美元的宜家台灯算力有多强?运行《毁灭战士》操作丝滑,最初竟是受假新闻启发...

    每逢佳节逛宜家的你,或许知道这款神奇的 LED 电灯. 这款售价大约 20 美元的电灯 TRÅDFRI,可以随时进行调暗或调亮.设定想要的颜色,以及 拿来玩<毁灭战士>. 是的,你没有看错 ...

  9. 假新闻无处不在:我开源了一个深度学习标记假新闻项目

    来源 | DeepHub IMBA(ID:deephub-imba) 虚假新闻的兴起迫使拥有社交媒体帐户的每个人都成为一名侦探,负责在发布前确定帖子是否真实.但是,虚假新闻仍然会越过我们的防线,在网络 ...

最新文章

  1. linux 命令窗口美化,美化你的命令行终端Terminal
  2. 第六十一节,html超链接和路径
  3. Android webView 支持缩放及自适应屏幕
  4. SpringBoot接口幂等性实现的4种方案!
  5. php代码清除空格注解,PHP文件去掉PHP注释空格的函数分析(PHP代码压缩)
  6. sublime代码整理
  7. rest服务器性能,使用多线程提高REST服务性能
  8. webbrowser 检测ajax,控制台获取网页AJAX的返回数据,用的WebBroWser
  9. sqlserver2014内存数据库特性介绍
  10. 去哪儿网查不到历史订单_去哪儿网 数据清洗
  11. redis内存知识点
  12. IDEA Unmapped Spring configuration files found.
  13. 基于区块链的医疗供应链数据隐私保护分布式信息隐藏框架
  14. Java——单例模式:饿汉、懒汉模式
  15. WhatsApp网页版扫码分析
  16. Unity(四十五):光照烘焙
  17. 主引导记录(MBR)
  18. HTML的id选择器类选择器
  19. android 应用软件注册与自动登录代码
  20. 读书笔记---Naive Bayes

热门文章

  1. 直接可以拿去用的正则验证表达式
  2. ASP.NET MVC动作过滤器
  3. HTML5 学习笔记(一)- video
  4. PX4多机ros仿真报错
  5. 余额宝技术架构读后感
  6. Qt分析:Qt中的两种定时器
  7. Oracle to_char函数的使用方法
  8. oracle测试环境表空间清理
  9. 数据结构(三) 用java实现七种排序算法。
  10. 分布式技术一周技术动态 2016-11-27