来源:亿欧

概要:2017年,误导性和恶意的虚假在线内容是如此丰富多产,以至于人类无法让自己解脱困境。反而,这越发看来机器将不得不拯救我们。

这可能是互联网历史上的第一个虚假新闻:1984年,有人在Usenet上发布了苏联加入网络的消息。这是一个完全无害的四月愚人节恶作剧,与如今的虚假信息宣传活动和旨在快速获利的不择手段的制造业相差甚远。2017年,误导性和恶意的虚假在线内容是如此丰富多产,以至于人类无法让自己解脱困境。反而,这越发看来机器将不得不拯救我们。

一家名为AdVerif.ai 的初创公司设计了一种同名算法,可以把我们从黑暗中拯救出来。人工智能软件的构建是为了检测虚假的新闻报道、赤裸、恶意软件和其他类型的问题内容。AdVerif.ai于11月份推出了测试版本,目前与美国和欧洲的内容平台及广告网络合作,他们不希望与虚假或潜在的冒犯性新闻报道有关联。

根据AdVerif.ai的创始人Or Levi的说法,公司在将焦点放在公司产品,而非普通用户的事情上面看到了机遇。虽然个别消费者可能不会担心他们所点击新闻报道的真实性,但是广告主和内容平台会因为集结或宣传不良内容而损失一些东西。如果他们改变自己的服务,他们可以有效地削减那些靠制造虚假新闻赚钱的人的收入来源。Levi说:“这将是与这类内容作斗争的一个大的跨越。”

AdVerif.ai 是如何发现假新闻?

AdVerif.ai可以扫描整个内容,发现表明某些地方有问题的标志,比如文章标题与正文内容不对应,或标题中的大写字母太多。AdVerif.ai还通过有数千个合法虚构新闻的数据库对每一则新闻进行交叉检查,这些合法的虚构新闻会每周更新一次。客户可以看到系统考虑到的每一部分的报告,还有评估分数,评估某些事可能是虚假新闻,或可能携带恶意软件,或可能包含他们要求系统留意的其他东西,比如说赤裸。最后,Levi表示,他计划增加能找出操纵图像的能力,并安装一个浏览器插件。

在测试AdVerif.ai的演示版本时,AI将洋葱识别为讽刺(这在过去曾经愚弄过很多人)。布赖特巴特的新闻故事被分类为“不可靠的,右翼的,政治的,带有偏见的”,而Cosmopolitan则被认为是“左翼的”。可以看出,当Twitter账户使用标识时,而链接却与它所描绘的品牌毫无关系。AdVerif.ai不仅发现Natural News上标题为“有证据表明比特币成为NSA设计的心理战行动来全面推广单一世界数字货币”的新闻是来自一个黑名单网站,而且还确定了它是一条虚假新闻,在其他被列入黑名单的网站上也会弹出,而且在合法新闻机构没有任何参考。

一些可疑的新闻报道仍然可以通过,出现在网站上。在一个名为Action News 3的网站上,有一篇题为“NFL播放器拍摄到在更衣室里燃烧美国国旗!”的帖子,虽然已经证明该帖是捏造的,但是帖子并没有被拦截。为了帮助系统知道接下来的情况,可以手动逐个更新系统虚假新闻报道的黑名单。

当 AI 造假遇上 AI 打假

AdVerif.ai并不是唯一一家在为在线公司提供以AI为动力的吐真药中看到机遇的初创公司。特别是网络安全公司,已经快速地将发现僵尸和虚假新闻的操作添加到他们的计算机指令系统中,指出很多方法与黑客手段有多么相似。Facebook正在调整其算法,以消除其新闻传播中的虚假新闻。谷歌与事实检查网站开展合作,到目前为止,取得的结果还参差不齐。“虚假新闻挑战赛”于去年年底推出,比赛是由AI团体的志愿者举办,旨在鼓励开发有助于打击恶意报道的工具。

“虚假新闻挑战赛”组织者之一,开发机器学习系统的Joostware公司创始人,Delip Rao表示,要发现虚假新闻有很多方面,所以这个挑战将会分多个步骤完成。第一步是“立场检测”,或者选取一条新闻,找出其他新闻网站对这个话题的评论。这可以让人类事实检验员依靠新闻来验证其它的新闻报道,用更短的时间检查单个作品。

“虚假新闻挑战赛”发布了数据集供团队使用,有50个团队提交了参赛作品。思科公司的网络安全部门Talos Intelligence利用了一种算法赢得了比赛,这一算法获得了80%以上的正确率——虽还没有为黄金时段做好准备,但仍然是一个令人欢心鼓舞的结果。接下来的挑战可能会出现带有覆盖文本的图像(思考模因,但带有虚假新闻),这是一种经常在社交媒体上推广的格式,因为算法很难分解和理解这种文本格式。

Rao表示:“我们主要想为检验员建造最好的工具,以便他们能够快速工作,像检查类固醇的事实检验员一样。”

即使开发出能够有效遏制虚假内容趋势的系统,也不太可能是新闻报道的终结。人工智能系统已经能够创造虚假的文本了,以及令人难以置信的图像和视频。(请参阅“真实或虚假?人工智能令人难以置信”)。也许正因为如此,Gartner最近的一项研究预测,到2022年,发达经济体中的大多数人会看到比真实信息更多的错误虚假信息。同样的报告发现,甚至在发生这种事情之前,虚假内容将会超过AI检测它的能力,改变我们相信数字信息的方式。

AdVerif.ai以及其他公司更像开始了一场竞赛,而非虚假信息之战。竞赛中,虚假内容创作者开发自己的人工智能系统企图战胜 “正义”的人工智能。因此,我们不得不重新审视自己获取信息的方式。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎支持和加入我们。扫描以下二维码或点击本文左下角“阅读原文”

人工智能能否在对抗虚假新闻战争中完胜?相关推荐

  1. python识别虚假新闻的分类器_使用NLP检测和对抗AI生成的假新闻

    作者|MOHD SANAD ZAKI RIZVI 编译|VK 来源|Analytics Vidhya 概述 由AI生成的假新闻(神经假新闻)对于我们的社会可能是一个巨大的问题 本文讨论了不同的自然语言 ...

  2. 智源-计算所虚假新闻检测大赛 | 探秘假新闻中的视觉信息

    2019 年 8 月,北京智源人工智能研究院联合中科院计算所.数据评测平台 biendata,共同发布了中文多模态虚假新闻数据集,并同步开放了评测竞赛(2019 年 8 月-11 月初),总奖金 10 ...

  3. 虚假新闻检测挑战赛落幕,探寻获奖团队背后的故事

    2019年11月16日,智源论坛:虚假新闻检测暨2019虚假新闻检测挑战赛颁奖仪式召开.本次挑战赛由北京智源人工智能研究院和中国科学院计算技术研究所共同举办,旨在促进互联网虚假新闻检测技术的发展,营造 ...

  4. 【NLP】万字长文带你解读『虚假新闻检测』最新进展

    NewBeeNLP原创出品 公众号专栏作者 @byn blog | https://blog.csdn.net/byn12345 互联网时代,假新闻铺天盖地,而且极具迷惑性,因此假新闻检测任务对逻辑的 ...

  5. SIGIR 2021 | 基于用户偏好感知的虚假新闻检测

    ©PaperWeekly 原创 · 作者 | 金金 单位 | 阿里巴巴研究实习生 研究方向 | 推荐系统 简介 近年来,虚假信息和假新闻对个人和社会造成了不利影响,引起了对假新闻检测的广泛关注.大多数 ...

  6. 【论文阅读】Multimodal Fusion with Co-Attention Networks for Fake News Detection --- 虚假新闻检测,多模态融合

    本博客系本人理解该论文之后所写,非逐句翻译,预知该论文详情,请参阅论文原文. 论文标题:Multimodal Fusion with Co-Attention Networks for Fake Ne ...

  7. 一文看懂虚假新闻检测(附数据集 论文推荐)

    作者丨孙子荀 单位丨腾讯科技高级研究员 研究方向丨多模态内容质量 本人过去几年一直从事内容质量方面的算法工作,近期出于兴趣对假新闻这个问题做了一些调研,简单总结一下提供读者参考. 在某种程度上假新闻的 ...

  8. 智源计算所-互联网虚假新闻检测挑战赛(冠军)方案,开源分享

    比赛链接为 https://www.biendata.com/competition/falsenews/ 比赛由智源研究院和中科院计算所主办,比赛平台为biendata. 冠军模型可以访问下述链接获 ...

  9. 揭秘中国网络虚假新闻“制造器”,看传播者如何操纵操纵大众舆论?

    本文讲的是揭秘中国网络虚假新闻"制造器",看传播者如何操纵操纵大众舆论?,目前越来越多的人使用并依赖互联网,互联网已经跟我们生活越来越密切,大量的信息通过互联网不断的飞速传播,其重 ...

最新文章

  1. HDU1671-Phone List (trie树)
  2. PHP设计模式:工厂(静态方法里调用newobj的方法)单例(三私一公newself)注册树(使用静态变量数组存取对象)适配器(主体建立接口适配器丰富方法)
  3. 虚拟机安装以及PCL的配置(1)
  4. Ubuntu14.04LTS打造实用的环境
  5. 场景化封装,一站式使用,普惠AI集成 ——阿里云发布智能媒体管理产品
  6. 关于ConcurrentDictionary的线程安全
  7. 基于springboot+vue的智慧教室预约系统(前后端分离)
  8. PS 2022,PR 2018,AE 2017【百度网盘链接,没套路】
  9. 每个开发人员应该拥有的K8S工具
  10. 小白入门该如何学习PR视频剪辑软件及辅助工具的使用呢?
  11. 禧龙字王 v1.0 beta 4 服务器版 是什么
  12. DNS 报文结构和个人 DNS 解析代码实现——解决 getaddrinfo() 阻塞问题
  13. WARNING: The directory '/home/zhex/.cache/pip/http' or its parent directory is not owned by the curr
  14. 2019年为android开发准备的面试题(含答案)
  15. win10 修改 Inter VT-x
  16. 有什么好用的在线图表制作网站吗?试试这个吧
  17. 卫生事业单位计算机科学与技术,卫生事业单位考试计算机科学与技术学习知识点.docx...
  18. 游戏服务端(MMORPG)的基础算法二、寻路
  19. try{}里面有一个return语句,那么紧跟在这个try后的finally{}里的code会不会被执行,什么时候被执行,在return前还是后?
  20. 唐宇迪学习笔记3:Python数据可视化库——Matplotlib

热门文章

  1. 刘知远:近年来开源的算法代码、工具包列表
  2. 2015年二级c语言真题及答案,2015年计算机二级C语言测试题及答案(4)
  3. MySQL内存预估_mysql时该如何估算内存的消耗,公式如何计算?
  4. SAP QM 执行事务代码QS23为检验特性分配Selected Set的时候报错 - You cannot use entries from catalogs 1 and 3-
  5. 基于Transformer的高效、低延时、流式语音识别模型
  6. PM配置详解之一:企业结构
  7. 医学与人工智能交叉融合,打开眼科理疗新窗
  8. 现代NLP中的零样本学习
  9. FBL3N/FBL3H/FAGLL03/FAGLL03H的区别
  10. AI 系统可帮助医生发现脑动脉瘤