fake news:使用区块链技术来保证新闻中数字媒体的真实性。
Steve Huckle, Martin White

摘要:
在这篇文章中,我们介绍了一个利用区块链技术来保证数字媒体的消息来源的技术原型。在假新闻的时代,当有人给我们看了某一事件的一段视频或一张图片,我们应该如何确认他的真实性?似乎公众已经不再完全相信传统媒体是一个可以参考的信息来源,这是因为有许多对于相同信息的矛盾报导。确实,在2016年美国总统选举的时候,“假”新闻尤为明显。 特朗普总统声称纽约时报试图用过推断虚假信息来诋毁他。目前克服虚假新闻问题的研究并不着眼于建立这些故事中使用的媒体资源的所有权 - 本文中介绍的基于区块链的应用程序是能够指示数字媒体真实性的技术。简单地讲,使用基于信任机制的区块链技术,该工具毫无疑问可以显示任何数字媒体源的来源,包括使用的图像试图误导的背景。尽管该应用程序是一个早期的原型,并且它的查找假资源的能力有限,但我们概述了未来的改进,以克服这些限制。此外,我们相信我们的应用(及其使用区块链技术和标准化元数据)引入了一种新颖的方法来克服新闻报道中的错误以及其中使用的媒体资源的来源。虽然我们的应用有能力来验证媒体来源的正确性,但我们相信技术知识解决虚假新闻的一种技术手段。这是因为它不可能证明整个故事的正确性。我们相信这需要人力来解决。

关键词: 虚假新闻,区块链,大数据,Ethereum,哈希函数,密码学,公钥加密技术,数字签名,保存元数据

Introduction

2016年美国总统选举的获胜者唐纳德·特朗普指责各种媒体纷纷加入协同行动时,假新闻问题成为头条新闻。通过发布恶作剧和宣传来诋毁他,甚至在总统的指责之前,其中一份牵连的报纸“纽约时报”刊登了一则报道,称特朗普的一位知名支持者正在传播消息。大概是新闻调查之后,这家报纸宣称在基督教时报网站上使用的照片(如图1所示)表明美国总统的反对者正在操纵选票,实际上是来自英国的伯明翰邮报。图为英国选举中使用的投票箱,而不是俄亥俄州仓库中发现的克林顿投票票,该网站声称。 如果这些调查工作是不必要的呢?如果想要确定视频或照片的出处是十分简单的呢?我们不仅可以相信这些材料,并且我们可以不相信任何没有验证过的材料。
这篇文章主要是要介绍基于区块链技术的应用(我们把它称为Provenator),一个可以帮助证明数据源头的工具。

保证信任和数据源真实性的方法
应用Provenator使用密码学方法来帮助确定媒体资源的真实性。
另外,它使用schema来记录和检索描述这些媒体资源的元数据。我们接下来描述这些技术。
区块链
区块链具有能够确定完整性和真实性的能力,因为它们本质上是具有内置信任机制的不可变数据库技术。这里包含了密码学算法,数字签名,保证了安全的多方协作,而不需要中心媒介。区块链还可以执行智能合约,智能合约时一个可以自动执行的可验证的代码。总的来说,区块链是一个可信任的账本,可以执行程序的逻辑。进一步讲,他们不能被任何单一的个体所控制。这些机制说明我们可以使用区块链作为存储媒体资源的每件,任何个体可以认为这些存在区块链上的信息是真实的。我们仍旧需要一个合适的方式来将数据存储在区块链上。我们会在之后讨论这一问题。

元数据的出处
使用了PREMIS 数据模型,PREMIS代表Preservation Metadata: Implementation Strategies。它概述了一个有助于识别资源的出处模式。PREMIS数据模型,描述了四个保存实体:(1)object, (2)events,(3)agents, (4) rights. Provenator使用PREMIS定义来记录在区块链上的数字媒体,并使用智能合约。这可以确保数据符合开放标准,这应该“保证”所持有的信息,并有助于促进与不同用户的进一步互动。

Provenator应用程序

Provenator的主要思想是一个内容的创建者需要证明他所创建的资源。想要做到这一点,Provenator让创建者有能力来存储相关的创建信息的验证信息到区块链上,这样就可以被很容易地获取数据、验证数据。

Provenator程序的需求
我们仍然需要考虑证明媒体资源的起源元数据所需的步骤,幸运的是我们不需要自己考虑这些,因为“信任(trust)”流程和发布Ubuntu操作系统十分类似。

发布Ubuntu操作系统:整个流程包括使用数字签名来帮助确保下载和安装的软件可以被信任。具体流程如下:

(1) 下载操作系统的磁盘映像,以及校验和文件和用于签署校验和文件的签名

(2) 获取将要使用签名的对应公钥

(3) 使用公钥来验证校验值

(4) 使用SHA256哈希算法来对操作系统的磁盘映像进行哈希

(5) 对比两个哈希值(磁盘映像哈希值和校验文件哈希值)

执行以上的操作,如果哈希配对成功,用户可以安装操作系统并相信他安装的是官方的Ubuntu系统。

Provenator程序的操作:

借鉴Ubuntu系统的验证流程,Provenator应该完成以下操作:

(1) 获取数字媒体资源的哈希值

(2) 建立数字资源的PREMIS

(3) 在区块链上签名存储数字资源的哈希及其关联元数据的交易(transaction)

通过这个流程,由于区块链记录的不变性,用户能够信任数字媒体元数据的完整性和真实性。以下流程展示了provenator如何让用户可以检查在区块链上的数据的:

(1) 获取数字资源的的哈希值

(2) 检查在区块链中是否存在这一哈希值

(3) 如果哈希值存在,获取对应的元数据

Provenator的框架

Provenator包含以下框架

  • 使用Ethereum区块链,存储provenance媒体资源的元数据。

  • Ethereum智能合约,使用Solidity语言编写,读取和写入PREMIS格式的媒体资源

  • 基于Javascript的网络程序,使用React编写,用来创建和访问在Ethereum智能合约中存储的PREMIS数据。

Provenator的原型代码:(https://github.com/glowkeeper/Provenator).

程序原型:

Provenator的程序原型工作在InterPlanetary File System (IPFS)的网络上。IPFS是一个对等的内容寻址文件系统,它构成了我们应用程序架构的最终组件。整个程序是完全分布式的。IPFS使用密码学工具来保证存储在网络中数据的真实性。下面是对IPFS的简要介绍。

The InterPlanetary file system IPFS

IPFS部署一个基于Merkle有向无环图(DAG)以建立可信数据的分散式网络。将哈希函数使用到图数据中是Ralph Merkle用来传输可靠信息的解决方法。这个思想十分有影响力,许多系统都是用Merkle DAGs来实现可信系统,比如IPFS和Bitcoin。Merkle DAG 最基本的原则是如果拥有了一个根节点的哈希值,并且哈希来自于一个可信的实体,,那么只要得到的哈希值和这个哈希值一致,我们可以相信所有的叶子结点都是真实的。IPFS使用Merkle DAG 来表示对象之间的链接,这些链接都是在文件系统中对应块的哈希。

这个图片展示了IPFS中的图像存储。任何在IPFS中存储的文件都会被确保是惟一的。只要文件可以形成一个Merkle DAG,它就可以被信任是真实的。 IPFS网络上的节点彼此连接以传输和存储对象,因为它们使用PKC来建立其身份,所以它们可以被视为可信来源。当两个节点连接时,他们彼此交换公钥来对传输进行加密。

智能合约的部分
在写入时,Provenator使用Ethereum的Testnet Ropsten。如果使用公有链,则需要消耗一定的Ether来存储电子资源的元数据。从区块链中获取数据是免费的。这对于构建一个DApp是十分重要的设计原则。主要的用户接口是使用Javascript来进行交互的。
Provenator的使用
可交换图像文件格式(Exif)是用于指定关于图像文件的信息的标准,包括诸如描述和版权信息的数据。不幸的是,这些数据很容易改变。据推测,“Christian Times”的编辑就是这么做的,因此,“The New York Times”不得不竭尽全力证明图像的脱离背景使用。现在想象一下,Alice是拍摄该照片的摄影师,并且她使用Provenator在区块链上记录了有关图片的数据。在这种情况下,证明“Christian Times”错误地使用了Alice的照片将是使用Provenator的一个简单问题。因此,The New York Times可以节省很多麻烦。接下来,我们将使用Provenator作为该照片的创建者,讨论Alice用于注册自己的模式(schema)。

Provenator的PREMIS

图12展示了Alice使用Provenator的PREMIS数据模型来创建的照片信息,其被存到了区块链上。她储存了图片的哈希值和对应的元数据(比如说图片的描述)作为了PREMIS的object。图片的拍照时间被记录为PREMIS的event(事件)。PREMIS的agent是Alice本人。PREMIS的版权信息展示了图片的版权。我们在上面展示的元数据的实现描述了一个单独的对象 - Alice关于Sheldon选举中使用的投票箱的图片。这个对象只有一个agent为Alice本人。只有一个event是图片拍照的时间。只有一个版权信息Birmingham Mail的版权。但是,在Provenator中使用的PREMIS模型更加的复杂。它可以使用多个属性来描述PREMIS的对象,比如说多个agent,event,版权信息。尽管event可能只属于一个agent,但agent可以记录多个event,拥有许多对象,并部署许多不同的版权。最后,特定版权属于单个对象和单个agent。

MetaMask 这是一个可以将Ethereum DApp运行在浏览器中的一个工具。当使用Provenator时候,Alice可以使用MetaMask来对交易(transaction)进行签名,以便将关于照片的PREMIS存储在区块链上。通过这样做,任何访问这些数据的人都有信心,这是Alice自己记录的信息。

浏览PREMIS 数据
现在Alice已经记录了她的图片信息。Bob是她的编辑,可以使用这个图片来生成一个哈希,并且从区块链中也获取对应哈希。图13展示了Provenator的截图,Bob获得的图片信息。
根据哈希函数的确定性和抗碰撞性,获取了信息,Bob可以相信Alice发送图片的正确性。因此,“The New York Times”本可以通过将“Christian Times”的副本上传到Provenator来检查图片的有效性,而不是通过大量的调查长度来证明使用Alice的图像。然后,他们将检索到与Bob相同的元数据,这会显示图片是假的。然而,尽管这可能表明图像本身是假的,但它并不能证明整篇文章是虚构的。证明这可能比技术稍微多一点。我们接下来考虑这个问题。

验证新闻
BBC在叙利亚冲突前线提供准确的新闻报道方面遇到很多困难。事实上,记者在那里失去了生命,所以从普通的叙利亚公民那里找到故事已经成为惯例。但是,确保这种“用户生成内容”(UGC)的有效性一直是“记者必须学习的技能。BBC已经使用新方法来保证UGC的有效性。显然,这些方法涉及技术,但也涉及常识,并与可靠的叙利亚人建立健康的关系。通常都是使用大数据技术和人的知识来去验证正确性。 例如,一个项目主张组建一个假新闻语料库来帮助欺骗检测,为此,在收集数据时,合格的参与者将被要求发现假新闻。大数据技术都需要人为的干预,无论是用数据可视化还是其他方法。使用Provenator,用户可以验证新闻中使用的多媒体信息。此外,虽然技术可以证明新闻媒体资源的有效性,但证明整个假新闻报道的真实性往往需要良好的新闻实践。

当前的局限性
Provenator系统中存在一些问题。对于图片来说,如果只是改变几个像素点,虽然图片看起来没怎么变化,但哈希却截然不同。Christian Times可以轻而易举地改动选举图片的几个像素而摧毁这样的验证机制。不过,我们可以使用一些额外的技术来弥补这一不足。比如我们可以使用fisher vector和k-means聚类来查找相似图片。

fake news:使用区块链技术来保证新闻中数字媒体的真实性。相关推荐

  1. 区块链技术应用到现实场景中,是个什么样?

    一张不会被篡改的电子发票.一项难以造假的食品溯源系统--如果区块链技术应用到现实场景中,或许能解决人们日常生活中许多难以解决的痛点. 为了推动该技术的成熟和落地,4月21日上午,河南省区块链技术研究会 ...

  2. 谷歌adwords教程_区块链技术作为Google AdWords中的安全剧院

    谷歌adwords教程 Google operates the largest ad exchange in the world and recently decided to start inves ...

  3. 区块链技术在软件开发中的应用

    如果你是一名软件开发者或者IT从业者,你一定已经听说过区块链技术.区块链是一种基于密码学的分布式账本技术,被广泛应用于数字货币.金融.物联网等领域.但是,除了这些领域之外,区块链技术还可以在软件开发中 ...

  4. 《基于区块链技术的虚假新闻检测方法》文献阅读笔记+总结

    <基于区块链技术的虚假新闻检测方法>文献阅读笔记+总结 关键词:区块链.智能合约.虚假新闻.新闻网站.博弈论 来源 题目 时间 作者 中国学术期刊网络版 <基于区块链技术的虚假新闻检 ...

  5. 众享比特副总裁陈鸿刚:区块链技术在工业互联网中的应用

    2021年2月25日,由可信区块链推进计划和工业互联网产业联盟共同主办的"链接未来,合作共赢"区块链工业应用沙龙线上举办.北京众享比特科技有限公司副总裁.华东区总经理陈鸿刚应邀参加 ...

  6. 中国市级食品药品监督管理局将使用区块链技术以保证质量

    点击上方 "蓝色字" 可关注我们! 暴走时评: "人民日报"1月31日报道,中国重庆渝中区食品药品监督管理局将采用区块链技术进行运营.据称,区块链将由该机构进行 ...

  7. 区块链技术在食品溯源中的应用

    一.食品溯源机制 1.1食品溯源的研究意义 近年来,食品安全问题频发引起了社会大众的广泛关注.在当今食品贸易的大背景下,生产商和消费者之间存在着严重的信息不对称现象:生产商的有意误导.消费者的认知缺乏 ...

  8. 复星金服微服务_复星金服以区块链技术解决行业痛点 “中招公信链”项目正式启动...

    近日,中国招标投标公共服务平台在北京召开协同推进"互联网+"招标采购行动技术创新成果推广运用交流会,包括复星金融服务集团(以下简称"复星金服")在内的113家单 ...

  9. “区块链”技术在传统行业中的应用

    点击上方"中兴开发者社区",关注我们 每天读一篇一线开发者原创好文 比特币可能是一场庞氏骗局,但区块链技术却真实存在. 2013年以来,比特币受到了全世界投资者的狂热追捧,虽然几经 ...

最新文章

  1. 读redux源码总结
  2. 论文笔记:Autoregressive Tensor Factorizationfor Spatio-temporal Predictions
  3. matlab实现矩阵的旋转变换
  4. Qt文档阅读笔记-对JSON Save Game官方实例解析
  5. Redis 入门指南 pdf
  6. 轻量级 Lock Free 线程安全的 QueueT 的C#2.0实现
  7. 洛谷P1411 砝码称重
  8. 老男孩linux高端运维课程—linux系统目录结构知识讲解
  9. 缩写(三)——网络语言和缩写词
  10. 大于2019电大计算机应用上机表格题,2019年电大计算机应用基础试题及答案重要知识点...
  11. BigDecimal 往左移动两位小数_移动信号灯
  12. 数码类评测:南卡第二代pencil电容触控笔
  13. 九度oj-1158-买房子
  14. n平方的求和公式_1到N的平方和,立方和公式是怎么推导的?
  15. 【论文阅读】Fully Convolutional Networks for Semantic Segmentation【CVPR,PAMI】
  16. Stata新命令:readWind-快速读入并转换万德数据
  17. 前端性能优化 七个方面
  18. Java文件完整性校验SHA256
  19. js中foreach有三种写法,你知道吗
  20. QT error: No rule to make target ‘xxx.cpp‘, needed by ‘debug/xxx.o‘. Stop.解决方案

热门文章

  1. NO_ACCESS Protection
  2. Javascript 执行上下文(ES3)
  3. 阿里云远程桌面连接不到的问题
  4. [SUCCESS]Fedora install Nvidia-driver
  5. 使用jquery获取标签的id属性
  6. 【HGE引擎】源码解析——常用公共函数(二)
  7. 红外线探测报警器的简单设计
  8. Docker设置共享文件夹
  9. 堆栈指针寄存器 SP详解以及栈的作用
  10. jieba分词词性标注含义