作者:Kartik Singh

翻译:李洁

校对:丁楠雅

本文约3900字,建议阅读10+分钟

本文为你分析结合大数据和区块链的优势,介绍其实际应用,并分析区块链未来。


简介


在过去几年中,区块链已成为工业界技术发展最热门的领域之一。其原因显而易见。具有前瞻性思维的企业正在寻找无数方法,以使这项技术适用于各种实用案例和应用程序。然而,该技术大部分的发展都来自以下两个地方:资金雄厚的公司和加密初创公司。

这意味着最新的区块链技术对于中小型企业(SME)来说是遥不可及的。这导致了某些数字鸿沟的产生,而且鸿沟似乎每天都在扩大。但是,有一些区块链项目有望使中小企业的技术民主化。此外,这项技术甚至可以同样应用于大数据和分析的启动。

在这篇博客中,我们将探讨大数据和区块链的基础知识。此外,我们将分析结合大数据和区块链的优势。最后,我们将看看现实世界中的应用,并以对未来区块链的预测结尾。

大数据


通常,大数据是指海量且复杂的数据集。传统的数据处理软件无法在合理的时间内捕获和处理这些数据。

这些大数据集可能包括结构化,非结构化和半结构化的数据,每个数据都可以通过分析获得洞察力。

究竟有多少数据才能构成“大数据”还有待商榷。但它通常可以是pb(petabyte)的数倍——对于最大型的项目可能会到exabytes范围。

通常,大数据是三个维度的组合:

  • 海量的数据量

  • 多种的数据类型

  • 需要处理和分析数据的速度

构成大数据存储的数据可以来自网站,社交媒体,桌面和移动应用程序等。大数据的概念是使组织能够将数据投入实际使用的成分。此外,大数据可以用于解决许多商业问题。这些问题包括支持大数据的IT基础设施,应用于大数据的分析,大数据项目所需的技术,相关技能,以及对大数据有意义的实际用例。

区块链


区块链是一项正在彻底改变互联网运作方式的技术。区块链技术的一些主要特点是:

  • 该技术的工作原理是创建一系列数据记录,其中每个新记录都保存在一个块中,并具有指向前一个记录的链接。术语“区块链”源自这种连接数据块的系统。

  • 区块链技术使分布式账户系统成为可能,使记录更加透明。

  • 它使用加密技术来保护用户信息,并且分布式账户系统几乎不可能被黑。

  • 区块链构成加密货币的主干,但也有其他几个应用。

  • 区块链网络上的加密货币交换可以是中央的或网络的。

  • 分散的加密货币交换几乎不可能被破解,因为有多个节点支持该系统。

  • 区块链技术使得内容的点对点共享成为可能,而无需中间人平台。

  • 无论你通过区块链网络分享什么内容,你都将保留对内容的所有权,除非你将其出售给其他人。

  • 个人信息非常安全,并受私钥加密保护。

简而言之,区块链是一种可以让用户有机会安全地共享内容或进行交易,而无需中间人或中央管理系统的网络技术。


什么是块?


简单来说,作为区块链一部分,块是一个记录网络上任何类型事务的数据文件。数据永久保存在块上,成为链的一部分,且无法篡改。例如,如果你购买两个比特币,则交易可以用你的私钥在一个块中完成。私钥是你的数字签名,并将交易链接到你。在该日期你买了两个比特币的事件现在会永远记录在一个块中。

如果你想用一个比特币买东西,你需要提供你的私钥。比特币矿工将使用你的密钥跟踪你的最后一笔交易,并可以验证你有两个比特币。当你使用一个比特币时,该交易将保存在一个新块中,并通过一系列字符链接到你的上一个交易。这样,你的所有交易都将在网络上进行审核。

什么是哈希表?


区块链如此受欢迎的原因之一是,尽管它上面的信息虽然是分布式的,但却是高度加密的。区块链上的数据通过创建哈希表进行加密。需要一种算法来创建散列,它通过获取事务信息并将其转换为一系列数字和字母来运作。哈希表总是具有相同的长度。

从表面上看,哈希表对任何人都没有意义。这是矿工的用处所在。矿工拥有特殊的技能和资源来破译哈希表并验证交易。矿工通过在每次提供服务时生成的比特币来获得报酬。

什么是节点?


区块链和加密货币已成为去中心化的同义词。权力下放构成了整个系统透明度和安全性的基础。但是,即使是分散的系统也需要一个支持系统来赋予它某种形式和结构。这个支持系统以节点的形式出现。

节点是遍布区块链网络的活动中心。只有在节点处才可以使用区块链副本、处理事务和记录。节点由通过自己的设备连接到系统的个体组成。每种加密货币都有自己的一组节点来跟踪其货币。

为何选择区块链?


区块链的优势在于它是分散的,没有任何一个人或公司控制数据的输入或其完整性。然而,区块链的这一神圣性是通过网络上的每台计算机的不断检测而实现的。由于所有点都持有相同的信息,因此点“A”处的损坏数据不能成为链的一部分,因为它与点“B”和“C”处的等效数据不匹配。

综上所述,区块链是不可变的——只要网络存在,信息就会保持相同的状态。

为什么要将大数据与区块链结合起来?

1. 安全

区块链不是将数据上传到云服务器或将其存储在单个位置,而是将所有内容分成小块,并将它们分布到整个计算机网络中。它有效地排除了中间人。没有必要使用第三方来处理交易。当你可以依赖分散的、不可变的帐户时,你不必信任供应商或服务提供商。此外,区块链上发生的所有事情都是加密的,并且可以证明数据没有被更改。由于其分布式特性,你可以检查网络中所有节点上的所有账户的文件签名,并验证它们是否未更改

2. 数据质量


区块链提供卓越的数据安全性和数据质量,因此正在改变人们处理大数据的方式。这可能非常有用,因为安全性仍然是物联网(IoT)生态系统的主要关注点。物联网系统将各种设备和大量数据暴露给安全漏洞。区块链具有阻止黑客和为从银行业、医疗保健到智能城市等许多领域提供安全性的巨大潜力。

3. 隐私


这是区块链与当今常见的传统技术模式区别开来的主要方式之一。区块链不需要网络层本身的任何标识。这意味着下载和使用该技术不需要姓名,电子邮件,地址或任何其他信息。缺乏对个人信息的严格要求意味着没有中央服务器存储用户信息,使得区块链技术比可以被破坏而使其用户的敏感数据处于危险之中的中央服务器更安全。

4. 透明度


区块链技术最吸引人的方面之一是它可以提供的隐私程度。然而,这导致了一些关于隐私和透明度如何能够有效共存的困惑。区块链的透明度源于每个公共地址的持有和交易都可以查看的事实。使用具有用户公共地址的资源管理器,可以查看其资产及其交易。这种透明度在以前的金融系统中并不存在,特别是在大型企业方面,并且增加了迄今为止尚未存在的一定程度的问责制。

5. 自动化


如今,业务流程的趋势无可否认地正在从缓慢的手动方法转向更高的自动化和集中化。自动化流程有很多好处,仅举几例来说:更快地完成任务,提高可见性,标准化输出,减少错误并降低成本。虽然自动化已经做了在帮助公司提高效率和生产力方面提供了很大帮助,但未来可预见还会有进一步的变化。特别是,区块链工作流程的自动化可以帮助那些严重依赖交易和基于文档的流程的组织在数字化转型中迈出下一步。

应用

1. 反洗钱


区块链技术及其账户可提高监管机构的透明度,改善报告流程。此外,共享和不可变的账户保证了未更改的事务历史记录。此外,账户可以作为数据存储的中心枢纽来处理交易。它可以与金融服务公司和监管机构内的风险管理人员一起开展活动。

在分布式网络中,利用基于加密的身份管理技术可以实现身份管理的改进。此外,数字身份改进可以帮助金融机构满足不断变化的KYC和CDD要求。此外,这可以同时降低与实施强大的KYC项目相关的成本。最终,从长远来看,可以减少金融犯罪和违规行为。

2. 网络安全

区块链技术存在于我们生活的各个领域,不仅仅是银行和医疗保健等领域。此外,网络安全是一项通过这项技术可以获得很多收益的行业,未来会有更多的发展空间。此外,通过从数据存储中删除大部分人为因素,区块链显著降低了人为错误的风险,而人为错误是造成数据泄露的最大原因。这项技术之所以如此受欢迎,是因为你可以把任何数字资产或交易放入区块链,业界并不重要。此外,区块链技术可以防止任何类型的数据泄露,身份盗窃,网络攻击或交易中的犯规。因此,数据保持私密性和安全性。

3. 供应链监控


毕马威会计师事务所的这份报告展示了区块链在大数据供应链解决方案中应用的可能性。除了区块链,还有一个移动应用程序监控交易物在运输过程中的状态。报告称,所有各方都可以获得“近乎实时”的数据。其中的好处包括核实产品标签声明和产品来源。最重要的是实现在公平工资等方面保障人权的可能性。

4. 金融AI系统

在金融交易方面,区块链正在以一种主要方式飞速发展,并将成为货币交易的一个重要方面。还有许多其他创新方法,其中大数据和区块链可以同步以在金融服务行业中提供强大的产品。通过区块链实现,审计可以以一种非常彻底的方式进行增强。此外,安永会计师事务所报告指出,“现在是进行试验的时候了。”

5. 汽车AI系统


汽车工业正进入一个全新的存在阶段,通过掌握大量传感器和通信技术,使汽车现在更加共享化和自动驾驶化。随着汽车自动化,使用区块链的可用选择范围始于车辆数据的完全标准化,构成了100%的信息汽车市场。

6. 病历


这是一个记录至关重要且始终需要保存和审查的区域。当为这个面向数据的部门提供动力的大数据系统通过区块链系统时,所有记录都保留了清晰的跟踪记录,而对记录进行的所有迁移和解释都是以透明的方式维护的。此外,对于在系统中研究人员可以在总体水平上为挖掘数据做出贡献的话题也已在讨论中。谷歌也正在开发区块链系统,以确保健康记录的安全性。

总结


区块链技术只是未来发展自动化和业务流程管理的方法之一。虽然区块链仍处于技术生命周期的早期阶段,但通过更广泛的公众采用的持续压力测试只会通过改进已经运行的构建块来使生态系统更加健壮。毫无疑问,区块链对于数据科学来说很有前景。但事实是,我们没有很多工业规模的区块链技术系统。此外,对于数据科学家来说,这意味着使用区块链技术挖掘数据宝藏仍然需要一段时间。

原文标题:

A Beginner’s Guide to Big Data and Blockchain

原文链接:

https://www.codementor.io/divyacyclitics15/a-beginner-s-guide-to-big-data-and-blockchain-t891dt5xe

编辑:黄继彦

校对:林亦霖

译者简介

李洁,香港科技大学电信学硕士毕业生,现任北京师范大学香港浸会大学联合学院 数据科学系助教。喜欢数据科学,喜欢阅读,喜欢研究代码和做手工。希望一直保持学习的状态和对生活的热爱,每天都快乐而有进步~

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,数据派THU产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

点击“阅读原文”拥抱组织

独家 | 新手指南:大数据、区块链及其结合(附应用场景)相关推荐

  1. 三方流通平台:中国大数据区块链开启web5.0时代

    蔡维德教授在天德科技带领团队开发了世界第一个大数据版的区块链,第一个分布式异构链网模型--金丝猴模型.第一个分布式同质链网模型--熊猫模型以及第一个基于区块链的产业沙盒. 以下是蔡教授对区块链开启的价 ...

  2. 区块链的20种应用场景

    区块链的20种应用场景 随着BTC等代币的热炒,区块链逐渐被大众所熟知,但这种认知绝大部分是模糊的,有些人甚至将代币与区块链画上了等号.而实际上,区块链只是一个底层技术,简单点来说,区块链技术是一种互 ...

  3. 百度工程师深度好文, 横评3大企业级区块链技术平台

    百度工程师深度好文, 横评3大企业级区块链技术平台! 区块链从独立的技术范式,慢慢扩展到企业区块链的融合范式,是下一代区块链的核心特征.在区块链技术与AI.大数据.云计算技术加速融合的今天,区块链如何 ...

  4. 盘点10大热门区块链开源软件,你知道几个?

    越来越多的企业将开源软件作为其构建基础信息系统的重要选择,"低成本.安全性高.灵活自由.高可用性.协同性好--"一连串的技术优势,让越来越多的企业无法拒绝. 在区块链领域,又有哪些 ...

  5. 湖大爱康区块链金融研究中心 关于MXC项目的研究报告

    一.MXC项目核心逻辑 1.物联网行业前景广阔 物联网是新一代信息技术的重要组成部分,也是"信息化"时代的重要发展阶段.全球物联网市场目前处于高速发展阶段,规模不断扩大,物联网设备 ...

  6. 基于自主数字身份的个人数据区块链托管破解征信“断直连”困局

    作者简介:汪德嘉,美国威斯康星大学麦迪逊分校数学博士.九三学社社员.正高级工程师:时空码发明者,<身份危机>与<数字身份>专著作者:曾在ORACLE.VISA.IBM等企业部门 ...

  7. 优易数据研究院院长车品觉:如何形成大数据生态链的闭环

    5月26日,优易数据研究院院长车品觉在数博会"大数据创新生态体系论坛"上发表<如何形成大数据生态链的闭环>的主题演讲. 生态一词,是个复杂的系统;由于系统复杂,就需要协 ...

  8. 会议2_2015阿帕奇路演(中国站)大数据生态链分场内容概览

    大数据生态链分场在大会的第一天下午举办,有五位嘉宾进行了相关演讲. 具体演讲内容如下: 2015年10月24日 下午 分会场3:大数据生态体系/Big Data Ecosystem 话题1:Hadoo ...

  9. 又有大佬加入! 「3点钟区块链」之大年初五:不眠夜共襄区块链应用落地 ! (附96小时实录)

    又有大佬加入! 「3点钟区块链」之大年初五:不眠夜共襄区块链应用落地 ! (附96小时实录) 本文作者:AI金融评论 2018-02-21 12:13 导语:他们就区块链底层技术发展路径.国际金融监管 ...

  10. 区块链不适用的若干场景

    这三个问题可以帮你避开不实宣传. 不错,"区块链"这个概念异常的火热. 众所周知,我一直关注区块链及相关技术的成熟度发展情况,思考我们是否对其评价过高了:但从目前的情况来看,还没有 ...

最新文章

  1. 使用正则表达式抽取新闻/BBS网页发表时间
  2. 数据窗口retrieve查询结果生成新表_SQL系列之窗口函数及经典使用场景,如topN排名问题...
  3. 如何将光标定位到行尾
  4. Dubbo服务发布调用
  5. android 获取位置数据库,尝试从webview获取位置时,Android“SQLite数据库无法从/CachedGeoposition.db加载”错误...
  6. 关于启明星辰IDS无法CONSOLE连接
  7. oracle json入参调用ws服务返回请求失败_Spring 5.2.2技术集成 —Spring HTTP调用程序和JAXWS...
  8. 让程序结果在屏幕上暂停一段时间
  9. Android与服务器通信之socket通信
  10. android 根据bounds坐标进行点击操作_炫酷的Android时钟UI控件,隔壁产品都馋哭了...
  11. win10配置gcc编译环境
  12. osip和mysql_Windows下编译eXosip、osip,以及UAC和UAS的例子
  13. netty 入门(一)
  14. windows phone 切换多语言时,商店标题显示错误的问题
  15. svg, ttf, woff, woff2图标的转换
  16. TypeScript——Web前端开发的救赎
  17. 最左推导和最右推导,语法树,二义性文法
  18. 抖音提示原创度低,这会导致封号么?给你几点建议
  19. linux c++ 文件修改时间,linux下C获取系统时间的方法
  20. FileReader -- 图片预览问题

热门文章

  1. LuatOS快速上手——GPS定位
  2. 线性代数之——行列式公式及代数余子式
  3. 工作站 桌面 服务器,图形工作站也虚拟化,立即让你的工作站也可以远程访问
  4. javaspringboot面试题,java面试问职业规划
  5. ADB interface 驱动下载,以及使用,Because an app is obscuring a permission request settings can’t verify your
  6. Python中字符串的反转,及sord、 sorted、reverse、reversed的区别
  7. js获取指定字符后面的字符
  8. 关于Arduino、树莓派和 Pixhawk微处理器对比分析
  9. 【计导非课系列】绪言——什么是“计导非课”系列?
  10. 39 Flutter仿京东商城项目 收货地址列表、增加 修改收货地址布局、弹出省市区选择器...