作者:白硕

作者介绍:白硕,恒生研究院院长

在区块链以及自然语言处理、知识图谱等人工智能领域有深厚的造诣,在语言学、哲学方面也有深入研究,注重学科交叉与融会贯通。

数据被称为数字化时代的金矿,是基础战略资源,也是企业的核心资产。互联网平台以非常高的“数据粘性”,汇聚了大量的流量。这背后的原因是互联网上无稀缺:价值是守恒的,但是数据不守恒 。价值是稀缺的,数据也本该是稀缺的,而一旦数据被放到互联网上,稀缺就不成立了。这种非守恒性使得数据易复制、易泄露、易扩散。那么如何破局呢?

我们首先需要了解现在的几种数据经营模式:

私有终端模式 :由单一厂商全程掌控,这种模式在金融行业的资讯供应商中比较常见,有助于防止数据扩散,但在保护自己的同时,也限制了进一步的发展,存在以下几个问题:从数据来源来说,低成本采集是有极限的;从裸数据、带标数据,到智能化高阶数据、场景数据的链条过长,发展到一定程度会因为进入了不熟悉的技术领域而脱节;另类数据崛起,物联网数据、非结构化数据、平台数据等都在汇入传统数据,存在来源多样化、依赖数据协同、断供风险大、范围开放难固定等问题;权利意识正在逐渐觉醒,这对私有终端模式的发展也带来一定的影响。

数据湖模式 :由第三方掌控,多见于将政府数据用政府授权的方式集中起来,也即政府委托一个数据强势的平台方来运营数据湖,这种方式不一定合适金融业。

数据联邦模式 :包括去中心化的保护隐私的计算方式,也包括机器学习界提出的联邦学习方式,同时也兼顾数据权益保护等,目前的发展初具雏形。数据联邦的演进路径主要为:裸数据交易(全部可见)→使用权交易(可用则可见)→背靠背交易(可用不可见)。

互联网平台模式 :流量来源单一,有确定的流量入口,可以沉淀出数据,所沉淀的数据不外泄,但可以跟数据的需求方对接,例如电商所沉淀的数据可以提供给金融业使用。为什么互联网平台能够有如此神奇的数据汇聚能力,也即所谓的“数据粘性”呢?在眼球经济下,眼球之争实质是入口之争,而基于认知心理学领域的“常委定律”,人类的短时记忆容量是有限的,在数屏的APP中真正能够被用户经常使用的APP也是有限的,倒推下来,有机会留在大众眼球中的APP也是有限的。

面对数据需求与技术发展,市场一方面越来越需要“全栈服务 ”,包括场景集成、内容深加工等,另一方面需要开放的生态 ,企业可以将数据与共性技术服务作为后台,将基础业务能力作为中台,同时也将业务能力延伸到外部,把外部的服务集成进来与自有的服务一起推向前台。

隐蔽实体,见证关系

实现“全栈服务”与“开放生态”的转变,技术上的核心诉求是把实体隐蔽起来,去见证关系 。实现手段包括传统密码学和非密码学两种方式:传统密码学的方式涉及多方安全计算以及常规的安全协议;非密码学的方式主要是联邦学习。将这些技术按照严密的业务逻辑组织到一起,离不开区块链,尤其是智能合约。通过区块链的组织,这些技术可以构成数据权益保护的技术体系,让各参与方能够在去中心化的环境中进行可靠的见证,做到数据可用不可见

基于传统密码学的数据权益保护技术,不一定是彻底的,可能是有所牺牲的,例如牺牲去中心化、牺牲效率、牺牲隐私性等,会有一些侧重。例如央行的CCP方案没有采用区块链技术,但是基于区块链的思想做了中心化的系统;以太坊的状态通道(State Channel)方案,通过智能合约实现通道用户加密通信以及最终价值分配方案解密;R3联盟的Teer-off方案能够做到将隐私信息和公开信息用哈希树的方式串联起来,部分可见、部分不可见,但是不影响区块链本身的哈希值。

资本市场的交易后处理可以采用传统密码学的方式,既实现同时记账,又让每个证券公司只能看见涉及自身用户的单边账;买卖方研究机构对接时,可以使用同样的技术让特定的买方和特定的卖方建立别人不可见的连接,同时双方的数据也可以直通,一方的电子化文件直接通到另一方的系统里,并且还可以支持购买前的可信预披露机制。

基于非密码学的数据权益保护技术主要是联邦学习,基本思想是**“数据不动模型动”** ,依次运行不同数据所有者的数据,积累参数,走的时候只带走参数而不带走数据,从而在不汇聚数据的情况下,达到数据汇聚的效果 。但是模型从进到出,参数的变化能否反推出私有数据?是否足够安全可靠?如果数据是由多方贡献的,如何评估数据贡献度?依据这样的贡献度,如何去进行权益的分配、建立收益分享机制?所贡献的数据可能有优质数据、劣质数据,如何区别对待?这些是联邦学习带来的一些新问题。

提供基本的匿名性服务→有限局部的保护功能→全面彻底的保护功能→保护与利益分享相结合,这是区块链+数据权益保护技术的发展路径,需要通过博弈达到均衡

得生态优势者得天下

生态封闭性,使得生态外的应用和生态内的应用对于数据的访问权有明显的差异,造就了壁垒。壁垒的目的是要维持竞争的优势,但狭义理解的壁垒,一定要把别人的数据都抓在手里的壁垒,可能并不是优势 。通过打造去中心化的平台,可以让外部数据、外部应用都具有独立管辖权,不直接使用外部数据,而是通过外部应用间接使用外部数据。

试想,如果各种要素都能够在一个生态中得到有机的结合,内部的数据、外部的数据都能够纳入进来,深加工的结果、传统的结果也都能纳入进来,不同主体的贡献都能衡量出来并结算,特别是证券市场相关的数据如果能跟交易结合,那么就既可以to B也可以to C,希望行业能够共同朝着这样的愿景来努力。

更多金融科技文章见恒生LIGHT云社区

大数据时代如何通过区块链保证数据的稀缺性?相关推荐

  1. CSDN蒋涛大数据表明:DCO - 区块链时代企业级服务的全新机会

    CSDN蒋涛大数据表明:DCO - 区块链时代企业级服务的全新机会 2018年4月20号下午,2018区块链企业级服务创新论坛暨权大师A轮融资及战略升级发布会在北京凯迪克格兰云天酒店召开,在此次大会上 ...

  2. 数字经济建设在数字新技术体系上,数字新技术主要包括物联网、云计算、大数据、人工智能、区块链等五大技术

    40年以来,中国经济发展经历两大历史性变革,第一次是20世纪八九十年代,从计划经济转向市场经济,社会生产力大解放,经济高速度增长,中国成为世界第二大经济体,实现第一次历史性的大变革.第二次是21世纪从 ...

  3. 大数据、物联网、区块链:融合趋势三重奏的好处

    如今,大数据.物联网.区块链三大巨头板块正在改变着世界.随着全球科技的发展,它们逐渐形成了自己独特的个性趋势,搞技术的人几乎没有不认识它们的.那么大数据.物联网和区块链的结合会带来怎样的技术红利? 首 ...

  4. 大数据、云计算、区块链、人工智能!你选择哪个?

    日前,在以"突破"为主题的t112018暨talkingdata数值智能峰会上,数千名相干行业从业者研讨以数值驱动冲破发展的新模式.新路径. 目前计算机相干领域的就业情况还是比较不 ...

  5. 科普丨区块链与数据/数据库/大数据的结合与应用

    11月22号20:00,BlockMania  AMA直播第32期继续进行,本期主题为本期主题为「区块链/数据库/数据/大数据」,分享嘉宾为Intellishare CEO .加州州立大学计算机硕士熊 ...

  6. 基于区块链的数据市场

    点击上方蓝字关注我们 基于区块链的数据市场 汪靖伟, 郑臻哲, 吴帆, 陈贵海 上海交通大学计算机系,上海 200240 论文引用格式: 汪靖伟, 郑臻哲, 吴帆, 陈贵海. 基于区块链的数据市场.  ...

  7. 两大热门技术碰撞 论区块链在物联网中的应用

    区块链技术作为当前国内外的焦点技术之一,可能会对未来技术创新和产业变革产生重要影响,在物联网中将会有广阔的发展空间.本文介绍了区块链技术发展的基本情况,探讨了区块链技术在物联网中应用的主要方向,并在此 ...

  8. 技术推动产业变革 京东万象通过区块链解决数据流通顽疾

    对于政府来说,数据流通该不该管,谁来管,怎么管? 对于数据源提供者来说,经济效益不明显,维权困难: 对于购买者来说,所买数据是否合法,数据质量如何,价格是否合理? 数据交易是否是个人信息的倒买倒卖行为 ...

  9. 对话趣链张帅:区块链与数据融合,价值三段论凸显 | SDBD2020・算力在线

    21世纪,信息技术发展驶向高速,浪潮迭起,主角轮替.如今,区块链成为万物互联时代的入口,并作为中间横向技术,为人工智能.云计算.物联网.大数据技术之间做粘合.新技术的运转离不开数据的生成.传递.存储, ...

最新文章

  1. WinDBG 要点学习
  2. 实现线程栈初始化(RTT)
  3. Matlab-使用逻辑值进行索引
  4. CC2530之Flash笔记
  5. iOS之深入解析内存管理Tagged Pointer的底层原理
  6. 揭秘北京2022冬奥会背后的技术
  7. linux重启mysqlsystemctl_解决linux(centos7)重新安装mysql systemctl start mysqld.service时报错...
  8. 杭电acm 2024 C语言合法标识符
  9. mysql pk_mysql_1
  10. mysql数据库集群版_MySQL数据库集群实战
  11. 用MATLAB做结构灵敏度分析怎么做,matlab灵敏度分析例题
  12. 微信支付:Native 模式 + 二维码生成技术!+ XML<> Map转换
  13. 微信OAuth2.0网页受权php
  14. 微信小程序开发工具报错对应的服务器证书无效
  15. 给大家普及呼叫中心和电话营销系统相关知识--中继线路
  16. B站大佬用我的世界搞出卷积神经网络,LeCun转发!爆肝6个月,播放破百万
  17. node 工具模块lodash
  18. CAD中遇到几个奇怪问题的解决
  19. 如何在Windows上下载java
  20. 大学生三个痛点及分析

热门文章

  1. [附源码]JAVA+ssm计算机毕业设计餐饮管理系统(程序+Lw)
  2. 详解c语言欧拉函数,【基础数论】十分钟学会计算欧拉函数
  3. html怎么做成正方形符号,javascript – Highcharts:使图例符号为正方形或矩形
  4. python绘制穿山甲字符画视频:这喝汤多是一件美逝
  5. Nginx的proxy_pass及upstream的小型负载均衡
  6. 胡水生:中小型企业如何应对互联网的发展
  7. Ciri智能语音系统
  8. java新手,写了个简单的计算器,求高手指点一二
  9. 基于Redis GEO(地理位置) 实现附近的人,商家等相关功能实现 使用SpringBoot Redis工具类
  10. 宾得的宾干微距镜头DA35mm