自从数据正式被纳入生产要素,联邦学习、区块链隐私计算等新算法涌现,业界围绕算法数据的讨论不绝于耳。如何寻求数据安全与隐私保护的平衡点?如何把握智能数据与区块链的融合趋势?
8月25日,SIGKDD·SDBD2020 第二届智能数据和区块链应用国际研讨会在线上圆满举办。圆桌会议作为重要剧目压轴登场,上下半场,集结业内知名专家学者,热议前沿话题。

1

如何冲破高墙,实现数据价值共享

圆桌会议上半场主题为“数据赋能场景,如何驱动产业创新?”由新加坡管理大学终身教授 朱飞达主持,特邀科大讯飞大数据研究院执行院长  谭昶、普元信息大数据产品线经理  臧一超、上海万向区块链股份公司副总经理、万向区块链实验室负责人 杜宇、锘崴科技创始人 王爽 展开深入探讨。

朱飞达教授表示,数据经济经历了三个阶段。第一阶段数据只是商业活动的副产品,人们更多用数据理解过去。第二阶段是大数据与数据经济的兴起,数据被少部分企业垄断而得利。第三阶段则是数据驱动经济,数据成为驱动所有机构组织的共享资产。

从联邦学习、迁移学习到区块链隐私计算,算法也未曾放慢脚步。那么,究竟是数据先行还是算法先行?

在实践层面 谭昶表示算法和数据同等重要,原始数据的获取是进行有效算法的基础,反向数据依赖高质量算法加工得到结果才能落地应用场景。

臧一超认为数据和算法并驾齐驱,基于数据质量的重要性,我们会进行数据应用全生命周期管理。过程中,通过数据治理结合算法构建数据服务平台,形成企业内部的数据生产力。

杜宇从企业自身角度出发,认为在工业板块中数据更为重要,各类工厂也在积极进行数字化转型;站在金融投资视角,算法更为重要,人工智能加上人类智能才能做好投资。投资数据基础单薄的创新型企业,考量的是基于算法解决实际问题的产品服务能力。

王爽持有的观点是数据和算法同等重要,但是不同场景下的医疗场景重要程度有所不同。如新药研发领域,美国FDA批准通过现有的真实世界证据研究的数据支撑推进新药研发,数据重要性不言而喻;如智慧婴儿辅助诊断领域,ImageNet的引入带来分析精度的提高,但模型的精度离不开数据支撑,需要隐私计算技术打通各方数据源,二者缺一不可。

与此同时,未来创新型企业的算法优势受到数据共享、大厂开源工具代码的冲击。开源代码使开发者们得以站在巨人肩膀上前进,而初创公司原有的技术能力或失去市场优势。会嘉宾分别就开源潮流及其对数据生态和技术未来发展的影响展开对话。

大厂将核心的能力开源是推动产业创新的非常好的手段,如果说是有竞争的话,也是非常良性的竞争。臧一超表示公司本身大量引入开源的架构并基于开源的架构做自主创新,形成标准的产品后加入开源的组织。商业化公司利用开源补技术短板,商业化包装行业解决方案回馈开源社区,起到相互促进的作用。

专业的人做专业的事,谭昶坦言开源本身对于专业人员是好事,从业人员应积极为开源社区贡献代码。作为IT、 AI企业,源于开源又高于开源,将数据加工成专业化商业化的软件投入市场,可构建良好的商业生态。

王爽对于开源是非常拥护的。他认为开源可以建立信任的,内部架构对于外界是透明的,外界可以充分信任隐私保护构架的源起数据保护的,这是建立信任的过程。此外开源可以帮助技术普及,更快深入客户。涉及具体的应用场景,需要商业化运作或专业团队进行定向的优化支持。

参与者共同加入、做大社区,开源代码与区块链的精神气质最为相符。杜宇积极拥抱开源。他表示区块链从比特币一开始都是开源的,极大推进行业发展周期,通过技术方式建立信任实质都是源自开源的基础,受到专业人士的欢迎。商业角度而言,开源消除了行业技术壁垒,企业可将精力转移在解决商业问题和商业模式探索上。

综合来看,对于计算机行业,大家共同关注的问题是如何让数据治理使用更加高效;而在非计算方面,数据使用成本等方面鲜有关注,这也引起更全面深入的思考。我们在行业间或公司间,或者个人用户与商业团体之间数据的流通、分享、租赁真正的障碍在哪里?

杜宇表示目前而言数据孤岛是最大问题。区块链倡导开放共享,从公有链开始所有的交易记录全部开放透明,而实际落地,企业、金融机构不会将真正的交易记录与商业机密暴露出来,个人隐私数据不愿公开。政府不同部门、政企之间竖起数据高墙,痛点在于如何打通。区块链加隐私计算技术可以实现产业上下游的数据有效协同共享。

臧一超以智慧园区为例,为中小企业提供数据服务必然涉及税务等个人隐私与数据安全问题,那么,基于目前技术理念如何丰富数据服务生态是关键所在。

谭昶认为数据作为新的生产要素,国内相关法律法规以及数据市场的基础设施亟待完善。只有这样,企业才能实现互信条件下的数据交换。

王爽则认为技术层面区块链加隐私计算能够实现医药领域的数据溯源,法律法规层面积极推动个人隐私保护法、食品安全法及相关国家标准制定,共同实现数据安全有序流动。

2

跨洋巅峰对话,紧跟数智融合趋向

圆桌会议下半场主题为“释放数据价值,区块链有何妙用”,由算力智库创始人 燕丽主持,KILT Protocol 创始人Ingo Rübe、Phala Network CEO佟林、树图区块链Conflux联合创始人 伍鸣、 Chainlink中国社区总监 Philip 共同参与。

远在德国的Ingo Rübe开启跨洋对话,他介绍道,团队三年前启动波卡生态项目KILT Protocol,并专注基于区块链的“可验证数字凭证”功能开发,实现信任的传递

佟林介绍团队基于波卡的跨链协议、集成跨链协议后,为很多的区块链和平行链来提供隐私计算的服务。简言之帮助区块链打上马赛克,并且实现数据的可用不可见。

伍鸣表示团队主要通过设计创新的账本结构及共识新解决现有公链性能、共识算法瓶颈的问题,提升以太坊吞吐率,缩短交易确认时间;通过生态兼容,减少或者解决以太坊开放拥堵问题。

Philip希望将预言机(中间件)部分做到去中心化,因为数据源分散,从多个数据源多个节点获取数据上传到区块链,保证去中心化应用的安全可靠,并且不会被攻击。

在区块链和数据的结合层面,嘉宾从各自所在的领域就变化和认知的作了阐述。具体来看,区块链和数据未来可能产生何种内在联系,协作的业务场景端本身如何发挥作用和连接。

伍鸣认为区块链本身是可靠的分布式账本,可以作为可靠数据的载体,承载具有最大价值的数据,如金融信用数据,因此区块链和数据密不可分,区块链承载的数据还能实现通证化。

佟林则指出,目前链上的数据种类和数量远小于链下数据。链上数据的特点是可见即可用,不可见(加密数据)则不可用,但利用隐私安全计算可以实现链上数据的可用不可见。

Philip表示以太坊为代表的第二代区块链,实现了图灵完备的智能合约,它让区块链从数据结构变为世界计算机。团队希望推动智能合约的落地应用,为外部数据准备,可使区块链行业和外部数据结合更为紧密。

Ingo Rübe认为区块链未来应用面临的最大挑战是数据保密性,如Google或Facebook的互联网巨头形成大数据孤岛,数据泄露风险推动监管完善。另外数据高墙林立,对创新型企业服务能力提出更高要求。

实际上,区块链在处理数据或是提炼数据价值的过程中面临多维度挑战挑战与难点在哪里?与会嘉宾各抒己见。

Philip认为储存、传输、挖掘隐私,对于提炼数据价值都很重要,数据的传输是要优先于其他方法去实现,所以挑战是在保障数据的安全性以及隐私性前提下,将数据准确上链。

Ingo Rübe则从法理上思考了区块链的数据安全性——到底怎样才算安全?GDPR在2012年制定时并未考虑到区块链,但区块链上的数据加密归根结底是数学问题,终究可以解决,因此仍应先聚焦立法问题。

文章所载观点仅代表作者本人

且不构成投资建议

敬请注意投资风险

圆桌共话:如何冲破数据高墙,连线“数智未来”?相关推荐

  1. 神州信息“六合上甲”一体化数据开发平台全面数智升级!

    4月25日,由TECH数字中国技术年会焕新升级而来的"数云原力大会暨2023TECH第五届数字中国技术年会"盛大开启,神州信息升级发布"六合上甲"一体化数据智能 ...

  2. 2021数据技术嘉年华线上召开,万人观看,迎接国产数据库的耕获菑畬之年

    12月23日上午,2021数据技术嘉年华主论坛在墨天轮平台线上盛大开启.本届大会得到了工业和信息化部的支持和指导,相关领导在主论坛发表致辞.此外,围绕"智能·创新·新生态--数据智领未来 生 ...

  3. Echarts数据可视化series-line线图,开发全解+完美注释

    全栈工程师开发手册 (作者:栾鹏) Echarts数据可视化开发代码注释全解 Echarts数据可视化开发参数配置全解 6大公共组件详解(点击进入): title详解. tooltip详解.toolb ...

  4. 读取excel数据 画k线 成交量图

    # -*- coding: utf-8 -*- """ Created on Tue Mar 23 18:32:15 2021@author: ""& ...

  5. python boxplot 多组_Matlab boxplot for Multiple Groups(多组数据的箱线图)

    由于 命令 格式如下 :产生矩阵X的每一列的盒图和"须"图,"须"是从盒的尾部延伸出来,并表示盒外数据长度的线,如果"须"的外面没有数据,则 ...

  6. python boxplot 多组_Matlab boxplot for Multiple Groups(多组数据的箱线图)

    由于matlab具有强大的计算功能,用其统计数据功能优点显而易见,这里分享使用matlab中的boxplot的一些技巧,供大家参考. 命令 格式如下 :产生矩阵X的每一列的盒图和"须&quo ...

  7. 每人计:从门店入手,将客流统计和分析数据搬到线下

    关于线上商城而言,因为搜集带来的便捷,对精准客流统计和贩卖判辨数据的获取具备得天独厚的优势,而在线下,传统的门店没有行之有效的器材和技术,无法精确感知门店策动的关键;屡屡节假日门店营销过后,无法统计准 ...

  8. 2020 OpenInfra Days China 圆满落幕,100+ 全球大咖共话开源基础设施智未来

    8 月 16-17 日,2020 OpenInfra Days China 在线上隆重召开.本次大会以"智能开源基础设施"为主题,秉持"无边界协作(Collaborati ...

  9. 2020 OpenInfra Days China :100+ 全球大咖共话开源基础设施智未来

    8 月 16-17 日,2020 OpenInfra Days China 在线上隆重召开.本次大会以"智能开源基础设施"为主题,秉持"无边界协作(Collaborati ...

最新文章

  1. PostgreSQL10.5安装后(Win10)环境变量配置与运行
  2. eclipse中output folder和deployment assembly用法有什么不同?
  3. 使用sqlmap直连数据库获取webshell
  4. VirtualBox 安装失败的主要原因 不是正版的OS,系统主题需要还原
  5. 你看不懂的spring原理是因为不知道这几个概念
  6. Android ping命令 -- Runtime
  7. Educational Codeforces Round 103 (Rated for Div. 2) D. Journey dp
  8. el-table处理某一行样式;el-table表格row-class-name无效原因;el-table格式化某行样式和数据
  9. 使用adb查看数据库的一些命令
  10. tomcat内存溢出
  11. 操作系统|操作系统概述
  12. java jquery用的多吗_[Java教程]如果不用jQuery,Ajax你还能写出多少?
  13. WEB2.0概念诠释
  14. 一图看懂对抗神经网络中判别器怎么工作的
  15. E680手机内存已满终极解决方案
  16. Android 对apk进行重签名和查看签名(window 和mac)及生成签名
  17. Code for VeLO 2: Training Versatile Learned Optimizers by Scaling Up
  18. 分享给大家一个比较装逼的小代码
  19. 至联云分析:FIL上线后值多少钱?
  20. 通达信玄黄趋势波段指标源码

热门文章

  1. 前端自动化集成部署交付实践
  2. 2021年西雅图第一家通过传统IPO上市的公司
  3. 高一计算机专业班主任工作总结,高一年级第一学期班主任工作总结
  4. 什么是PCB中的net和vl孔
  5. 中国AI企业不惧美国封杀 百度华为用一张图给你答案!
  6. 【微信小程序源码】独立版云贝餐饮连锁V2_2.3.9源码线传小程序,新增堂食订单,支付打印新增下单时间显示
  7. oracle是做什么用的,可以形容下Oracle有什么用,是干什么的吗?
  8. java-非对称(RSA)签名加密(springboot框架)
  9. 赫宝铁甲格斗机器人系列_【为老铁打call】最直白的常规格斗机器人类型解说!以后别再说你不懂格斗机器人...
  10. XFTP软件连接虚拟机