雷锋网3月26日报道,今日第16届博鳌亚洲论坛2017年年会在海南继续进行中。据雷锋网了解,在日前的数据价值分论坛上,腾云天下CEO崔晓波、微软全球资深副总裁洪小文、Palantir副总裁kevin KAWASAKI、联合利华公司前董事长Michael TRESCHOW、平安普惠副总裁兼首席市场官CMO徐汉华、碳云智能CEO王俊参与了主题为“大数据开发的最大障碍”讨论。主持人是上海第一财经传媒有限公司首席顾问张力奋。

以下与雷锋网(公众号:雷锋网)一起围观论坛精彩发言吧:

张力奋:现在大数据开发面临很多障碍,中国地方政府想建设智慧城市,但是要整合政府内部数据源的话,几乎是不可能的事情。如果数据源的问题不解决的话,大数据的开发几乎是无法完成的。

在你们看来,目前是什么阻碍着数据价值开发?最大的障碍在哪?

微软全球资深副总裁洪小文:未来大数据的挑战,一在于政府内部,二是数据安全问题,特别是消费者的隐私权。各公司持有不同的数据,举个例子,信用卡公司有人的消费记录,而买什么是不知道的,但是每一个柜台知道,这些数据是不是可以串起来,但问题是谁有这个权利说这个数据可以用,这牵扯到法律。第三,我担心在数据闭环之后,社会多样性会减少。就像今日头条,你喜欢什么我就多给你一些,难免就囿于这个圈子。所以我们需要倾听不同的声音,比如听分析大数据后那些非主流的意见。不去思考就全盘接受,我认为这可能是未来大数据发展中必须要面对的一个课题。

平安普惠副总裁兼首席市场官CMO徐汉华:今天搜集数据很容易陷入一个局面,强调数据之“大”,忽视了数据的有用性。很多大数据公司与我们合作时表示,他们有很多数据和用户信息,但问题是他们的数据跟我的目标的关系何在,这才是最重要的。

第二点,需要的数据依然短缺,如何收集需要的数据是个问题。比如说中国真正有信用记录不到4个亿,还有许多人没有信用记录。有些互联网公司声称他们有很多客户的数据,这些数据可能会是某人上个礼拜买了双鞋,这礼拜去了肯德基消费,但问题是这些数据对于信贷没有任何的帮助。这背后的逻辑其实与洪院长所说相同。

第三,我很赞同陆金所董事长计葵生先生的观点,他认为数据不是断开的,数据是连接的。断开的数据不足以支持准确的判断,历史数据可以提高准确度,我们需要持续地累积数据,这是让数据更有效的方法。

此外,也是数据安全问题。现在黑客众多,如何保密,如何合法合理地使用数据都是处理数据时需要考虑的问题。

张力奋:Palantir公司是如何解决数据源问题的?你们跟数据源提供者是否有着怎样的共识或者契约?这个问题我想也是中国很多公司面临的问题。

Palantir副总裁 Kevin KAWASAKI:我们不提供数据,也不存储数据,我们帮助客户使用他们自有或者从第三方获取的数据,使之成为重要资产。我们面临的挑战之一就是世界始终在变化,我们不知道明天会有什么样新的数据源,怎样的新问题,所以我们需要不断地适应,要能够不断地整合新生数据到现有的模型当中来,不断解决新问题。

张力奋:我问一下王俊先生,涉及跟个人生命健康有关的隐私问题时,当时的华大基因,现在的碳云智能是如何来收集数据的?有没有你们说的基本准则?

碳云智能CEO王俊:这其中有两个问题需要考量,第一是数据的所有权。比如我们去医院抽血、看病,医院获得了我的数据,那么这个数据是属于医院还是我的?再比如其他健康数据,运动手环,微信运动记步,这个数据是属于微信还是我的?数据所有权的归属非常重要,而毫无疑问数据属于个人,这是我们生命体产生的数据自然归属于个人,这是最基本的权利。

张力奋:从伦理角度来看,这个答案是很清楚的。那从法律角度来说,作为一个普通公民也是数据提供者,我们能够得到法律的保护吗?

王俊:这涉及到第二问题——数据价值。每个人愿意分享数据的意愿和他能获得的价值有很大关系。比如说我已经病入膏肓了,一个药厂表示若我能把数据共享给他们,他们可能开发新药品治愈我。我相信99%的人都愿意共享数据。退一步讲,不说疾病,举个例子问个人是否愿意参与科学研究,而这科研成果会对世人的生活产生长远的影响,很多人可能也会愿意。从我的价值观来说,如果把我的数据放到一个公众的可供科学研究使用的地方,我是非常愿意的。

曾经我在丹麦做过演讲,议题是与会者是否愿意测试基因并贡献个人基因数据。当我第一次问大家分享基因数据是用来看自己的父亲是不是真正的父亲时,举手的不到10%。我问了五次,在第五次举手前我讲了一个案例,全球5%—6%儿童有出生缺陷,基因疾病可能有上万种。比如说渐冻症也是一种基因疾病,有这个基因却不发病的人占拥有这种基因的十分之一,如果把这个人找出来,搞清楚基因,那么就可以找到治愈病人的方法,你愿意不愿意做帮助别人的人,然后所有的人都举手了。所以我觉得事情的做法取决于个人价值观,取决于你用什么方式来对待这个数据。

张力奋:我想问Michael一个问题,在您担任联合利华总裁的时候,你在公司推行怎样的数据政策,哪些能做,哪些不能做?

联合利华公司前董事长Michael TRESCHOW:数据政策肯定是以个人的安全性为第一位,因为数据牵扯到每个人的安全,你必须确保不会泄露任何的个人身份信息。

另外一个越来越重要的事情就是需要区分哪些数据可以自己留着,哪些东西可以分享。开源其实是一个好东西,但从另一个角度来说,在知识产权受数据驱动的现在,特别是我们在研发产品的时候,你要决定哪些是专属的数据,哪些是可以与其他人共享的,这是特别有意思的一点。

第三涉及到跨国情况。不同的国家对于这些事情有不同的看法和政策。比如说医疗方面,在我的国家甚至都不能泄露医院挂号信息,如果说你去了另外一个医院,他们根本都不知道你的病史。所以对我们来说,我们需要找到一个方式,使得立法者、监管者不会特别恐慌,并帮助他们知道,哪些可以分享,哪些不可以分享。譬如工程、艺术等,这是可以分享的。

相关文章:

博鳌直击 | 基于区块链、分布式账本的数字货币是否代表了货币的未来?

博鳌直击 | 大数据在哪个行业最有价值?

本文作者:伊莉

本文转自雷锋网禁止二次转载,原文链接

博鳌直击 | 大数据开发的最大障碍是什么?相关推荐

  1. 2022年大数据开发实习面经总结,已拿顺丰、哔哩哔哩offer

    本人是一个双非硕士在读地研二狗,非科班出身,最近也是参加了大数据开发地面试,已拿到了哔哩哔哩和顺丰的大数据开发岗实习offer,现在把自己的面试经历分拨记录下来,记录了面试各个公司的问题和心经,给正在 ...

  2. 女生学大数据开发有什么优势呢?

    在很多人的印象中IT是个高端的技术工作,搞IT的基本上都是男生,大数据开发也是IT的一种,肯定都是男生做的工作,其实不然,大数据开发女生也是可以做的,而且比男生还要吃香一些,相比于男生大数据开发人员, ...

  3. 软件开发向大数据开发过渡_如果您是过渡到数据科学的开发人员,那么这里是您的最佳资源...

    软件开发向大数据开发过渡 by Cecelia Shao 邵Ce It seems like everyone wants to be a data scientist these days - fr ...

  4. 26 页高清大数据开发代码速查表,提升效率必备!【可下载】

    在各大互联网公司高价抢夺数据人才的环境下,为谋求长期发展.获得高薪,很多人转行到了大数据领域.这条路人才虽缺,但要成为优秀大数据工程师并不轻松:别的不说,光学习新技术,巩固旧知识,就需要耗费大量时间精 ...

  5. 贝壳一站式大数据开发平台实践

    分享嘉宾:仰宗强 编辑整理:刘春龙 出品平台:DataFunTalk 导读:本次分享嘉宾是来自贝壳大数据部门的仰宗强,详细介绍了针对贝壳的业务数据与需求的增长,逐步升级数据开发平台的探索实践过程,包括 ...

  6. 互联网学院大数据开发专业欢迎加入

    2019独角兽企业重金招聘Python工程师标准>>> 大数据: 大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能 ...

  7. 腾讯云发布全链路数据开发平台WeData,大数据开发迈入新时代

    9月11日,在腾讯全球数字生态大会大数据专场上,腾讯云重磅发布了全链路数据开发平台WeData,同时发布和升级了流计算服务.云数据仓库.ES.企业画像等6款核心产品,进一步优化和提升了腾讯云大数据的全 ...

  8. 大数据开发套件—调度运维常见问题

    我们在进行大数据开发过程中,会遇到各种问题,本文将定期收集整理一些在使用阿里云数加 大数据开发套件 时遇到的常见问题,供大家参考~ Q. 如果之前提交的任务修改后再次提交,是否会影响当天的任务调度? ...

  9. 大数据开发实战:Hive优化实战2-大表join小表优化

    4.大表join小表优化 和join相关的优化主要分为mapjoin可以解决的优化(即大表join小表)和mapjoin无法解决的优化(即大表join大表),前者相对容易解决,后者较难,比较麻烦. 首 ...

最新文章

  1. 漫画讲述人工智能简史
  2. ELK5.3+Kafka集群配置
  3. nohup命令_后台任务与nohup命令
  4. TClientDataSet[27]: 字段值的约束(或叫输入限制)
  5. python 调用bat失败_要想顺利通过Python面试,你最起码需要达到白银段位!
  6. 高中生用付款截图吃霸王餐近一年 网友:支付宝进来推销
  7. TransUNet:Transformers医学图像分割强编码器
  8. element元素 取属性_JS-DOM Element方法和属性
  9. php mysql 会员,PHP+MYSQL会员系统的登陆即权限判断实现代码
  10. 织梦友情链接html,总结dedecms怎么调用友情链接的方法[全]
  11. JDK 8和Java 8的下载与安装
  12. 微电网逆变器VF控制simulink仿真模型。 采用解耦的电压电流双闭环控制, 输出电压电流波形质量良好
  13. 机器学习-马尔可夫随机场(MRF)
  14. 什么是炎症(inflammation)?抗生素?//2021-2-12
  15. 金蝶KIS迷你版标准版备份助手V2.0
  16. 一元二次求解matlab程序,规范MATLAB编程实例——求解一元二次方程
  17. 20170627总结
  18. ManualResetEvent 说明
  19. 浅谈Google分布式文件系统(GFS)
  20. 了解模型预测控制4--自适应,增益调度和非线性MPC

热门文章

  1. 批量改变文件夹和子文件夹中图片格式的两种方法
  2. JPA 系列教程3-单向多对一
  3. getSlotFromBufferLocked: unknown buffer: 0xf3d94ca0
  4. 团队冲刺阶段一第四次站立会议
  5. C#操作快捷方式(获取快捷方式属性、创建快捷方式)
  6. C/C++不同文件夹下包含头文件的方法及#include的使用
  7. C#关于读写INI文件
  8. 怎么用计算机弹出soldout,SOLDOUT2游戏新手攻略玩法全面介绍
  9. c#使用正则表达式获取TR中的多个TD_PHP正则表达式技术心得与使用技巧完全详解 第3节...
  10. git 生成多个patch_如何用git命令生成Patch和打Patch