既要保持数据的自由流动性,又要维护每个主体在数据上的权益,这是个空前的法律难题。而创制和维护这样的数据利用秩序却是大数据应用的前提,是大数据战略得以实施的根本保证

中国信息通信研究院在第十六届中国互联网大会上发布的《中国数字经济发展白皮书(2017)》指出,2016年中国数字经济总量达到22.6万亿元,同比名义增长接近19%,占GDP的比重超过30%,同比提升2.8个百分点。数字经济已成为近年来带动经济增长的重要动力。

人类已经进入到了一个无商不利用数据,无领域(包括政府)不利用数据的时代。无论你利用数据赚钱也好,还是希望改善公共服务和社会治理也好,大家共同面临一个法律上难题:谁有权享有数据?享有什么内容和程度的数据权利?如何保护数据?数据的权益属性?类似的问题,还没有得到很好的智库研究,也未能提供很好的有效政策建议。本文提出五个智库观点,供决策依据考虑。

经过处理的大数据才有价值

大数据是来源于网络和各种传感器对特定对象的记录,它是关于人、组织和物(机器和自然界)在特定时间、地点的行为、过程、事件的事实数据。作为技术,大数据是抓取和分析世界和人们生活的一种数据技术,它使人类具有全过程、全方位记录各种事件和行为的能力,具有透析过去和预测未来的能力。

在大数据时代,任何数据均具有潜在的价值。在过去人们重复利用的数据资源主要是人类观察、思考、创作完成的成果,比如文章、文件、论文、著作等,而如今人类可以利用各种机器运行轨迹、人类活动记录、自然界变化观测等信息,过去需要大量观察访谈、调查统计、测量等完成的,现在可以借助计算机系统、各种数据采集器完成,并通过大数据分析工具实现全样本、自动化处理和分析。在过去,没有人在意我们自己的行为轨迹,也无法记录大量的事件和过程,可以说作为“垃圾”自觉或不自觉地扔掉了,而现在的数据技术使我们具有变废为宝的能力,因而大数据技术可以说是一种在浩瀚的数据海洋中发现“宝贝”的技术。

正因此,数据正在成为人类可拥有和控制的资源。我们已经进入到数据生存时代,大数据正在提供新的研究范式,重新认识宇宙、物质、生命和社会,并在此基础上带来科技技术、管理决策、社会发展的巨大变革。如今我们提到的智能制造、人工智能、机器学习、分享经济、个人性化定制或服务等技术和商业模式的创新无不建立在数据资源基础上。著名大数据公司Gartner认为,大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。可以毫不夸张地说,未来经济和社会发展是建立在大数据技术普遍应用基础上,数据不仅成为经济创新转型发展的引擎,而且是所有企业市场竞争的重要资源。因而,数据利用秩序成为未来社会的第一秩序。

传统的财产权不适合大数据

如果说所有权(排他支配权)是构筑物质资源利用秩序的法律工具的话,那么它是否可以移植到数据世界,建构数据的利用秩序呢?答案是否定的。这是因为数据的非物质性,很难实现排他使用。其一,数据使用的非排他性,一个占有使用并不妨害他人占有使用;其二,数据使用具有非消耗性,数据的使用不消耗本体,反而丰富数据,使数据具有新含义或增值。因而数据天然地不适合于所有权体系,通过数据上设置排他支配权不适用于大数据时代。

在《民法总则》制定过程中,数据信息曾被纳入知识产权的客体,试图设立类似知识产权的专有权,但最终出台的《民法总则》并没有将数据信息列为知识产权的客体。这是因为,大数据背景下的数据更多的是事实记录,其数据的收集(采集)和聚合本身并不能实质性改变数据的价值。数据具有价值或者能够实现价值需要一系列的筛选、分类、处理、合并,形成主体数据、专题数据,使数据变成可用的数据产品,通过数据产品交易或服务,实现数据的价值。那么,数据产品化或商品化的过程,是否可以被赋予类似于知识产权的专有权呢?

知识产权是保护创造性劳动成果的一种制度,而创新劳动成果多表现为思想、技术方法、标识等,而这些离不开信息或数据。不过,知识产权并没有建立对创新成果(思想或信息)本身的支配权,而是将思想或信息置于公共领域,仅赋予权利人一定期间的商业化使用创新成果的专有权。也就是说,在知识产权体系下,仍然坚持信息(思想)公开和自由原则,数据及其所承载的科学文化成果被认为是社会活动的公共要素,置于公共领域。

显然,在大数据时代,我们仍然应当坚持将数据产品或信息视为公共资源的原则,而不允许信息私权化或成为私权客体。因为这样会妨碍科学文化进步,妨碍社会正常交往和运行。数据赋权仍然应当坚持数据的公共资源属性,不应当赋予数据持有者对数据的所有权,我们也不应当突破知识产权制度理念和框架,赋予数据持有人对数据本身的某种支配权。

因此,无论以有形物为基础财产权,还是以无形物为基础财产权体系,均难以解决数据时代的数据利用秩序问题。

数据该如何赋权

数据从原生数据到有价值的数据产品需要投入,这不仅仅是劳动投入,而且还有资本投入,而只有当这些投入得到足够的回报时,才有人从事数据的收集、处理和加工,将数据转化为产品或服务。解决数据产品制作者激励是数据赋权要解决的核心问题。

根据前面的论述,即使是数据产品,也要保持社会公众对该产品的可接触或可学习的公共属性,仅仅赋予数据产品制作者以商业化使用数据产品的权利。数据产品的制作者权利应当包括自己使用和许可他人使用的权利,或者利用数据提供服务的权利,同时有权制止他人商业目的的使用该数据产品的权利。这种基于对于数据分析加工劳动而取得的数据使用,属于一种新类型财产权,不妨可以称为数据使用权。它区别于传统的物权之处,在于它不是对数据的支配权,而区别于传统知识产权之处在于,它并不要求独创性或创新性。这样,可以给数据产品制作者实现其收集和加工数据的激励,促进数据产品的生产和流通,满足社会对数据产品的需要。这里赋权的正当性在于保护数据上存在合法利益,使数据产品持有人可以收回劳动投入甚至获取利润,但并不能绝对地排除他人使用相同的数据。当然,如何确保数据产品制作者商业化使用权,又使数据保持一定的开放性,使公众可获取性,需要精细的法律制度设计。

数据主体利益的保护原则

在大数据环境下,一切数据皆有源。当数据来源于个人或者是对个人的描述时,就落入个人数据(又称个人信息)范畴。个人数据包含隐私信息(个人的私密信息),隐私保护成为个人数据保护的重要组成部分。在这方面,国际社会关于个人数据使用的总体原则是合法、正当和必要原则,以不侵犯个人尊严或自由等基本权益,尤其是隐私利益为基本限制,只有法律规定的敏感信息需要征得个人的同意,而一般的个人信息则并不需要个人同意。我国现行规则为,除遵循合法、正当和必要原则外,还必须征得个人的同意,似乎给了个人对个人信息的控制权。这与个人信息的多样化或多种法律属性(许多个人信息是可以公开的并为企业组织使用的)事实不吻合。其实,仅仅识别特定个人并不足以给个人以对该信息享有支配权,个人信息仍然是社会交往的工具。但是,个人信息的收集和使用必须尊重个人权利,必须确保个人知情和在必要时的干预(更正、删除等)。

除了来源于个人外,企业数据还需要获得其他企业和社会组织的数据。除非这些数据是置公开的可供他人自由获取的状态(成为公共数据),那么取得这些组织的数据也需要获得数据实际控制人的同意,而不能够随意抓取、窃取或采取其他非法手段获得。数据产品制作者权益的保护是建立在合法取得数据的基础上。这种合法取得实际上也意味着法律对数据来源者利益的保护。在此方面除了保护个人信息外,还有企业信息的保护问题。

大数据应用最关键的是取得尽可能大而全的数据,而为取得他人的数据就必须合法合规,其中最为重要的是尊重和保护个人信息权益。由此,数据利用秩序归根结底是要建立数据来源方(原材料提供者)到收集加工制作方(制作者)再到数据方(消费者)有关于数据权利和义务配置秩序,在保护各方权益的前提下,保持数据开放性和流通性,使数据得到社会化的利用,实现数据的价值。

数据利用秩序关系大数据战略

在过去,数据被作为公共资源,甚至许多数据被作为垃圾随意地丢弃了,没有讨论数据产权问题。但是,随着数据价值的重新发现,随着人们对数据掌控能力的提高,数据逐渐地成为可控制的对象了。在数据可控制的情形下,要让人们掌握的数据拿出来分享和利用就必须要有激励,就必须创制数据社会化利用的秩序。《国家信息化发展战略纲要》明确提出要“探索建立信息资产权益保护制度”。由于数据本身仍然需要保持一定公共性,赋予任何主体对数据和数据产品的绝对支配权,都背离人类社会发展的基本理念,因而数据赋权,仍然应当坚持信息自由原则。

数据总是处于不断地脱离原来主体而流动,而正因为这样的流动,才使数据产生价值,但脱离主体也意味着原主体丧失对数据的控制。既要保持数据的自由流动性,又要维护每个主体在数据上的权益,这是个空前的法律难题。而创制和维护这样的数据利用秩序却是大数据应用的前提,是大数据战略得以实施的根本保证。

本文转自d1net(转载)

大数据陷阱:谁有权享有大数据,谁有权分析大数据相关推荐

  1. python分析鸢尾花数据_python数据挖掘学习笔记】十六.逻辑回归LogisticRegression分析鸢尾花数据...

    但是很多时候数据是非线性的,所以这篇文章主要讲述逻辑回归及Sklearn机器学习包中的LogisticRegression算法 #2018-03-28 16:57:56 March Wednesday ...

  2. 电商大数据项目(二)-推荐系统实战之实时分析以及离线分析

    电商大数据项目-推荐系统实战(一)环境搭建以及日志,人口,商品分析 https://blog.51cto.com/6989066/2325073 电商大数据项目-推荐系统实战之推荐算法 https:/ ...

  3. 电商用户行为分析大数据平台相关系列1-环境介绍

    最近在自学Spark,看了一些书籍和视频,总是感觉无从下手.拿着一个想法总是无从下手.追其原因,主要是没有系统的学习和使用.对于IT,一切新技术都需要不断实践.不断动手.本着动手的原则,本人通过各种渠 ...

  4. 电商运营中的五个数据陷阱

    来源:新媒之家 电商,看懂数据是基本功.软件可以解决繁琐的计算,但解读还需要运营人员有基本的数据分析能力.本文列举了五个常见的数据陷阱,了解和掌握后可以有效避免一些分析结果的偏差. 如今," ...

  5. 数据建模实战,Smartbi带你玩转购物篮分析

    购物篮分析是一个非常重要的模型,关于啤酒与尿布的故事,这个故事很好地解释了商品关联性的作用,时至今日,仍有很强的现实指导意义.这种数据,将不同商品关联起来,并挖掘二者之间联系的分析方法,就叫作&quo ...

  6. Python爬取影评并进行情感分析和数据可视化

    Python爬取影评并进行情感分析和数据可视化 文章目录 Python爬取影评并进行情感分析和数据可视化 一.引言 二.使用requests+BeautifulSoup进行影评的爬取 1.分析界面元素 ...

  7. 大数据陷阱:需要读懂的10个小故事

    自2011年以来,大数据旋风以"迅雷不及掩耳之势"席卷中国.毋庸置疑,大数据已然成为继云计算.物联网之后新一轮的技术变革热潮,不仅是信息领域,经济.政治.社会等诸多领域都" ...

  8. 新未来简史:区块链、人工智能、大数据陷阱与数字化生活 - 电子书下载(高清版PDF格式+EPUB格式)...

    新未来简史:区块链.人工智能.大数据陷阱与数字化生活-王骥 在线阅读                   百度网盘下载(gc5s) 书名:新未来简史:区块链.人工智能.大数据陷阱与数字化生活 作者:王 ...

  9. 【2017年第2期】开发商业智能应用 小心大数据“陷阱”

    黄锦辉 香港中文大学工程学院,香港 999077 摘要:大数据的应用和研究是信息爆炸时代的热点话题.就如何更智能地发现大数据中的有用信息展开讨论,探讨了大数据中的"陷阱"和其引发的 ...

最新文章

  1. jquery.dataTables.min.js: Uncaught TypeError: Cannot read property 'style' of undefined
  2. dojo helloworld
  3. 设置 Confluence 6 日志
  4. html倒计时timer,JavaScript定时器设置、使用与倒计时案例详解
  5. 【神经网络八股扩展】:数据增强
  6. Linux C语言操作MySQL
  7. C#.NET常见问题(FAQ)-如何改变字符串编码
  8. 【优化算法】头脑风暴优化算法(BSO)【含Matlab源码 497期】
  9. python做图像识别好还是c++好_用于图像识别的顶级编程语言
  10. PS MAC 2022安装步骤
  11. Mysql中select into from用法
  12. pgsql 日期转换
  13. 手摸手带你写项目----秒杀系统(一)
  14. wpsword怎样涂黑方框_Excel中如何插入空心小方块和实心小方块的标志?
  15. python打字机效果_打字效果动画的4种实现方法(超简单)
  16. IOTA,物联网区块链?
  17. Ubuntu 网络管理
  18. Scrum板与Kanban如何抉择?敏捷工具:opdea板与按照guarbpgz
  19. 信息系统综合测试与管理
  20. 【Machine Learning, Coursera】机器学习Week6 偏斜数据集的处理

热门文章

  1. Spring - Java/J2EE Application Framework 应用框架 第 12 章 Web框架
  2. Java虚拟机学习(4):JDK可视化监控工具
  3. 【数字智能三篇】之一: 一页纸说清楚“什么是大数据”
  4. matlab安装配置VLFeat库
  5. 信息系统项目管理师-论文要求
  6. Java Bean与Map之间相互转化的实现
  7. 设计模式(10)-装饰模式详解(易懂)
  8. 《数据分析变革:大数据时代精准决策之道》一第一部分 变革已然开始
  9. Oversea company interview question.
  10. json数据解析详解---代码每行进行分析