数据自治开放与治理模式创新

沈逸1,3, 姚旭1,3, 朱扬勇2,3

1. 复旦大学网络空间治理研究中心,上海 200433

2. 复旦大学计算机科学技术学院,上海 201203

3. 上海市数据科学重点实验室,上海 201203

摘要:当前政府治理日趋离不开对数据资源的妥善管理和运用,在此过程中面临的最主要的难题是如何实现有效的数据共享。为解决这一难题,提出了数据自治的概念,认为可以在明确数据资源权属并界定必要的使用—维护成本的情况下,由政府相关部门自主推进数据资源的开放共享。经过比较分析,认为以数据自治为基础的开放政府建设是一条中国特色的实践路径,不仅能够服务于中国,而且能够为当今世界解决类似难题做出重要贡献。

关键词:数据自治开放;数据共享;电子政府;治理

doi:10.11959/j.issn.2096-0271.2018014

论文引用格式:沈逸, 姚旭, 朱扬勇. 数据自治开放与治理模式创新[J]. 大数据, 2018, 4(2): 14-20.

SHEN Y, YAO X, ZHU Y Y. General design of self-governing openness of data and the exploring of the new mode of governance[J]. Big Data Research, 2018, 4(2): 14-20.

引言

推动数据资源,尤其是政府数据资源的开放共享是我国实施国家大数据战略的核心内容。推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民生活改善。”如何构建一套有助于推进政府数据开放共享的务实路径,是当前实施国家大数据战略过程中必须面对的关键挑战之一。从已有的实践以及国际比较经验来看[1,2,3],以数据自治(即明确数据资源权属并界定必要的使用—维护成本)为基础,由政府相关部门自主推进数据资源的开放共享,可能成为一条适应中国特色的实践路径。

以数据自治为基础,推动政府掌握的数据资源的开放共享,是由中国数据资源分布的客观特征决定的。从1994年全功能接入互联网开始,中国的整个信息化与网络化进程就有着显著的政府主导和强调顶层设计的特点。尽管在商业运用中,市场化的力量展现了自己独特的优势,但是在基础资源以及覆盖全社会的系统的数据收集与整理方面,中国政府仍然具有非常显著的优势。20世纪90年代开始的中国政府电子政务建设具有非常显著的条线特征,即垂直条线业务部门采取相对封闭的方式构建垂直的数据采集与业务处理的信息系统,由此产生的现象是海量的政府数据,在若干关键而重要的垂直条线部门内部业务系统的数据枢纽节点上大量累积,形成了块状的“数据金矿”,其中具有代表性的包括人口基础数据、工商基础数据、税务基础数据、健康医疗数据等[4-7]。虽然,腾讯、阿里巴巴这些大型互联网企业的高速发展与快速崛起也形成了海量数据的累积,但是在数据质量、准确性以及系统性方面,政府内部累积的数据资源仍然具有非常显著的优势。

以数据自治为基础构建政府数据资源的共享,要解决的是阻碍数据共享的关键问题之一,即不同层级政府部门数据开放和共享动力不足的问题[8]。从欧美国家的实践来看,数据开放是作为一项理念或者价值性的要求出现的[2];从现有的研究成果来看,在中国的研究者中,主流仍然将推进数据开放的主要动力寄托在价值和理念的层面上[9]。虽然从法理或者应然的角度来说,要求政府以免费或者极低成本的方式开放数据资源给各方自由取用,可以找到非常多的理论和价值依据,但务实地看,很多国家(包括欧美发达国家)成功的基本经验之一,就是必须用各种不同的方式给开放数据的政府部门予以正面反馈,只有这样才能有效维持推进数据资源开放的动力[10]。从制度经济学的角度出发,如果能够对数据资源进行有效的权属确定,那么理论上构建一种适当的制度安排,在数据原始权属所有者、数据维护和管理者以及数据实际使用者之间构建一种基于自愿提供、有效管理和付费使用的业务模式,是必要的、可能的,也是可行的。换言之,数据自治开放是政府数据资源开放的可行模式。

对政府来说,这样的制度安排能够从以下3个方面提供正面反馈。

其一,数据开放带来的正面的外部效益(包括社会效益和经济效益)能够直接成为工作绩效,从而通过相应的制度转化为正面的激励。

其二,数据开放带来的正面的经济效益,可能在一定条件下转化为推动实体经济的新动能,而受这种新动力来源驱动的实体经济的良性发展,将通过缴纳税收、创造就业等方式给政府提供经济领域的正面激励。

其三,明确权属和价格之后,以公开、透明的定价机制挤压灰色数据交易的生存空间。正如经济学理论和实践证明的那样,当一样资源客观上具有市场价值,同时又没有公开的渠道进行正规交易时,强烈的需求就必然导致地下市场的出现。就数据公开而言,考虑到数据本身具有的国家安全、公共利益以及个人隐私价值,用公开、规范且处于有效监管下的市场取代事实上存在的地下市场势在必行。

在国际社会上,欧美发达国家已经在数据资源开放共享领域进行了有效的实践,并形成了可供学习借鉴的重要经验。

2  数据自治开放的国际实践与经验

在现有国际体系中,规制关键数据资源的最主要的行为体还是国家;从主权国家的视角看,有效的管理数据资源已经成为国家主权在大数据时代最重要和关键的延伸;就具体实践模式而言,从全球看,开放政府掌握的数据资源在有效管制的基础上推动数据整合运用,鼓励安全有效监管下的数据跨境流动和商业应用,已经成为各方共同聚焦、努力探索的重要问题。换言之,未来数据自治将在事实上成为实现国家数据主权的一种有效方式。从已有的探索看,在相关领域发展相对成熟的欧美发达国家已经形成了一套有鲜明特色的治理体系。

美国形成的是“政府—企业—社会”三元强势模式[11],即政府从国家安全利益出发实施的强监管、高流动,以政府非涉密性公共数据的自主开放为一般,以涉密数据高强度保管为例外;以公司对数据资源的高强度商业利用为一般,以对公司数据挖掘行为的管制为例外;以社会对政府—企业隐私侵犯行为的高敏感度监控与反制为一般,以配合政府的安全监管以及企业的高强度商业数据挖掘为例外。欧盟形成的是以“隐私保障与个人权益”为核心特征的温和折中模式[12],即政府主要以个人隐私权益的保障为核心出发点,以控制和限制掌握技术优势的公司对数据的强势商业挖掘为主要目标,配合政府一般性的信息开放原则规定,谋求构建一套以高度敏感的个人隐私数据保护体系为主要特点的治理体系。

从最新的进展来看,构建和完善有效的跨境数据流动模式是欧美国家推动政府数据开放实践中的新焦点。在相关实践中,美国和欧盟也形成了自己独特的治理模式。

美国的跨境数据流动治理模式可以归纳为“对外控制型”[13]。美国在跨境数据流动治理、隐私保护与数据安全领域的实践虽然总体上比较分散,但可以清晰地归纳出其特点,即依托私人部门与公共部门的结合性力量对外实施有效控制。虽然美国在明面上更依靠私人部门进行跨境数据流动的治理,并始终坚持以“自由流动”为一切政策的出发点,但这无法改变美国作为对外控制型治理模式代表的现实。

欧盟的跨境数据流动治理模式可以归纳为“内外折中型”[14]。欧盟在跨境数据流动治理领域选择了相对中庸的治理模式,希望兼顾内部成员国与外部世界的诉求,将内外所需进行折中。但平衡并不是常态,只是动态张力不断变化中的一个点,也只有通过不断的碰撞与摩擦才能继续寻找下一个平衡点。从欧洲的经验看,这种折中路线的优势在于能够延缓高速发展的信息技术革命带来的冲击,兼顾技术能力不同的各方的利益,但同时也使治理绩效相对低下,整体看,过于强调均衡以及兼顾各方需求的治理模式正日趋凸显其不足,对不断涌现的问题愈发缺乏适应能力。

总的来看,尽管存在差异,但是在国家层面,美欧发达国家在推进数据开放与共享时,均以不同方式强调保护国家安全核心利益,即数据开放共享不能给国家带来威胁。相比欧盟,美国更加强调主导权,以是否能够获得对网络空间关键资源的有效控制以及主导全球网络空间治理秩序作为衡量国家网络安全的标准;欧盟则相对温和一些,希望以更加均衡的方式维护和保障主权国家的关键诉求。通过数据自治的不同实践模式,确定关键数据资源的权属,承认其可以获得的合理收益,然后以制度化的方式加以实践,在确保核心利益诉求的情况下实现数据资源的开放共享,正成为各方共同采取的路径。

当今国际体系的主要特征仍然是主权国家构成的国际体系,推进以数据自治为基础的治理模式意味着承认主权国家在其核心利益诉求得到尊重、主权平等得到承认的基础上,实现对关键数据资源的有效开放共享。这种模式不同于无视主权、片面追求数据开放广度和深度的模式,也不同于强调主权的绝对属性,将保障数据主权等同于用主权壁垒切断跨境数据自由流动的主张,能够较好地兼顾国家核心利益诉求以及信息技术发展的内生需求,有助于在安全与发展之间找准定位。

在数据开放与共享的过程中,如何有效保护个人隐私,维护和实现公民数据权,是另一项重要的议题。结合已有实践可以初步发现,数据自治将是维护和实现公民数据权的一种有效方式。

欧美国家调查局显示,信息技术和大数据应用的发展对有效保障个人隐私和实现个人数据权提出了严峻的挑战:美国民众对网络隐私缺乏信任,这种担忧不但指向了美国的公共部门,也直接指向了私人部门。2015年,美国人口普查局通过对41 000名美国境内的网络用户进行询访,发现19%的用户都遭遇过不同程度的网络安全与隐私问题[15]。网络用户最关心的问题依次是:个人身份信息泄露(63%)、信用卡盗刷与诈骗(45%)、个人资料被企业收集(23%)、对个人资料与账户失去控制权(22%)、个人资料被政府收集(18%)。美国国家电信和信息管理局认为,半数美国国内的网络用户因为对自身隐私权的担忧而在从事网上交易、电子商务活动甚至是表达政治观点时产生犹豫,这对于美国整体经济结构的复苏与重构有重要的影响,应该给予重视。

为有效保障公民数据权,欧盟也尝试过数据自治之外的模式,即强调法理和价值的制度化解决方案。欧盟在长达半个世纪的时间里大力推进建构全球跨境数据流动治理的制度框架,力图以制度方式实现欧盟及成员国对跨境数据流动规制的强烈要求,消除欧盟成员国对国家主权尤其是网络(信息、数据)主权被过分侵害的担忧。但就实践情况来看,效果并不理想。在国家层面,无法有效抵御外部强势行为体基于技术能力实施的监控与攻击性的数据活动;在企业层面,未能催生出匹敌美国大型互联网企业的欧洲本土力量;在个人层面,个人隐私和数据资源面临的网络犯罪威胁日趋严重。

在保护公民数据权的问题上,面临的一个经典难题是个人不可能完全依靠自己的技术能力或掌握技术优势的其他行为体的主观善意,采取“自助”模式来保障个人数据安全;同时,个人在客观上又迫切需要获得信息技术革命带来的各种便利和福祉,以此来提升自己的生活水平,实现个人的发展。因此,最终的结果是,个人采取委托授权的形式,要求政府来保障和维护自身的数据权。这需要解决行动的成本问题。承认数据自治,能够在很大程度上解决授权和成本维持问题,从而形成一种具有可行性和可操作性的模式,可持续且富有弹性地推进数据的开放共享。

3  推进我国数据自治开放的若干建议

综上所述,在以大数据广泛落地和深度应用为主要特征的信息技术革命高速发展的背景下,数据自治是一种有效的建设和完善开放政府的务实模式。从本质上说,开放政府的建设是一项公共政策,在务实推进时,必须解决成本维持与有效激励等操作层面的问题;单纯的理念引导与价值教育较难形成有效的公共政策制定和执行的关键动力;数据自治能够在相当程度上解决这些问题,依靠相对较低的成本以及对信息技术革命的适应性,较好地胜任推进开放政府建设的重任。

基于上述分析,对以数据自治为基础,推进中国政府的数据开放共享和有效治理体系提出如下初步建议。

其一,推进支撑以数据自治为基础的数据开放共享的基础设施建设,在条件成熟的省会城市以及直辖市构建覆盖省一级单位的跨部门数据中心,并以此为枢纽节点,构建最终覆盖全国的政府数据资源共享网络。这个共享网络将构成支撑数据自治开放最关键和重要的基础设施,侧重解决数据开放共享的安全、可靠以及便捷实用等问题。

其二,通过有效的立法和顶层设计,推进数据资源的权属界定机制,探索完善相应的交易模式,构建完善相应的定价机制。在此过程中,推进数据交易对象的规范化,从数据的全周期(即采集、存储、交换、使用等环节)构建有效的制度保障,杜绝非法数据交易,将数据交易的主体逐渐引向规范合理的数据资源使用和处理结果交易,而不是容易产生负外部性的原始数据交易。同时,推进政府职能和角色转变,从全生命周期强化政府作为监管者的使命和任务;通过有效的制度安排,确保在此过程中形成的收入能够实质性地转化为完善数据自治开发的资源,从而形成良性的循环。

其三,推进落实、完善基于数据自治的政府数据开放共享建设手册的研究。由相关高校和研究机构组织选取具有代表性的政府部门样本,进行数据质量和现状的摸底调查,然后在此基础上形成一本能够有效反映当前政府数据资源掌握、管理和使用基本情况的背景资料手册,从而为推进下一阶段工作打下基础。

其四,选择具有代表性城市的数据资源,在相关职能部门的配合下,开展数据自治基础上的开放共享示范项目建设,然后以最佳实践和自主学习的方式,形成一系列具有滚动示范能力的精品项目,从而实质性地启动相关项目建设。在预算和决算制度中进行必要的创新,确保数据自治的费用运行处于有效监管之下;平行推进数据资源的深度开放共享,以有序引导的方式深入推进电子政务的可持续建设,同时高度重视公民个人对相关数据及其合法权益的救济渠道建设,确保能够及时进行信息反馈和控制,将可能对个人隐私以及相关权益构成的损害和风险降到最低。

4  结束语

有效的数据共享是推进电子政务建设、提升信息时代政府治理能力的关键。我国在推进网络强国建设的过程中必须努力探索共享数据资源的创新模式。本文尝试定义数据自治开放的概念,这一概念能够在共享数据的同时,解决政府相关部门动力/激励机制相对不足的缺陷,比较契合我国的实际,有可能在此基础上建设完善一条务实的实践路径。本文从概念界定以及国内外比较的角度,展开对数据自治开放内涵的界定,并初步构想了实践的路径。如何结合技术的发展,更加清晰地描绘数据自治开放的外延,结合具体的场景,界定实践数据自治开放的机制,是未来努力和完善的方向。

展望未来,数据技术和应用将持续高速发展。追赶并弥补相关治理机制中的不足,建设完善实施有效的数据治理机制,对数据自治开放这样的创新概念进行不断测试与调整,是政府、公司以及社会三方共同的责任。对我国来说,这也是建设网络强国进程中必须完成的战略任务和历史使命。

点击下方 阅读原文 即可获取全文

作 者 简 介

沈逸(1976-),男,复旦大学网络空间治理研究中心研究员、主任,主要研究方向为国家网络安全战略、全球网络空间治理、大国关系。

姚旭(1989-),男,博士,复旦大学网络空间治理研究中心科研助理,复旦发展研究院助理研究员,主要研究方向为网络空间治理、欧盟网络安全战略、跨境数据流动治理。

朱扬勇(1963-),男,博士,复旦大学计算机科学技术学院教授、学术委员会主任,上海市数据科学重点实验室主任。1989年起从事数据领域研究,2008年提出数据资源保护和利用,2009年发表了数据科学论文“Data explosion,data nature and dataology”,并出版专著《数据学》,对数据科学进行了系统探讨和描述。2010年创办了“International Workshop on Dataology and Data Science”,2014年和石勇、张成奇共同创办了“International Conference on Data Science”。担任第462次香山科学会议“数据科学与大数据的理论问题探索”的执行主席、“大数据技术与应用丛书”主编。目前主要研究方向为数据科学、大数据。

《大数据》期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的科技期刊。

关注《大数据》期刊微信公众号,获取更多内容

数据自治开放与治理模式创新相关推荐

  1. 专题:数据自治开放(下)

    专题:数据自治开放 Self-governing Openness of Data 导读: 推动数据开放共享是国家大数据战略的核心内容.但在实施过程中,数据开放共享面临着"数据拥有者不愿.不 ...

  2. 专题:数据自治开放(上)

    专题:数据自治开放 Self-governing Openness of Data 导读: 推动数据开放共享是国家大数据战略的核心内容.但在实施过程中,数据开放共享面临着"数据拥有者不愿.不 ...

  3. 数据自治开放模式下的隐私保护

    数据自治开放模式下的隐私保护 王智慧1,2, 周旭晨1,2, 朱云1,2 1. 复旦大学计算机科学技术学院,上海 201203 2. 上海市数据科学重点实验室,上海 201203 摘要:数据开放对于提 ...

  4. 数据自治开放的软件开发和运行环境

    数据自治开放的软件开发和运行环境 吴毅坚1,2, 陈士壮1,2, 葛佳丽1,2, 赵文耘1,2 1. 复旦大学计算机科学技术学院,上海 201203 2. 上海市数据科学重点实验室,上海 201203 ...

  5. 数据自治开放的加密技术挑战

    数据自治开放的加密技术挑战 黄霖1,2, 黎源1,2, 汪星辰1,2, 赵运磊1,2 1. 复旦大学计算机科学技术学院,上海 201203 2. 上海市数据科学重点实验室,上海 201203 摘要:数 ...

  6. 数据自治开放应用平台设计与实践

    数据自治开放应用平台设计与实践 陈德华, 潘乔, 王梅, 乐嘉锦 东华大学计算机科学与技术学院,上海 201620 摘要:围绕数据自治开放的数据管理新模式,提出了一套面向数据自治开放应用的整体解决方案 ...

  7. 面向数据自治开放的数据盒模型

    面向数据自治开放的数据盒模型 熊贇1,2,朱扬勇1,2 1. 复旦大学计算机科学技术学院,上海 201203 2. 上海市数据科学重点实验室,上海 201203 摘要:在数据自治开放模式中,数据使用者 ...

  8. “数据星河”系列活动—大数据产业中的商业模式创新沙龙共话新未来

    11● July ● 2019 北京 ▲ 沙龙现场 7月11日,数据星河系列活动--大数据产业中的商业模式创新沙龙顺利举行.在大数据强势赋能下,来自不同行业与领域的嘉宾就如何以模式创新迎接未来机遇与挑 ...

  9. 《深圳经济特区数字经济产业促进条例》正式公布,依法设立数据交易平台,推动数据交易模式创新

    9月5日,<深圳经济特区数字经济产业促进条例>经深圳市第七届人民代表大会常务委员会第十一次会议于2022年8月30日通过,自2022年11月1日起施行. <促进条例>关于数据要 ...

最新文章

  1. 维护隐私 搞定最近打开文档的显示
  2. python3.6小程序_python3.6 tkinter实现屏保小程序
  3. 一文看懂谷歌 NYC 算法与优化业务全景:三大项目组12个子领域详解(附重点论文下载)
  4. python使用snappy压缩
  5. 如何检查Socket是否断开
  6. day05-数据类型与操作
  7. debian 删除mysql数据库_Debian中完全卸载MySQL的方法
  8. elispce导入java项目_emacs的java编程环境设置(jdee,lib,cedet,ecb
  9. 码农30多岁,要被辞退的时候 怎么办?
  10. mysql sql查询json数据类型_SQL中的JSON数据类型
  11. 可用子网数要不要减2_详解IP地址、子网掩码、网络号、主机号、网络地址、主机地址...
  12. rabbitmq消费者获取消息慢_RabbitMQ:快速生产者和慢速消费者
  13. 把博客园自己博客皮肤改了下
  14. C#开发奇技淫巧二:根据dll文件加载C++或者Delphi插件
  15. c语言车辆管理程序,用c语言编的车辆管理
  16. 针对于win8、win10无法访问,您可能没有权限使用网络资源的解决方法
  17. 金蝶K/3 ERP 基于Citrix Access Gateway 的SSL ××× 部署方案
  18. 电脑上可贴至桌面显示的便签软件
  19. 面试面经 | 2021大疆嵌入式软件工程师笔试题B卷
  20. 使用Elasticsearch和Kibana挖掘邮箱

热门文章

  1. 傲云浏览器linux,Centos7安装部署zabbix监控软件
  2. 【探索测试篇】探索无界,BUG无限,让程序猿头疼的测试技术
  3. 【Python爬虫】知识点简单总结
  4. 连接真机开发安卓(Android)移动app MUI框架 反馈意见、忘记密码、登录、底部选项卡、联系我们、导航等页面代码可拿——混合式开发(六)
  5. WARNING: You are using pip version 19.2.3, however version 20.1.1 is available. You should consi解决办法
  6. 怎样使用navicat将mysql的数据表导出保存(转储SQL文件)
  7. 散列表(算法导论笔记)
  8. 安装python性能检测工具line_profiler
  9. 推进五通一平:手淘技术三大容器 五大方案首次整体亮相 百川开放升级
  10. c# 日期函数[string.Format----GetDateTimeFormats] --转载