科研数据是全人类共同的智慧结晶,是科学技术前进的基石。无论是数百年前牛顿定律的提出,还是当今新药物的研制、数字地球的发展、黑洞照片的发现等等,无不依赖于对实验、观测、调查、测量、模拟等所产生的原始数据及有关派生数据的综合分析和利用。

数据成为检验科学研究价值的试金石。一方面,许多学科领域的科学发现以数据为基础,以新的数据发现为目标,辅以挖掘工具与分析手段,将数据与重要发现融合。另一方面,数据成为重复科学试验、确保研究成果真实可靠的检验基础。

当前,科研数据分散于个科学工作者或研究组织内部,基于权益的局限,成为了数据孤岛。随着数据利用能力的增强,科研数据的更大尺度的公开也变得更加必要和迫切。除了提高研究结果的可检验性和公信力以保障科学的自我修正能力之外,科研数据的开放共享还为更多的科学研究提供了丰富的基础材料,扩展科学研究的范围,扩张科学研究的视角,产生更多的科学知识,以及使得它们可以为科研以外的生产活动开发利用,产生难以预料的社会和经济价值。为此,科研数据开放共享不仅为学术界自身呼吁,而且为国家政府、资助机构、出版机构、公众等利益相关者关注。

国际社会为了科研数据开放共享而做的诸多努力

诸多国际性组织(如OECD、ICSU、GEO等)和国家发布了关于科研数据开放共享的政策性文件。

美国政府先后颁布了A-130通告和《开放数据政策——将信息作为资产管理》文件,美国国家科学基金会、国立卫生研究院等科研资助机构也分别发布了相应的科研数据开放共享政策。

科研数据开放共享在具体实践层面,目前呈现出多模式探索之貌:既有大型国际合作项目或组织主导建立的开放数据库或系统,也有政府投资建立的国家级科研数据中心或系统,还有科研教育机构建立的存储和共享本机构科学数据的存储库,出版界所进行的要求作者提交和公开论文支撑数据的实践,以及一些通用型数据存储库或数据存储与共享平台等。尽管科研数据开放共享在政策和实践层面都有令人欣喜的进展,但科学数据开放共享的成效总体来说还远未达到预期。

另外,基于付费的专业领域数据库是运营比较的成功的一种科研数据系统,比如材料领域的晶体数据库(ICSD),人工智能领域的人脸识别数据等。这些数据系统集中在某种具备直接的,显著的经济价值的数据,如材料结构数据库,人脸识别数据,数据清洗规范程度高,覆盖范围窄。

造成共享数据平台数据采集乏力的主要原因有:数据生产者缺乏开放共享数据的原始动力,科研数据当前价值与数据获取成本,如算力,存在倒挂:数据生产者的权益方面存在信任危机:中心化的数据平台在保障数据所有者权益方面存在信任危机,数据权益缺失限制了数据所有者开放数据的动力。

我国做法:打开上锁抽屉 让科学数据共享

在中国,科研数据开放共享也已上升到国家战略高度。国务院2015年8月发布的《促进大数据发展的行动纲要》中,明确提出了“积极推动由国家公共财政支持的公益性科研活动获取和产生的科学数据逐步开放共享”的重要目标。2018年3月17日,国务院发布《科学数据管理办法》指出,科学数据是国家科技创新和经济社会发展的重要基础性战略资源,在当今大数据时代,科技创新越来越依赖于对科学数据的分析挖掘和综合利用。

随着我国科技创新能力不断提升,科学数据质量也大幅提高,为我国创新型国家建设奠定了良好基础。针对目前大量科学数据被“锁在抽屉里”的现象,我国第一次在国家层面出台科学数据管理办法,推动科学数据共享应用。为此,国务院办公厅日前印发了《科学数据管理办法》(以下简称《办法》),这是我国第一次在国家层面出台科学数据管理办法。

“当前,我国正处于实施创新驱动发展战略和建设科技强国的关键时期,加强和规范科学数据管理是加强我国科技创新能力建设和保障国家安全的重要方式和手段。”科技部基础研究司司长叶玉江表示。

补齐管理短板

科学数据是国家科技创新发展和经济社会发展的重要基础性战略资源,是信息时代传播速度最快、影响面最宽、开发利用潜力最大的科技资源。

“当代科学技术发展呈现出明显的大科学、定量化研究特点,科技创新越来越依赖于大量、系统、高可信度的科学数据,对科学数据的综合分析,本身就是科技创新的一种方式。”叶玉江说,开展科学研究首先需要尽可能多地收集、分析和研究主题相关的科学数据,对生命科学、天文学、空间科学、地球科学、物理学等学科来说更是如此。

然而让国家科技基础条件平台中心副主任王瑞丹有些痛心的是,“许多高价值的科学数据并未在国内得到充分的共享和使用就流向了国外”。

为了减少科学数据流失,《办法》规定主管部门、法人单位要建立相应的管理制度,确保在国外发表学术论文的作者将支撑论文观点的科学数据汇交到所在单位统一管理。“不管是财政资金项目、预算资金项目还是其他渠道产生的科学数据,今后必须先向法人单位提交,由法人单位进行相应的审查和汇聚,之后才能交到国际上去。这样既不妨碍科学数据正常流动,也保证了科学数据在国内的使用。”王瑞丹表示。

推动开发利用

叶玉江坦陈,科学数据流失只是一方面,在科学数据开发利用、开放共享等方面,我国也有很大的改进空间。他举例说,一个课题组获取的相关数据用于发表文章、参与评奖后,大多“锁在抽屉里”,这种现象在科研界十分普遍。究其原因,很多科学家尚未形成科学数据应开放共享的观念意识,以致一些数据广泛分散在个人或课题组手中,阻碍了科学数据的正常流动。

加强科学数据管理和开放共享时不我待,2004年起,科技部、财政部先后在基础科学、农业、林业、海洋、气象、地震、地球系统科学、人口与健康8个领域支持建成了国家科技资源共享服务平台,初步形成了一批资源优势明显的科学数据中心。

针对科学数据利用率不高的问题,《办法》提出3项举措:实行清单管理制度,由主管部门组织编制科学数据资源目录;鼓励科研人员整理形成产权清晰、完整准确、共享价值高的科学数据;在数据共享过程中,原则上对公益性事业及公益性科学研究无偿提供,确需收费的应按照规定程序和不盈利原则制定合理的收费标准。

确保安全可控

科学数据的价值体现在使用,前提则是确保安全。

叶玉江说,《办法》始终把确保数据安全放在首要位置,对涉及国家安全和秘密的科学数据如何把握好开放与保密的关系,做了原则性、政策性的规定,这是现实所需也是国际惯例。“科学数据管理必须要以安全可控为前提,按照国家有关法律法规,依法确定科学数据安全等级及开放条件,严格做好科学数据保密工作,建立数据共享和对外交流的安全审查机制。”

《办法》明确规定,对涉及国家秘密、国家安全、社会公共利益、商业秘密和个人隐私的科学数据,不得对外开放共享;确需对外开放的,要对利用目的、用户资质、保密条件等进行审查,并严格控制知悉范围。并对主管部门和法人单位的职责做了明确规定,强化了法人单位的主体责任,明确主管部门和法人单位依法确定科学数据的密级及开放条件。

王瑞丹透露,后续科技部将推动建立一批具有国际影响力的科学数据中心,实现国家政府预算产生数据长期管理和共享使用。

如何推进科研数据的共享相关推荐

  1. 开放科学背景下的科学数据开放共享:国家青藏高原科学数据中心的实践

    开放科学背景下的科学数据开放共享:国家青藏高原科学数据中心的实践 潘小多1,2, 李新1,2, 冉有华3, 郭学军2 1 中国科学院青藏高原研究所国家青藏高原科学数据中心,北京 100101 2 中国 ...

  2. 上海推进大数据研究与发展三年行动计划(2013-2015年)

    发布时间:2013-07-12 前言 在国家和上海市"十二五"科技发展规划及<上海市中长期科学与技术发展规划纲要>指导下,上海市科学技术委员会通过近一年时间的充分调研和 ...

  3. 医工智能 创享未来—— “医工科研数据平台”与“医工结合科研创新支持计划”发布!...

    2018年11月14日,由清华大学软件学院.临床医学院.数据科学研究院.交叉信息研究院以及北京清华长庚医院共同建设的"医工科研数据平台"于清华大学主楼会议室举办了发布仪式.此次发布 ...

  4. 【每日新闻】阿里云成中国唯一全面提供IPv6服务 | 区块链技术可以促进数据的共享以改进流程...

    点击关注中国软件网 最新鲜的企业级干货聚集地 趋势洞察 2018中国软件生态大会暨第十一届中国软件渠道大会首站在北京.天津.太原.郑州.济南站成功举行,同时拉开了覆盖上海.深圳.成都.西安等全国16个 ...

  5. 【产业互联网周报】销售易获腾讯1.2亿美元投资;国科恒泰完成11亿C轮融资;工信部、科技部推进大数据及人工智能...

    关注ITValue,看企业级最新鲜.最具价值报道! 图片来源@视觉中国 | [产业互联网周报是由钛媒体TMTpost发布的特色产品,将整合本周最重要的企业级服务.云计算.大数据领域的前沿趋势.重磅政策 ...

  6. 145页6万字政务大数据交换共享平台建设方案

    第一章 需求分析和项目建设的必要性 ...........................................4 1.1 项目建设目标.内容........................ ...

  7. 人民链鲍大伟:打破壁垒,建立全域数据治理共享及应用平台

    2020年10月,在人民网主办的"人民链信誉评价研讨会"上,微众银行与人民在线就共建"人民链"达成战略合作.依托"人民链",微众银行融合区块 ...

  8. 大数据导论--大数据安全与数据开放共享

    传统数据安全隐患 计算机病毒.数据信息存储介质的损坏.黑客攻击 大数据安全与传统数据安全的不同 大数据成为网络攻击的显著目标 大数据加大隐私泄露风险 大数据技术被应用到攻击手段中 大数据成为高级可持续 ...

  9. 推荐几个科研数据相关的下载平台

    from:http://www.newsmth.net/nForum/article/AI/87141 1.科学网(http://www.sciencenet.cn/bbs) 推荐理由:起点比较高的科 ...

最新文章

  1. getParameter的用法总结
  2. 你会利用css写下拉列表框吗?
  3. Android 阅读器架构图,网上收集,留做存货
  4. React之mockjs+sass+生命周期函数
  5. Asp.Net实例:C# 绘制统计图(三) ——扇形统计图的绘制
  6. http 请求_HTTP请求方法有哪些?
  7. HDU3068 最长回文【manacher算法】
  8. 201671010133 2016-2017-2 《java程序设计》 初学java!
  9. 安装tensorflow出现的问题
  10. 上位机与下位机进行交互
  11. DFS----深度优先搜索与记忆化数组例题分析
  12. 免费动态域名解析软件dnspod每步nat123体会
  13. Real-Time Rendering 4th Edition 实时渲染第四版 第五章 着色基础(Shading Basics)
  14. 【数字图像处理】认识数字图像和数字图像处理
  15. 【小样本分割 2020 ICCV】PANet
  16. 基于人工智能的软件测试
  17. Color Space: Ycc
  18. python遗传算法有多慢_python遗传算法的优化过程是什么?
  19. 【html/css】CSS中去掉li前面的圆点方法
  20. 小波变换之(凯斯西储大学CWRU数据转为时频图像)-matlab

热门文章

  1. 真智能还是伪智能?谈谈人工智能在企业SaaS中的应用之HR篇
  2. python语言计算机二级
  3. ACDSee.Pro.v6.0.Build.169.32.bit.incl.patch-iOTA
  4. 100种思维模型之上帝视角思维模型-025
  5. 实现“互联网+政务服务”平台与运政管理业务系统的数据自动流转,窗口工作人员不再手工二次录入--二次录入
  6. pcb外观维修_教你如何检测修理电路板
  7. MobData研究院,一个操作让游戏 营销ROI 翻了3倍
  8. 火柴棍移动的一道面试题
  9. NB-IOT 移远BC35设置频点学习记录
  10. oracle如何下载及安装,Oracle下载及安装超详细教程