【数据分析】全球医疗卫生开放数据概览
目录
1 开放数据是什么?
2 开放数据的好处是什么?
3 医疗卫生领域开放数据的目的是什么?
4 医疗卫生领域开放数据的类型是什么?
5 医疗卫生领域开放数据的有利因素是什么?
6 全球医疗卫生领域开放数据的时间线
7 中国医疗卫生领域开放数据的现状
8 参考资料
2014年写的一篇文章,希望能从多个角度帮助大家了解医疗卫生开放数据以及相关应用。
1 开放数据是什么?
首先来解释一下开放数据的意义。一个简单的回答是:互用性。互用性指的是不同系统和组织间协同工作 (协同操作) 的能力。在这里,它指的是协同操作或者混合不同数据集的能力。
我们采用「开放知识定义」来定义开放数据:
开放数据是一类可以被任何人免费使用、再利用、再分发的数据——在其限制上,顶多是要求署名和使用类似的协议再分发。
完整的「开放知识定义」对于这一定义给出了更为翔实的解释。这里总结出最关键的部分:
- 可获取性和可访问性:作品应当能够被完整获取,并且所需的花费应当不超过合理的重制费用(较好的获取方案是提供从网络下载数据)。数据也必须使用方便修改的格式。
- 再利用和再分发:数据应当使用允许再利用和再分发(包括与其他数据集整合后再分发的情况)的许可协议。
- 普遍参与性:每一个人都应当能够使用、再利用、再分发那些数据。因此就不允许有限制个人或团体使用的协议。比如,「非商业用途」限制就会限制「商业」用途因此不被允许。又比如限制只能在规定领域使用数据(比如只能在教育领域使用)也是不被允许的。
关于大数据、政务公开和开放数据之间的关系,请看下图的解释,此图来自于技术作家Joel Gurin的专著《Open Data Now》。
图片来源:笔者绘制。
2 开放数据的好处是什么?
政府鼓励社会对完全开放数据的再利用,企业可以基于免费、开放的数据构建可行的商业模式。越来越多的企业开始使用开放数据,未来五到十年,使用开放数据的企业将随处可见。
以新加坡政府为例,新加坡政府开放数据门户https://data.gov.sg专门提供了数据再利用应用程序,开发者可以利用开放接口https://data.gov.sg/developer 做开发。可以在https://data.gov.sg/group/health上找到新加坡的健康数据。
新加坡政府也通过OneMap https://www.onemap.sg平台向开发人员提供数据集虚拟化功能。此外,新加坡公共机构Up Singapore还举办了开放数据创新竞赛,特别是医疗卫生方面的Health Up Hackathon竞赛http://www.upsingapore.com/events/health-hackathon/,鼓励对医疗卫生开放数据再利用。
在美国,OpenData 500网站项目由NYU Governance Lab(GovLab)管理,前面提到的Joel Gurin在主持这个项目。OpenData 500的目的是为评估开放政府数据的经济价值提供基础,也鼓励创建新的开放数据驱动企业,同时推动政府和企业之间展开更有效使用开放数据的对话,首批企业列表已经公布在网站上。目前澳大利亚、墨西哥、美国、韩国、意大利和加拿大加入了这个网络。
这个项目在GitHub上的路径是https://github.com/GovLab/OpenData500
3 医疗卫生领域开放数据的目的是什么?
提高医疗卫生系统透明度
通过展示覆盖面广、深度合适和总量大的医疗卫生公共数据,有助于提高医疗卫生系统的透明度。
为患者提供便利服务
通过开放卫生机构和卫生从业人员的医疗质量方面的数据,可以帮助公众选择合适的卫生机构、专业人员以及相关治疗信息。
鼓励数据再利用和创新
企业和个人基于开放的医疗卫生数据,可以构建新型商业模式为患者和医疗卫生机构、专业人员提供更好的服务.
以Archimedes为例,其现在属于Evidera,该公司利用医疗数据、临床研究数据创建了决策支持工具。反过来,它又构建了API,帮助开发者将糖尿病管理的最佳实践指南整合入用户关注的卫生、健康、临床支持、生活方式应用中。可以访问此网站获得具体信息http://www.sphanalytics.com/。
4 医疗卫生领域开放数据的类型是什么?
以下为各个国家的应用情况,数据来源于法国卫生部开放数据委员会报告。
数据类型 |
数据类型 |
数据内容 |
作用及延伸应用 |
典型应用的国家 |
网址 |
医疗卫生消费 |
所有医院每个病人每次就诊的相关数据 |
查询者只需在系统中输入相关搜索条件(譬如年龄、性别、年份等)即可下载生成表格。 |
丹麦 |
Http://www.ncbi.nlm.nih.gov
|
|
疾病类 |
流行病数据集 |
病例数量和热点区域 |
便于事先安排好预防工作,有助于减少登革热病传染风险 |
新加坡 |
|
卫生机构和卫生从业人员的医疗质量 |
所有医院八类科室的等候时间 |
等候时间工具,估计不同地区不同类型科室的等候时间 |
加拿大 |
http://www.ourhealthsystem.ca
|
|
医疗卫生系统的五大关键数据 |
每个医院就诊难度、医疗水平、费用、疾病预防、全国人口健康状况的变化 |
加拿大 |
http://www.ourhealthsystem.ca |
||
平均住院长度和不同医院价目表 |
根据地区、患者年龄和医疗类型区分 |
病人开销评价器,帮助患者预测平均住院时间和成本 |
加拿大 |
http://www.ourhealthsystem.ca
|
|
取得医学学位的医疗卫生从业人员的全部数据 |
如姓名、出生日期、工作地点、职业、获得学位时间等信息 |
丹麦 |
http://www.Sundhed.dk
|
||
住院后死亡率 |
提供搜索工具帮助公众选择合适的卫生机构和专业人员 |
英国 |
http://www.nhs.uk 不仅能帮助患者查找医疗信息还可在网上就诊:只需输入关键词或所患症状,该网站即能查找出500种药物或者700种疾病的信息,还能帮助患者查找合适的医生及相关治疗信息 |
||
全国各医疗机构患者满意度得分 |
开放了医院处方、月平均用药量、医疗成本等方面的数据 |
帮助英国公民选择医疗机构并在线预约看病 |
英国 |
http://www.nhs.uk |
|
卫生机构医疗质量数据 |
包含了患者满意度调查报告和医院医疗质量指标方面的数据 |
提供搜索工具帮助公众选择合适的卫生机构和专业人员 |
美国 |
http://www.medicare.gov/hospitalcompare/compare.html 医院比较(Hospital Compare)数据集 |
|
药品类 |
医药产品统计登记册 |
包括了所有医药产品的销售记录,并根据年份、出厂地区、购买者年龄和性别等加以分类 |
丹麦 |
http://www.ssi.dk/English/HealthdataandICT/Health%20data/Registries/Register%20of%20Medicinal%20Products%20Statistics.aspx |
|
WONDER数据库 |
包含了不同年龄和性别的患者对不同类型疫苗引起的不良反应的数量 |
美国 |
http://wonder.cdc.gov |
5 医疗卫生领域开放数据的有利因素是什么?
各国政府都有强烈的开放意愿
许多国家通过制定公共数据开放战略来推动公共数据开放,鼓励经济创新和政府信息透明化。
具备健全的政策法规环境
部分国家具备了与信息权利相关的所有法律。此外,部分国家还通过法律、法规或政府文件要求公共部门开放数据。例如,加拿大政府2010年的《获取信息法》要求地区公共机构公布数据清单并按相关格式要求开放数据;美国的《医治保险携带和责任法案》有利地促进了“医疗保险和医疗补助”数据库的建立。
完善数据库系统
医疗卫生数据的收集、处理和汇总工作对数据开放的范围、深度等都有影响。许多国家负责汇集医疗卫生数据的公共机构有力地促进了广域数据库的建立,具有重要的作用。
当然开放数据也存在一些不利因素,如隐私可能被无意侵犯,数据透明带来消极后果以及数据可能被误读和误用,需要政府和企业一起做相应决策和引导。
6 全球医疗卫生领域开放数据的时间线
不同国家因卫生系统组织结构、司法环境、历史和政治环境的不同,开放数据的策略也各具特色。下图为最具参考性和代表性的5个国家(英国、美国、加拿大、丹麦和新加坡)公共数据开放战略的时间线。
图片来源:笔者绘制。
7 中国医疗卫生领域开放数据的现状
全国的开放数据可以从每年的卫生统计年鉴中获取,最近的数据可从《中国卫生和计划生育统计年鉴2015》一书获取,也可以从国家数据http://data.stats.gov.cn/和卫生计生统计 http://www.moh.gov.cn/zwgkzt/pwstj/list.shtml中获取信息。
以下的城市目前建立了开放数据平台,提供了卫生机构的一些信息,但数量较少,有待进一步发展。
数说南海 http://data.nanhai.gov.cn/
上海市政府数据服务网 http://data.stats.gov.cn/
北京市政务数据资源网 http://www.bjdata.gov.cn/
无锡市政府数据服务网 http://opendata.wuxi.gov.cn/
另外,开放数据中国网站 http://opendatachina.com/ (现已无效)是一个专注于开放数据的虚拟的合作性网络。这个网络提供平台供个人、非营利机构、商业公司、政府机构共同协作创建中国的开放数据生态。微信公众号为开放数据中国。
8 参考资料
Open Data Handbook http://opendatahandbook.org/zh_CN/what-is-open-data/index.html
美国健康开放数据 https://data.healthcare.gov/
The GovernanceLab@NYU http://thegovlab.org/
NewOpen Data on Healthcare.gov Obamacare Health Insurance Plans
http://socialhealthinsights.com/2013/10/healthcare-gov-open-data/
英国健康开放数据 http://openhealthcare.org.uk/
Health &Socail Care InformationCentre in UK http://www.hscic.gov.uk/transparency
全球医疗卫生领域公共数据开放比较-T媒体
彭彬彬:开放医疗数据将构成新型的医患互动-搜狐健康
开放数据:2014年最热门的竞争领域 http://www.csdn.net/article/2014-01-13/2818114-open-data
French Open Data in Health Commissionsubmits new report
http://www.epsiplatform.eu/content/french-open-data-health-commission-submits-new-report
欢迎大家留言,一起研究开放数据的使用和影响。
注:以上链接于2016年搜集,如果链接失效,请谅。
【数据分析】全球医疗卫生开放数据概览相关推荐
- 医疗卫生信息化数据防泄漏保护系统解决方案
目录 1 项目概述 1.1 项目背景 1.2 项目简介 2 系统安全建设风险与需求 2.1 区域卫生信息化系统架构 2.2 系统的数据性质与分类 2.3 安全风险的分类 2.3.1 个人的风险 2.3 ...
- 医疗卫生行业数据如何保护?云备份不惧勒索攻击
与其他关键信息基础设施行业不同,医疗卫生系统更关系到人们的生命安全.医疗行业的特殊性质也使得它们成为攻击者关注的重点,黑产团队将成千上万病人病例.药方.学术报告等重要医疗卫生资料通过恶意计算机病毒加密 ...
- 智慧城市开放数据的发展趋势分析及探讨
智慧城市开放数据是指将政府.企业.非营利性组织等掌握的各类数据主动向公众公开,供用户查询.下载.应用,以实现智慧城市数据信息在网络空间的公开.共享与重用.本文首先对智慧城市开放数据的内涵进行了阐述,通 ...
- 神策数据全新改版数据概览,致力打造多角色、多场景的“工作台”
近日,神策数据正式推出 1.11 版本.新版本延续了一贯的对产品专业度.易用性的精细打磨,颠覆传统数据分析平台的功能堆砌形式,重塑了用户的应用场景,从数据分析能力.场景化的操作体验等方面完成了智能优化 ...
- 用友区域医疗卫生信息化解决方案
用友区域医疗卫生信息化解决方案 一.区域卫生信息系统四大焦点问题 居民医疗健康信息缺乏统一管理 目前,我国居民医疗健康信息记录不完整.缺乏统一管理,严重影响和制约了居民医疗健康管理和服务的 ...
- “华为云杯”2020深圳开放数据应用创新大赛线上推介会成功举办,让深圳大数据在全球“跑”起来...
4月30日下午,"华为云杯"2020深圳开放数据应用创新大赛第三场线上推介会完美落幕.至此,从4月23日开始的三场云端推介会全部结束,全球各数字平台总观看量1000多万人次.深圳市 ...
- 郑州医疗卫生服务迈入大数据时代
打开手机A PP移动门户网"掌上郑医",或者通过扫描A PP二维码,你就可在郑州大学附属郑州中心医院网上进行手机挂号.预约名医.取报告单的操作,并可与医生进行顺畅的在线交流.许多患 ...
- 【Cloudaily】Elastic Stack 5.2.0 版本发布,Uber免费开放全球20亿行程数据
Cloudaily网罗新鲜要闻,每日为你呈现大数据和云计算领域热点新闻.本次内容播报如下: Apache Storm 1.0.3 发布,分布式实时计算 Apache Storm 1.0.3 发布了,A ...
- 博奥智源,浅谈基层医疗卫生机构绩效考核业务数据集成平台开发
系统模块 技术要求 数据采集管理 根据基层医疗卫生机构绩效考核指标要求,实现与相关应用系统的数据对接并采集对应数据.需要对接的业务系统包括但不仅限于:基层区域HIS系统.居民电子健康档案系统.妇幼保健 ...
最新文章
- 计算面平均边_计算机图形学补充2:齐次空间裁剪(Homogeneous Space Clipping)
- 入门 | 机器学习第一课:决策树学习概述与实现
- oracle 建分区索引_Oracle分区表及分区索引-创建list分区
- 织梦dedecms系统修改文章描述调用字数的方法
- Python-Flask实现电影系统管理后台
- 刘意JavaSE 学习笔记 Day19-Day21——异常,IO(File类/字符流/字节流)
- 微信电脑版调整字体大小的办法
- 用shell脚本批量删除文件名后缀
- Python-常用数据结构(字典)-Dict
- iOS Swift 使用 CLLocationManager 定位
- Arcgis选择自己想要的区域地图
- GreenHills基本操作:通过 R寄存器和上下文变量 定位异常
- AutoCAD .Net 创建直线Line
- 笔记本怎么用android,电脑上如何使用Android系统
- ajax去掉session,PHP中解决ajax请求session过时退出登陆问题
- 网传叮咚买菜大裁员?并非空穴来风
- SAP 响应时间 性能察看
- 把java项目打包成安装包,在windows下安装
- 第六章贪心(三):排序不等式、绝对值不等式
- StatQuest-MachineLearning-Lesson1~5
热门文章
- 熊猫阵亡,陌陌、YY财报背后的直播江湖仍在
- 出生日期算年龄html,Javascript从出生日期算起的年龄
- 快排为什么不稳定 举例说明
- 快应用之先写出第一个hello world
- java 开源sns_JAVA开源SNS社交管理问答知识付费系统JEESNS v1.4.2
- Morto蠕虫病毒分析报告
- 如何选购计算机硬件,如何选购电脑硬件 选购电脑硬件技巧【详细介绍】
- 101条经典幽默的计算机编程名言
- 用宝塔面板网站php变成静态,宝塔面板设置伪静态规则
- MySQL探秘(八):InnoDB的事务