医疗健康大数据基础知识
1.大数据是指难以被传统数据管理系统有效且经济地存储,管理,处理的复杂数据集。
大数据以PB为单位,包含结构化,半结构化,无结构化数据,大数据给数据的采集,运输,加密,存储,分析和可视化带来了严峻的挑战。
2.大数据五个特性:Volume(数据规模巨大)
Variety(数据类型繁多)
Velocity(数据产生的速度快)
Veracity(分析结果取决于数据准确性)
Value(包含重要价值)
3.大数据处理方法:关联规则学习(挖掘各个变量间的关系),
分类(通过训练已有数据来识别新的数据),
聚类分析(按数据相似程度将整个数据集分为多个小规模数据集),
数据融合(将多个数据源的信息整合分析以产生新的更加精确,连续,有价值的信息),
机器学习(一类算法的总称,关注设计算法自动识别数据中的复杂模式),
自然语言处理(关注计算机与自然语言的联系,帮助计算机识别人类语言),
回归(一组统计算法,用来判别因变量与自变量的关系,以帮助预测),信号处理(一组用来识别,分析,处理信号的技术),
仿真(模拟一个复杂系统行为的技术,经常被用来预测),
可视化(将数据处理为图像,图标,动画,以帮助人类直观了解数据)
4.大数据处理平台:MapReduce,其提供了一种分布式编程的抽象方法;
Hadoop,其包含了多个系统和工具以帮助完成大数据任务;
HDFS,其用来可靠地分布式存储数据;
Hive,其提供了Hadoop上的SQL支持;
HBase,它是基于HDFS的一种非关系型数据库;
Zookeeper,其提供了集群节点的一个管理方法。
5.医疗健康大数据特点:多态性指医师对病人的描述具有主观性而难以达到标准化
时效性指数据仅在一段时间内有用;
不完整性指医疗分析对病人的状态描述有偏差和缺失;
冗余性指医疗数据存在大量重复或无关的信息;
隐私性指用户的医疗健康数据具有高度的隐私性,泄漏信息会造成严重后果。
医疗健康大数据基础知识相关推荐
- hawk大数据基础知识总结(1)
一.大数据概述 1.1大数据的概念 大数据一共具有三个特征:(1)全样而非抽样:(2)效率而非精确:(3)相关而非因果. (1)在过去由于缺乏获取全体样本的手段,人们发明了"随机调研数据&q ...
- 《大数据》第2期“应用”——医疗健康大数据:应用实例与系统分析
医疗健康大数据: 应用实例与系统分析 董 诚1,2,林 立1,2,金 海1,2,廖小飞1,2 1. 华中科技大学计算机科学与技术学院服务计算技术与系统教育部重点实验室武汉430074 2. 华中科技大 ...
- 大数据基础知识(上)
大数据基础知识:技巧与概念 什么是大数据 数量多 流转快 种类多 大数据需要具备全部三个特征吗? 如何使用大数据 了解消费者大数据 了解企业大数据 了解科学研究大数据 大数据与数据科学 大数据与小数据 ...
- 医疗健康大数据: 应用实例与系统
随着信息技术和物联网技术的发展.个人电脑和智能手机的普及以及社交网络的兴起,人类活动产生的数据正以惊人的速度增长.根据国际数据公司(International DataCorporation,IDC) ...
- 2015年《大数据》高被引论文Top10文章No.6——医疗健康大数据:应用实例与系统分析...
2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将陆续发布2015年<大数据>高被引论文Top10的文章,欢迎大家关注!本文为高被引Top10论文的No.6,刊 ...
- 大数据基础知识(下)
大数据基础知识:技巧与概念 大数据伦理 匿名方面的挑战 保密性方面的挑战 大数据的来源和结构 人类生成的数据 机器生成的数据 结构化数据 非结构化数据 存储大数据 分布式存储与云 云计算:IaaS.P ...
- 医疗健康大数据: 应用实例与系统分析(转)
1 概述 随着信息技术和物联网技术的发展.个人电脑和智能手机的普及以及社交网络的兴起,人类活动产生的数据正以惊人的速度增长.根据国际数据公司(International DataCorporation ...
- 大数据_02【大数据基础知识】
大数据_02[大数据基础知识] 01 什么是服务器 02 服务器类型 03 存储磁盘(硬盘) 04 什么是RAID RAID特点 RAID种类 05 什么是集群 06 什么是计算机网络 07 什么是交 ...
- 大数据_03【大数据基础知识】
大数据_03 [大数据基础知识] 01 大数据概述 02 什么是大数据?(Big Data) 03 传统数据与大数据的对比 04 大数据的特点 4.1 传统数据与大数据处理服务器系统安装对比 4.2 ...
最新文章
- C# Winform编程ListBox之添加图标
- JavaScript的编码规范
- 决策树随笔-深度AI科普团队
- C#中的程序集和命名空间
- Lingo 11安装教程
- 留存记录:Graph500-2.1.4教程
- 从零开始学英语 (洪恩教学光盘 8CD)
- 数字货币钱包 - 助记词 及 HD 钱包密钥原理
- 人工智能应该用在这个地方!
- Python鞋码表 以及购鞋尺寸推荐 简单的Python脚本
- kali 将系统文件夹名称设置为英文
- 51单片机的几种精确延时
- 智慧城市服务平台硬件采购清单(参考)
- 进入房间时如何使用SmartThings自动打开灯光
- 免费Excel自动化转云端OA/ERP/CRM等办公系统数据管理软件工具
- 苹果电脑和windows电脑怎么选择?开发应该用什么电脑?视频剪辑用什么电脑?电脑推荐
- 如何检测摄像头是否被占用
- hive表信息查询:查看表结构、表操作等(转)
- 【随心所记】矩阵A的行列式不等于0,是A可逆的充要条件吗?答:是这样的
- 一个体育生的编程之路(一)