1.体系

  • 大数据概念,计算体系
  • 数据采集、建模和分析
  • 大数据处理的分析算法
  • 大数据处理技术
  • 数据可视化
  • Hadoop计算体系
  • HDFS/HBase存储架构
  • MapReduce计算模型
  • 计算模型和架构
  • 开发平台和工具软件

2.大数据概念

  1. 大数据(Big Data)特点:(4v)
  • 数据量大(数据存储不用关系型数据库---使用基于分布式文件系统的分布式数据库(例如NoSQL非关系型)、存储(基于逐渐的行存储----基于键值对的列存储))、计算模型
  • 数据异构化(来源、类型丰富)
  • 数据处理需要时效性
  • 大规模数据价值(区别于传统数据统计学处理数据:对象(局部和整体)、处理方法(抽样和累计每一条)、结果正确性)
  1. 数据转化过程:数据(二进制数据)--信息(计算机程序呈现的信息)---知识(通过分析信息)--价值

3.大数据计算系统

  • 数据存储系统数据:

  1. 数据采集、数据清洗(转为标准存储格式:键值对结构,hash表检索)、
  2. 建模型
  • (概念(一个主管下五个职工)、

  • 逻辑(数据库完成:外键职工有列所属主管编号)、
  • 物理(分布式文件系统完成:存到内存中)

  1. 存储架构(分布式)、数据仓库、统一数据接口

  • 数据处理系统:

  • 数据应用系统(可视化)

大数据计算1-综述大数据概念,计算体系相关推荐

  1. 深度学习计算框架综述(二)计算框架的组成与设计要点

    本章主要介绍一个通用计算框架主要包含哪几个模块,以及这些模块的设计要点,建议大家阅读本章前,了解一下Protocol Buffer 以及 FlatBuffer 的概念及基本用法. 首先,我们先分析一下 ...

  2. 分布式数据流计算系统的数据缓存技术综述

    点击上方蓝字关注我们 分布式数据流计算系统的数据缓存技术综述 袁旭初, 付国, 毕继泽, 张岩峰, 聂铁铮, 谷峪, 鲍玉斌, 于戈 东北大学计算机科学与工程学院,辽宁 沈阳 110169 论文引用格 ...

  3. 数据可视化工具综述(一)

    数据可视化工具综述–网络数据 01 一.Gephi 1.简介: Gephi是基于NetBeans平台和Java的开源网络分析和可视化软件.(Gephi是基于Java的,所以安装Gephi的同时,可能也 ...

  4. 边缘计算安全技术综述

    边缘计算安全技术综述 凌捷,陈家辉,罗玉,张思亮  广东工业大学计算机学院,广东 广州 510006   摘要:随着物联网应用的不断展开,大量移动终端设备参与服务计算,传统的云计算模型已经不能满足网络 ...

  5. 按一行一行的方法将一个文本文件复制到另一个文件中_大文件上的结构化数据计算示例...

    [摘要] 本文分析大文件计算的实现原理,如过滤.聚合计算.添加计算列.排序.分组聚合.topN 等,以及利用并行计算来提高计算速度,并用 esProc SPL 举例说明如何用简洁的脚本实现大文件计算. ...

  6. 大数据实时计算工程师/Hadoop工程师/数据分析师职业路线图

    大数据实时计算工程师/Hadoop工程师/数据分析师职业路线图 http://edu.51cto.com/roadmap/view/id-29.html http://my.oschina.net/i ...

  7. 《大数据》2015年第3期“网络大数据专题”——从系统角度审视大图计算

    从系统角度审视大图计算 吴城文,张广艳,郑纬民 (清华大学计算机科学与技术系 北京 100084) 摘要:大图计算已经成为学术界和工业界的一种基本计算模式,并且已经被应用到许多实际的大数据计算问题上, ...

  8. 大数据概论、大数据概念、大数据特点(4V)、Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、大数据应用场景、大数据发展前景、大数据部门间业务流程分析

    文章目录 1.大数据概念 2.大数据特点(4V) 2.1Volume(大量) 2.2Velocity(高速) 2.3Variety(多样) 2.4Value(低价值密度) 3.大数据应用场景 4.大数 ...

  9. 大数据是啥?大数据特点 大数据概念

    大数据 大数据概念 大数据(bigdata):指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是海量,高增长率和多样性的信息资产. 主要解决海量数据的存储和海量数据的分析计算问题. ...

最新文章

  1. 使用nexus来搭建Nuget私服
  2. 算法(1)斐波那契数列
  3. 探测器扎堆火星,毅力号:谁挡我WiFi了!
  4. AFNetworking和ASIHTTPRequest的比较
  5. 【控制】遗传算法(GA,Genetic Algorithm)及 Matlab 实现
  6. 法庭上认可零和博弈的理论吗_从零开始的本征理论
  7. 学习基础和C语言基础调查
  8. 我滴个乖乖,我复现了Spring的漏洞,害怕!
  9. fcn从头开始_从头开始有营销问题
  10. 对任意长度字符串,删除其中的任意的N(N=0)个字符
  11. 对check list理解
  12. Metamaterials perform image compression before light reaches the sensor(微波成像,拍摄与压缩同步进行)
  13. g120xa变频器调试参数_西门子G120XA变频器如何进行快速调试
  14. Atiitt 提升复用性之道 项目成本之道 Atitit 代码复用的理解attilax总结 1. 复用分类 1 1.1. 类库侧重代码重用,框架侧重设计重用 2 2. 文档与索引体系 2 3
  15. 硬件开发笔记(二):硬件开发基本流程,制作一个USB转RS232的模块(一):开发基本过程和元器件选型
  16. Yate架构分析概要
  17. embarrass的用法和搭配_embarrass_embarrass的意思和用法搭配
  18. 解决1 error and 0 warnings potentially fixable with the `--fix` option.
  19. 大学学计算机专业高中怎样选课,高中选课大学对应专业 选什么科目能学的专业多...
  20. TTW WYSIWYG Editors

热门文章

  1. Python对接微信小程序V3接口进行支付,并使用uwsgi+nginx+django进行https部署
  2. 音频开发基础知识简介
  3. Win8.1开始菜单右键无反应!
  4. SpringBoot无法连接redis
  5. win11 hyper-v完全打开和关闭
  6. 访问数据库的多种方式
  7. php 上取整函数是,PHP 取整函数参考
  8. 渡课学习第18天:jQuery 的遍历-不困了
  9. 基于深度学习的三维语义理解(分割)综述列表
  10. 使用muJava进行变异测试