传统数据处理介绍

数据来源:
1、企业内部管理系统 ,如员工考勤(打卡)记录。
2、客户管理系统(CRM)
数据特征:
1、数据增长速度比较缓慢,种类单一。
2、数据量为GB级别,数据量较小。
数据处理方式:
1、数据保存在数据库中。处理时以处理器为中心,应用程序到数据库中检索数据再进行计算(移动数据到程序端)
遇到的问题:
1、数据量越来越大、数据处理的速度越来越慢。
2、数据种类越来越多,出现很多数据库无法存储的数据,如音频、照片、视频等。

什么是大数据?(Big Data)

是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

是指一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

数据的存储单位
最小的基本单位是bit
1 Byte =8 bit
1 KB = 1,024 Bytes = 8192 bit

KB MB GB TB PB EB ZB YB BB NB DB 进率1024

传统数据与大数据的对比

大数据的特点

数据集主要特点

Volume(大量)  :  数据量巨大,从TB到PB级别。
Velocity(高速): 数据量在持续增加(两位数的年增长率)。
Variety(多样) :     数据类型复杂,超过80%的数据是非结构化的。
Value(低密度高价值):  低成本创造高价值。

其他特征
数据来自大量源,需要做相关性分析。
需要实时或者准实时的流式采集,有些应用90%写vs.10%读。
数据需要长时间存储,非热点数据也会被随机访问。

传统数据与大数据处理服务器系统安装对比

传统数据下服务器系统安装
在传统数据背景下,服务器系统安装中,系统硬盘、数据硬盘完全隔离。通常会将多块数据硬盘制作成LVM(逻辑卷),即将多块物理硬盘通过软件技术“拼接”在一起形成一个大的硬盘(逻辑上是一个硬盘)。

大数据下服务器系统安装
在大数据背景下,服务器系统安装中,系统硬盘、数据硬盘完全隔离。数据硬盘必须独立挂载,每个硬盘挂载到系统的一个独立的目录下。

大数据概述:传统数据与大数据的区别相关推荐

  1. 企业数据应用 传统商业智能对比大数据应用

    传统商业智能对比大数据应用 传统商业智能模式 商业智能系统的主要功能 大数据的变革 BI(商业智能) OLTP(联机事务处理) OLAP(联机分析处理) 操作数据库系统和数据仓库系统的区别 为什么需要 ...

  2. Kaggle经典数据分析项目:泰坦尼克号生存预测!1. 数据概述与可视化2. 数据预处理3. 模型训练4. 模型优化(调参)

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习 ,不错过 Datawhale干货 作者:陈锴,中山大学,Datawhale成员 最近有很多读者留言,希望 ...

  3. npp夜光数据介绍 viirs_1.夜间灯光遥感数据概述

    1.夜间灯光遥感数据概述: 夜间灯光遥感数据主要来自于由美国国防气象卫星搭载的可见光成像线性扫描业务系统(DMSP/OLS)和国家极轨卫星搭载的可见光近红外成像辐射仪(NPP/VIIRS)获取的夜间灯 ...

  4. 大数据学习笔记01:大数据概述

    文章目录 一.Zebra项目缺点 二.大数据概述 1.大数据时代 (1)第三次信息化浪潮 (2)信息科技为大数据时代提供技术支撑 A. 存储设备容量不断增加 B. CPU处理能力大幅提升 C. 网络带 ...

  5. 大数据技术介绍:01大数据概述

    大数据技术介绍:01大数据概述 大数据技术框架: Hadoop生态系统(1) Hadoop生态系统(2) Hadoop构成:Flume(非结构化数据收集): Cloudera开源的日志收集系统 用于非 ...

  6. 大数据(一) --大数据概述

    大数据概述 大数据兴起的背景 --第三次信息化浪潮 技术支撑 数据产生方式的变革. 什么是大数据? 大数据特性 大数据的几个来源 大数据带来思维方式的转变: 关键技术: 典型计算模式 大数据兴起的背景 ...

  7. 大数据学习笔记(一)——大数据概述

    第一章 大数据概述 1.1 大数据时代 1.1.1 信息科技为大数据时代提供技术支持 ①存储设备容量不断増加--解决了信息存储的问题 ②CPU处理能力大幅提升--解决了信息处理的问题 ③网络带宽不断増 ...

  8. 大数据技术原理与应用——第一章 大数据概述

    第一章 大数据概述 1.1 大数据时代 1.1.1 第三次信息化浪潮 信息化浪潮 发生时间 标志 解决的问题 代表企业 第一次浪潮 1980年前后 个人计算机 信息处理 Intel.AMD.IBM.苹 ...

  9. 【云计算与大数据概述 】课堂笔记

    文章目录 第一章 云计算与大数据基础 1.1 云计算基础 1.1.1 云计算简介 1.1.2 云计算的特点 1.1.3 云计算技术分类 1.2大数据基础 1.2.1 大数据简介 1.2.2 主要的大数 ...

最新文章

  1. 改变2020年及未来的8大人工智能趋势
  2. SpringBoot高级-消息-AmqpAdmin管理组件的使用
  3. 忽略异常_忽略已检查的异常,所有出色的开发人员都在这样做–基于600,000个Java项目...
  4. stm32正交编码器 原理图_恶劣环境下应用的电感式增量编码器和绝对编码器
  5. Flume案例Ganglia监控
  6. 华为交换机做qos案例_景区视频监控交换机如何选?信锐安视交换机给您答案
  7. Linux下通过HostName访问主机以及修改HostName方法
  8. 「leetcode」1. 两数之和:map等候多时了
  9. 安装Genymotion步骤,启动模拟器时显示CPU不支持虚拟化—解决方法:惠普主机开启VT虚拟化CPU
  10. 怎么实现角色权限的分配_在 Go 语言中使用 casbin 实现基于角色的 HTTP 权限控制...
  11. loadrunner 测试 html5,Loadrunner压力测试工具使用教程
  12. 【Web:Bootstrap框架】简单实现理解
  13. ROS中的常用组件---launch启动文件
  14. nagios监控安装配置
  15. Python数据分析实战之北京二手房房价分析
  16. 电商项目:高仿小米商城(API文档)
  17. 全院级pacs系统中前置服务器,PACS系统性能优化的实施与体会——蒋昆 李哲 赵海涛...
  18. Android中,长度单位详解(dp、sp、px、in、pt、mm)具体解释与换算(1)
  19. 飞秒激光脉冲的产生过程
  20. 2015年度社区之星 放榜啦

热门文章

  1. Android LayoutInflate深度解析
  2. mysql5.7增加ssl认证(1)
  3. 清空Redis集群数据工具
  4. 简明 Vim 练级攻略(转自酷壳)
  5. 简述php的特点,PHP语言有哪些优势和特点(三)
  6. GRBL四:GRBL框架解析
  7. [Linux]线程概念_线程控制(线程与进程的区别与联系 | 线程创建 | 线程等待 | 线程终止 | 线程分离 | LWP)
  8. 数据透视表的发明历史
  9. halide编程技术指南(连载一)
  10. 【资源】OpenCV3编程入门_毛星云