大数据概论

  • 一、 大数据的概念
  • 二、大数据的特点(4V)
  • 三、 大数据的应用场景
  • 四、大数据的发展前景
  • 五、大数据部门的业务流程/组织结构

一、 大数据的概念

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
主要解决海量数据的存储和海量数据的分析计算问题。

二、大数据的特点(4V)

  1. 大量(Volume)
    数据量大
    截至目前,人类生产的所有印刷材料的数据量约200PB,而历史上人类总共说过的话的数据量大约是5EB。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。
  2. 高速(Velocity)
    数据产生的速度快
    这是大数据区分与传统数据挖掘的最显著特征,根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。
  3. 多样(Variety)
    数据多种多样
    数据类型的多样性也让数据分为结构化和非结构化数据。相对与以往便于存储的以数据库/文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片地理位置信息等。多类型的数据对数据的处理能力提出了更高的要求。
  4. 低价值密度(Value)
    数据价值密度低
    价值密度的高低与数据总量的大小成反比。如何对有价值数据“提纯”成为目前大数据背景下待解决的难题。

三、 大数据的应用场景

  1. 物流仓储:大数据分析系统助力商家精细化运营、提升销量、节约成本。
  2. 零售:分析用户消费习惯,为用户购买提供方便,从而提升商品销量。
  3. 旅游:深度结合大数据能力与旅游行业需求,共建旅游产业智慧管理、智慧服务和智慧营销。
  4. 推荐:给用户推荐可能喜欢的商品。
  5. 保险:海量数据挖掘及风险预测,助力保险行业精准营销,提升精细化定价能力。
  6. 金融:多维度体现用户特征,帮助金融机构推荐优质客户,防范欺诈风险。
  7. 房产:大数据全面助力房地产行业,打造精准投策与营销,选出更合适的地,建造更合适的楼,卖给更合适的人。
  8. 人工智能

四、大数据的发展前景

  1. 党的十八大提出 “实施国家大数据战略” ,国务院印发《促进大数据发展行动纲要》,大数据技术和应用处于创新突破期,国内市场需求处于爆发期,我国大数据产业面临重要的发展机遇。
  2. 党的十九大提出 “推动互联网、大数据、人工智能和实体经济深度融合”
  3. 国际数据公司IDC预测,到2020年,企业基于大数据计算分析平台的支出将突破5000亿美元。目前我国大数据人才约46万,人才缺口达150万。
  4. 2017年,北京大学、中国人民大学、北京邮电大学等25所高校成功申请开设大数据课程。
  5. 大数据属于高新技术,大牛少,升职竞争小。
  6. 大数据开发工程师的平均薪水已达到15k-40k,且目前还保持着强劲发展势头。

注:数据来源2018年-2019年

五、大数据部门的业务流程/组织结构

  1. 业务流程图
  2. 组织结构图

大数据学习笔记—大数据概论相关推荐

  1. 大数据学习笔记(一)

    大数据学习笔记(一)大数据概论 大数据是什么 1大数据概念:(big data ) : 指无法在一定时间内用常规软件工具进行捕捉.管理和处理数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和 ...

  2. 大数据学习笔记:Hadoop生态系统

    文章目录 一.Hadoop是什么 二.Hadoop生态系统图 三.Hadoop生态圈常用组件 (一)Hadoop (二)HDFS (三)MapReduce (四)Hive (五)Hbase (六)Zo ...

  3. Hadoop 大数据学习笔记

    Hadoop 大数据学习笔记1 大数据部门组织架构 Hadoop Hadoop是什么 Hadoop的优势 Hadoop的组成 HDFS架构 YARN架构 MapReduce 大数据技术生态体系![在这 ...

  4. 大数据学习笔记第1课 Hadoop基础理论与集群搭建

    大数据学习笔记第1课 Hadoop基础理论与集群搭建 一.环境准备 二.下载JDK 三.安装JDK 四.下载hadoop 五.安装hadoop集群 六.打通3台服务器的免密登录 七.hadoop集群配 ...

  5. 学习笔记之数据可视化(二)—— 页面布局(下)

    续上一章 2.7 地图区域(.map) 2.7.1 实现步骤: 2.8 用户统计模块 2.8.1 布局: 2.8.2 柱状图 2.9 订单模块 2.9.1 订单区域布局 2.9.2 订单区域(orde ...

  6. 学习笔记之数据可视化(二)——页面布局(上)

    ~续上一章 2. 项目页面布局 2.1 基础布局 2.1.1 PC端屏幕宽度适配设置 2.1.2 主体容器viewport背景图片 2.1.3 HTML结构 2.1.4 css样式代码 2.2 边框图 ...

  7. 使用Excel分析数据学习笔记之 二分类与混淆矩阵

    使用Excel分析数据学习笔记之 二分类与混淆矩阵 混淆矩阵的构成: e.g.1:Bombers and seagulls 案例背景 混淆矩阵 如何根据混淆矩阵得到ROC曲线? 如何设定最佳阈值(op ...

  8. OpenCV学习笔记大集锦

    转载自: OpenCV学习笔记大集锦 – 视觉机器人 http://www.cvrobot.net/collect-opencv-resource-learn-study-note-chinese/ ...

  9. mysql没法修改数据_MySQL学习笔记之数据的增、删、改实现方法

    本文实例讲述了MySQL学习笔记之数据的增.删.改实现方法.分享给大家供大家参考,具体如下: 一.增加数据 插入代码格式: insert into 表明 [列名-] values (值-) creat ...

最新文章

  1. Vue-路由模式 hash 和 history
  2. 无密码身份验证:安全、简单且部署快速
  3. 深入理解React(一)JSX与虚拟DOM
  4. 测试nb信号的软件_NB-IoT和LORA,谁才是真正的低功耗?从数据看真相
  5. python和对象复习_面向对象阶段复习
  6. 全面永久退出!又一巨头被逼上绝路!
  7. Jsoup解析body片段
  8. 漂亮简洁的宇宙人404单页html源码
  9. “3D几何与视觉技术”全球在线研讨会第九期~识别3D中的物体和场景
  10. SQL Server 漏洞评估工具
  11. 批处理中的使用问题记录
  12. js闭包,这个算是比较通俗的了(转)
  13. 大一c语言作业操作题库,c语言题目(大一c语言编程题库)
  14. C语言入门教程,C语言学习教程(非常详细)
  15. 【VR】详解 Facebook Oculus团队的手势追踪系统——MegaTrack
  16. 学习笔记——spring5概念和原理
  17. vue.js毕业设计,基于vue.js前后端分离教室预约系统(H5移动项目) 开题报告
  18. 服务端基础设施开发----整合thumbnailator编写图片插件
  19. 安卓11之adb命令清除锁屏密码
  20. 2021首届-西部云安全峰会来了!9月26日西安见

热门文章

  1. uni-app自定义页面导航内容
  2. 软件测试相关简要记录
  3. 学籍管理系统c语言,c语言学籍信息管理系统设计
  4. cisco pkt 路由器配置基础及接口配置 路由协议与交换技术
  5. Win10运行程序提示不受信任的解决方法【系统天地】
  6. 仿ios圆盘转动——wheelview,可联动
  7. 《Care Bears 爱心熊》人物化身来到 The Sandbox 元宇宙!
  8. 第二章 为Encog获取数据
  9. Warzone: 3 (Exogen) vulnhub walkthrough
  10. 三维重建 医学图像的可视化 PyQt Python VTK 四视图(横断面,冠状面,矢状面,3D)