大数据学习笔记—大数据概论
大数据概论
- 一、 大数据的概念
- 二、大数据的特点(4V)
- 三、 大数据的应用场景
- 四、大数据的发展前景
- 五、大数据部门的业务流程/组织结构
一、 大数据的概念
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
主要解决:海量数据的存储和海量数据的分析计算问题。
二、大数据的特点(4V)
- 大量(Volume)
数据量大
截至目前,人类生产的所有印刷材料的数据量约200PB,而历史上人类总共说过的话的数据量大约是5EB。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。 - 高速(Velocity)
数据产生的速度快
这是大数据区分与传统数据挖掘的最显著特征,根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。 - 多样(Variety)
数据多种多样
数据类型的多样性也让数据分为结构化和非结构化数据。相对与以往便于存储的以数据库/文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片地理位置信息等。多类型的数据对数据的处理能力提出了更高的要求。 - 低价值密度(Value)
数据价值密度低
价值密度的高低与数据总量的大小成反比。如何对有价值数据“提纯”成为目前大数据背景下待解决的难题。
三、 大数据的应用场景
- 物流仓储:大数据分析系统助力商家精细化运营、提升销量、节约成本。
- 零售:分析用户消费习惯,为用户购买提供方便,从而提升商品销量。
- 旅游:深度结合大数据能力与旅游行业需求,共建旅游产业智慧管理、智慧服务和智慧营销。
- 推荐:给用户推荐可能喜欢的商品。
- 保险:海量数据挖掘及风险预测,助力保险行业精准营销,提升精细化定价能力。
- 金融:多维度体现用户特征,帮助金融机构推荐优质客户,防范欺诈风险。
- 房产:大数据全面助力房地产行业,打造精准投策与营销,选出更合适的地,建造更合适的楼,卖给更合适的人。
- 人工智能
四、大数据的发展前景
- 党的十八大提出 “实施国家大数据战略” ,国务院印发《促进大数据发展行动纲要》,大数据技术和应用处于创新突破期,国内市场需求处于爆发期,我国大数据产业面临重要的发展机遇。
- 党的十九大提出 “推动互联网、大数据、人工智能和实体经济深度融合” 。
- 国际数据公司IDC预测,到2020年,企业基于大数据计算分析平台的支出将突破5000亿美元。目前我国大数据人才约46万,人才缺口达150万。
- 2017年,北京大学、中国人民大学、北京邮电大学等25所高校成功申请开设大数据课程。
- 大数据属于高新技术,大牛少,升职竞争小。
- 大数据开发工程师的平均薪水已达到15k-40k,且目前还保持着强劲发展势头。
注:数据来源2018年-2019年
五、大数据部门的业务流程/组织结构
- 业务流程图
- 组织结构图
大数据学习笔记—大数据概论相关推荐
- 大数据学习笔记(一)
大数据学习笔记(一)大数据概论 大数据是什么 1大数据概念:(big data ) : 指无法在一定时间内用常规软件工具进行捕捉.管理和处理数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和 ...
- 大数据学习笔记:Hadoop生态系统
文章目录 一.Hadoop是什么 二.Hadoop生态系统图 三.Hadoop生态圈常用组件 (一)Hadoop (二)HDFS (三)MapReduce (四)Hive (五)Hbase (六)Zo ...
- Hadoop 大数据学习笔记
Hadoop 大数据学习笔记1 大数据部门组织架构 Hadoop Hadoop是什么 Hadoop的优势 Hadoop的组成 HDFS架构 YARN架构 MapReduce 大数据技术生态体系![在这 ...
- 大数据学习笔记第1课 Hadoop基础理论与集群搭建
大数据学习笔记第1课 Hadoop基础理论与集群搭建 一.环境准备 二.下载JDK 三.安装JDK 四.下载hadoop 五.安装hadoop集群 六.打通3台服务器的免密登录 七.hadoop集群配 ...
- 学习笔记之数据可视化(二)—— 页面布局(下)
续上一章 2.7 地图区域(.map) 2.7.1 实现步骤: 2.8 用户统计模块 2.8.1 布局: 2.8.2 柱状图 2.9 订单模块 2.9.1 订单区域布局 2.9.2 订单区域(orde ...
- 学习笔记之数据可视化(二)——页面布局(上)
~续上一章 2. 项目页面布局 2.1 基础布局 2.1.1 PC端屏幕宽度适配设置 2.1.2 主体容器viewport背景图片 2.1.3 HTML结构 2.1.4 css样式代码 2.2 边框图 ...
- 使用Excel分析数据学习笔记之 二分类与混淆矩阵
使用Excel分析数据学习笔记之 二分类与混淆矩阵 混淆矩阵的构成: e.g.1:Bombers and seagulls 案例背景 混淆矩阵 如何根据混淆矩阵得到ROC曲线? 如何设定最佳阈值(op ...
- OpenCV学习笔记大集锦
转载自: OpenCV学习笔记大集锦 – 视觉机器人 http://www.cvrobot.net/collect-opencv-resource-learn-study-note-chinese/ ...
- mysql没法修改数据_MySQL学习笔记之数据的增、删、改实现方法
本文实例讲述了MySQL学习笔记之数据的增.删.改实现方法.分享给大家供大家参考,具体如下: 一.增加数据 插入代码格式: insert into 表明 [列名-] values (值-) creat ...
最新文章
- Vue-路由模式 hash 和 history
- 无密码身份验证:安全、简单且部署快速
- 深入理解React(一)JSX与虚拟DOM
- 测试nb信号的软件_NB-IoT和LORA,谁才是真正的低功耗?从数据看真相
- python和对象复习_面向对象阶段复习
- 全面永久退出!又一巨头被逼上绝路!
- Jsoup解析body片段
- 漂亮简洁的宇宙人404单页html源码
- “3D几何与视觉技术”全球在线研讨会第九期~识别3D中的物体和场景
- SQL Server 漏洞评估工具
- 批处理中的使用问题记录
- js闭包,这个算是比较通俗的了(转)
- 大一c语言作业操作题库,c语言题目(大一c语言编程题库)
- C语言入门教程,C语言学习教程(非常详细)
- 【VR】详解 Facebook Oculus团队的手势追踪系统——MegaTrack
- 学习笔记——spring5概念和原理
- vue.js毕业设计,基于vue.js前后端分离教室预约系统(H5移动项目) 开题报告
- 服务端基础设施开发----整合thumbnailator编写图片插件
- 安卓11之adb命令清除锁屏密码
- 2021首届-西部云安全峰会来了!9月26日西安见
热门文章
- uni-app自定义页面导航内容
- 软件测试相关简要记录
- 学籍管理系统c语言,c语言学籍信息管理系统设计
- cisco pkt 路由器配置基础及接口配置 路由协议与交换技术
- Win10运行程序提示不受信任的解决方法【系统天地】
- 仿ios圆盘转动——wheelview,可联动
- 《Care Bears 爱心熊》人物化身来到 The Sandbox 元宇宙!
- 第二章 为Encog获取数据
- Warzone: 3 (Exogen) vulnhub walkthrough
- 三维重建 医学图像的可视化 PyQt Python VTK 四视图(横断面,冠状面,矢状面,3D)