阿里云大数据认证——基于阿里云数加构建企业级数据分析平台-课堂笔记
阿里云Clouder认证
六、基于阿里云数加构建企业级数据分析平台
1. 课程目标
(1) 了解数据分析的步骤和目的
(2) 熟悉数据分析平台搭建的组成部分
(3) 掌握阿里云数加不同产品及其使用场景
(4) 灵活使用数加的不同产品搭建数据分析平台(5)目录- 数据分析介绍- 阿里云数加介绍- 常用的数加产品- 任务:搭建企业级的数据分析平台
复制代码
2. 数据分析介绍
(1)数据分析的基本介绍
- 数据分析是基于商业目的,有目的的进行收集、整理、加工和分析数据,提炼有价值信息的过程。
- <1>.明确目的:
- 数据对象是?
- 商业目的是?
- 解决业务问题?
- <2>.数据收集:
- 确定数据范围
- 获取目标数据
- 整合相关数据
- <3>.数据处理:
- 处理缺失数据
- 清洗不一致数据
- 关联、汇总数据
- <4>.数据分析:
- 基本数据分析
- 数据探索
- 复杂数据分析
- <5>.数据展现:
- 整理组合信息
- 整合信息、观点
- 图表展现信息
- <6>.分析报告:
- 简单可靠
- 清晰明了
- 逻辑性强
(2)数据分析的目的
- 获得用户
- 留住用户
- 增加收益
- 市场营销
- 产品运营
- 客户服务
- 业务优化
- 流程改进
- 发现机会
(3)数据分析平台的组成部分
- 分析需求
- 确认数据源
- ETL处理(数据的抽取、转换、加载)
- 数据整合/汇总
- 数据建模
- 数据分析/展现
(4)数据分析平台对应的场景
- 源数据:进行数据的获取
- 数据仓库:数据存储、组织;数据计算;数据建模
- 数据应用:数据分析
3. 阿里云数加介绍
(1)“数加”是什么
- 数加是阿里云大数据的品牌名,旗下包含一系列的大数据产品及服务,是上万名工程师实战检验过的一站式大数据平台。
- “数加”是阿里云大数据的核心能力
4. 常用的数加产品
(1)数据分析平台常用的数加产品
- **Maxcompute:**快速、完全托管的TB/PB级数据仓库解决方案。提供了针对海量数据存储、运算的能力。
- **DataIDE:**基于Maxcompute提供海量数据的离线加工分析、展现、数据挖掘的能力,一站式开发、运维工具。
- **QuickBI:**提供海量数据在线分析服务,支持拖拽式操作,可完成数据分析、业务数据探查、报表制作等工作。
(2)MaxCompute介绍
- 大数据计算服务(MaxCompute,原ODPS)由阿里云自主研发,提供针对TB/PB级数据、离线式实时性要求不高的分布式处理能力,应用于数据分析、挖掘、商业智能等领域。阿里巴巴的数据业务都运行在ODPS上。
- **分布式:**采用分布式集群架构、跨集群技术突破、机群规模可以根据需要灵活扩展
- **安全:**自动存储容错机制、所有计算在沙箱中运行、保障数据高安全性、高可靠性
- **易用:**准API的方式提供服务、高并发高吞吐量数后上传下载、全面支持基于SQL的数据处理
- **管理与授权:**支持多用户管理协同分析数据、支特多种方式对用户权限管理、配置灵活的数据访问控制策略
- MaxCompute的应用特点:
- **海量运算触手可得:**根据数据规模自动调整集群存储和计算能力,最大化发挥数据的价值。
- 服务“开箱即用”:又需简单的几步操作,就可以上传数据、分析数据并得到分析结果。
- **数据存储安全可靠:**二重备份、读写鉴权、应用沙箱、系统沙箱等多层次安全机制。
- **多用户协作:**保障数据安全的前提下最大化工作效率。
- **按量付费:**根据实际使用收费,最大化降低数据使用成本。
(3)DataIDE介绍
- 阿里云大数据开发套件(Data IDE)提供了一个高效、安全的离线数据开发环境。
- DataIDE的应用特点:
- **基于Max Compute:**一套基于Max Compute(原ODPS)的数据开发、数据管理工具。
- **一站式数据开发:**提供数框同步、数加工、一健发布、调度引擎等一站式大数据开发服务。
- **清晰可见的血缘:**基于统一的元数据服务提供数据资源管理视图、可视化的数据血缘分析,清晰展现数据表的输入与输出,方便追溯其处理过程。
- **可视化开发界面:**面向数据开发者、数据运组人员,项日管理者,提供了可视化的开发界面。
(4)QuickBI介绍
- QuickBI(商务/商业智能)提供海量数据实时在线分析,拖拽式操作、丰富的可视化效果,可以帮助轻松自如地完成数据分析、业务数据探查。它不止是业务人员看数据的工具,更是数据化运营的助推器,解决大数据应用“最后一公里”的问题,实现人人都是数据分析师。
- QuickBI的应用特点:
- **多:**支持多种类型数据源、支持多种可视化组件
- **快:**海量数据的实时分析、提供智能的一键加速
- **好:**灵活的报表集成方案、严密的安全权限管理
- **省:**门槛低易上手省时间、云计算费用低省成本
(5)常见的应用场景:从业务系统到数据分析
- 云数据库RDS搭配大数据计算服务MaxCompute,实现对大数据的分布式分析处理,并通过QuickBI以报表的形式将结果展现出来,适用于商业分析、挖掘等大数据处理场景。
转载于:https://juejin.im/post/5c73511de51d4537f625d446
阿里云大数据认证——基于阿里云数加构建企业级数据分析平台-课堂笔记相关推荐
- 基于阿里云数加构建企业级数据分析平台
基于阿里云数加构建企业级数据分析平台 数据分析是基于商业目的,有目的的进行收集.整理.加工和分析数据,提炼有价值信息的过程 ![在这里插入图片描述](https://img-blog.csdnimg. ...
- Clouder—构建企业级数据分析平台-墨羽@袋鼠云
Clouder-构建企业级数据分析平台 墨羽@袋鼠云 一.引言 这是在阿里云大学线下开班的clouder沙箱实验,本人小白,第一次接触阿里云的数加产品. 小白到什么程度,我是一个运营! 运营!! 运营 ...
- 阿里云大数据认证——MOOC网站日志分析-课堂笔记
阿里云Clouder认证 四.MOOC网站日志分析 1. 课程目标 (1) 了解网站日志分析的意义 (2) 了解网站日志如何搜集 (3) 使用编程语言对日志数据进行处理 (4) 使用编MaxCompu ...
- 阿里云大数据认证——机器学习PAI实现精细化营销-课堂笔记
阿里云Clouder认证 三.机器学习PAI实现精细化营销 1. 课程目标 (1) 了解精细化营销的概念和适用场景 (2) 了解机器学习如何实现精细化营销 (3) 掌握利用PAI实现精细化营销 (4) ...
- 阿里云大数据认证——使用DataV制作实时销售数据可视化大屏-课堂笔记
原文链接:https://juejin.im/post/5c735004e51d45454b62dad5 阿里云Clouder认证 五.使用DataV制作实时销售数据可视化大屏 1. 课程目标 (1) ...
- 阿里云大数据——搭建企业级数据分析平台
目录 1.数据分析介绍 1.1数据分析基本介绍 1.2数据分析目的 1.3数据分析平台组成部分 1.4数据分析平台对应的场景 2.阿里云数加介绍 2.1数加是什么? 2.2"数加" ...
- 阿里云大数据ACA总结
1. 概述 数加是指阿里云大数据平台,包含了一系列的大数据产品及服务. 计算引擎(三类):离线计算.流式计算.在线计算 2. MaxCompute 由阿里云自主研发,提供针对TB/PB级数据.实时性要 ...
- 阿里云大数据ACA考点总结
根据考题自己整理的知识点 1. 概述 数加是指阿里云大数据平台,包含了一系列的大数据产品及服务. 计算引擎(三类):离线计算.流式计算.在线计算 2. MaxCompute 由阿里云自主研发,提供针对 ...
- 阿里云大数据型实例规格族d1配置性能详解
阿里云大数据型实例规格族d1配置性能CPU.内存.适用场景.d1实例规格族,InstanceTypes分享大数据型实例规格族d1实例详解: 大数据型实例规格族d1配置特性 I/O优化实例 仅支持SSD ...
最新文章
- ​MySQL服务器调优思路图
- 【ajax+php】动态展示4级单位(省、市、县、镇)
- 阿里云POLARDB荣膺2019中国数据库年度最佳创新产品
- C++(4)--初识变量、数据类型
- Link方式安装eclipse插件
- 分享一个debian系统优秀的镜像源
- 慕课python七月_【慕课有约】七月老师:关于小程序的那些事
- paip.提升中文分词准确度---新词识别
- Jquery-微博发布案例
- 博睿APM获《金融电子化》2021年金融业新技术应用创新突出贡献奖
- Java调用百度/高德地图API实现根据经纬度查地名
- 什么是SVG及使用方式
- 千杯酒中检测那一杯毒酒的问题及思考
- poj3426(网络流)
- 目标检测-twostage
- 论文翻译阅读——Facial Emotion RecognitionUsing Deep Learning:Review And Insights
- 全国青少年软件编程等级考试--scratch-三级-真题-五彩糖葫芦
- 汇编实验1 两个多位十进制数相加的实验
- 35了,我该何去何从
- 【N32G457 】基于RT-Thread和N32G457的CAN网关