阿里云Clouder认证

六、基于阿里云数加构建企业级数据分析平台

1. 课程目标

(1) 了解数据分析的步骤和目的
(2) 熟悉数据分析平台搭建的组成部分
(3) 掌握阿里云数加不同产品及其使用场景
(4) 灵活使用数加的不同产品搭建数据分析平台(5)目录- 数据分析介绍- 阿里云数加介绍- 常用的数加产品- 任务:搭建企业级的数据分析平台
复制代码

2. 数据分析介绍

(1)数据分析的基本介绍

  • 数据分析是基于商业目的,有目的的进行收集、整理、加工和分析数据,提炼有价值信息的过程。
  • <1>.明确目的:
    • 数据对象是?
    • 商业目的是?
    • 解决业务问题?
  • <2>.数据收集:
    • 确定数据范围
    • 获取目标数据
    • 整合相关数据
  • <3>.数据处理:
    • 处理缺失数据
    • 清洗不一致数据
    • 关联、汇总数据
  • <4>.数据分析:
    • 基本数据分析
    • 数据探索
    • 复杂数据分析
  • <5>.数据展现:
    • 整理组合信息
    • 整合信息、观点
    • 图表展现信息
  • <6>.分析报告:
    • 简单可靠
    • 清晰明了
    • 逻辑性强

(2)数据分析的目的

  • 获得用户
  • 留住用户
  • 增加收益
  • 市场营销
  • 产品运营
  • 客户服务
  • 业务优化
  • 流程改进
  • 发现机会

(3)数据分析平台的组成部分

  • 分析需求
  • 确认数据源
  • ETL处理(数据的抽取、转换、加载)
  • 数据整合/汇总
  • 数据建模
  • 数据分析/展现

(4)数据分析平台对应的场景

  • 源数据:进行数据的获取
  • 数据仓库:数据存储、组织;数据计算;数据建模
  • 数据应用:数据分析

3. 阿里云数加介绍

(1)“数加”是什么

  • 数加是阿里云大数据的品牌名,旗下包含一系列的大数据产品及服务,是上万名工程师实战检验过的一站式大数据平台。
  • “数加”是阿里云大数据的核心能力

4. 常用的数加产品

(1)数据分析平台常用的数加产品

  • **Maxcompute:**快速、完全托管的TB/PB级数据仓库解决方案。提供了针对海量数据存储、运算的能力。
  • **DataIDE:**基于Maxcompute提供海量数据的离线加工分析、展现、数据挖掘的能力,一站式开发、运维工具。
  • **QuickBI:**提供海量数据在线分析服务,支持拖拽式操作,可完成数据分析、业务数据探查、报表制作等工作。

(2)MaxCompute介绍

  • 大数据计算服务(MaxCompute,原ODPS)由阿里云自主研发,提供针对TB/PB级数据、离线式实时性要求不高分布式处理能力,应用于数据分析、挖掘、商业智能等领域。阿里巴巴的数据业务都运行在ODPS上。
  • **分布式:**采用分布式集群架构、跨集群技术突破、机群规模可以根据需要灵活扩展
  • **安全:**自动存储容错机制、所有计算在沙箱中运行、保障数据高安全性、高可靠性
  • **易用:**准API的方式提供服务、高并发高吞吐量数后上传下载、全面支持基于SQL的数据处理
  • **管理与授权:**支持多用户管理协同分析数据、支特多种方式对用户权限管理、配置灵活的数据访问控制策略
  • MaxCompute的应用特点:
    • **海量运算触手可得:**根据数据规模自动调整集群存储和计算能力,最大化发挥数据的价值。
    • 服务“开箱即用”:又需简单的几步操作,就可以上传数据、分析数据并得到分析结果。
    • **数据存储安全可靠:**二重备份、读写鉴权、应用沙箱、系统沙箱等多层次安全机制。
    • **多用户协作:**保障数据安全的前提下最大化工作效率。
    • **按量付费:**根据实际使用收费,最大化降低数据使用成本。

(3)DataIDE介绍

  • 阿里云大数据开发套件(Data IDE)提供了一个高效、安全的离线数据开发环境。
  • DataIDE的应用特点:
    • **基于Max Compute:**一套基于Max Compute(原ODPS)的数据开发、数据管理工具。
    • **一站式数据开发:**提供数框同步、数加工、一健发布、调度引擎等一站式大数据开发服务。
    • **清晰可见的血缘:**基于统一的元数据服务提供数据资源管理视图、可视化的数据血缘分析,清晰展现数据表的输入与输出,方便追溯其处理过程。
    • **可视化开发界面:**面向数据开发者、数据运组人员,项日管理者,提供了可视化的开发界面。

(4)QuickBI介绍

  • QuickBI(商务/商业智能)提供海量数据实时在线分析,拖拽式操作、丰富的可视化效果,可以帮助轻松自如地完成数据分析、业务数据探查。它不止是业务人员看数据的工具,更是数据化运营的助推器,解决大数据应用“最后一公里”的问题,实现人人都是数据分析师。
  • QuickBI的应用特点:
    • **多:**支持多种类型数据源、支持多种可视化组件
    • **快:**海量数据的实时分析、提供智能的一键加速
    • **好:**灵活的报表集成方案、严密的安全权限管理
    • **省:**门槛低易上手省时间、云计算费用低省成本

(5)常见的应用场景:从业务系统到数据分析

  • 云数据库RDS搭配大数据计算服务MaxCompute,实现对大数据的分布式分析处理,并通过QuickBI以报表的形式将结果展现出来,适用于商业分析、挖掘等大数据处理场景。

转载于:https://juejin.im/post/5c73511de51d4537f625d446

阿里云大数据认证——基于阿里云数加构建企业级数据分析平台-课堂笔记相关推荐

  1. 基于阿里云数加构建企业级数据分析平台

    基于阿里云数加构建企业级数据分析平台 数据分析是基于商业目的,有目的的进行收集.整理.加工和分析数据,提炼有价值信息的过程 ![在这里插入图片描述](https://img-blog.csdnimg. ...

  2. Clouder—构建企业级数据分析平台-墨羽@袋鼠云

    Clouder-构建企业级数据分析平台 墨羽@袋鼠云 一.引言 这是在阿里云大学线下开班的clouder沙箱实验,本人小白,第一次接触阿里云的数加产品. 小白到什么程度,我是一个运营! 运营!! 运营 ...

  3. 阿里云大数据认证——MOOC网站日志分析-课堂笔记

    阿里云Clouder认证 四.MOOC网站日志分析 1. 课程目标 (1) 了解网站日志分析的意义 (2) 了解网站日志如何搜集 (3) 使用编程语言对日志数据进行处理 (4) 使用编MaxCompu ...

  4. 阿里云大数据认证——机器学习PAI实现精细化营销-课堂笔记

    阿里云Clouder认证 三.机器学习PAI实现精细化营销 1. 课程目标 (1) 了解精细化营销的概念和适用场景 (2) 了解机器学习如何实现精细化营销 (3) 掌握利用PAI实现精细化营销 (4) ...

  5. 阿里云大数据认证——使用DataV制作实时销售数据可视化大屏-课堂笔记

    原文链接:https://juejin.im/post/5c735004e51d45454b62dad5 阿里云Clouder认证 五.使用DataV制作实时销售数据可视化大屏 1. 课程目标 (1) ...

  6. 阿里云大数据——搭建企业级数据分析平台

    目录 1.数据分析介绍 1.1数据分析基本介绍 1.2数据分析目的 1.3数据分析平台组成部分 1.4数据分析平台对应的场景 2.阿里云数加介绍 2.1数加是什么? 2.2"数加" ...

  7. 阿里云大数据ACA总结

    1. 概述 数加是指阿里云大数据平台,包含了一系列的大数据产品及服务. 计算引擎(三类):离线计算.流式计算.在线计算 2. MaxCompute 由阿里云自主研发,提供针对TB/PB级数据.实时性要 ...

  8. 阿里云大数据ACA考点总结

    根据考题自己整理的知识点 1. 概述 数加是指阿里云大数据平台,包含了一系列的大数据产品及服务. 计算引擎(三类):离线计算.流式计算.在线计算 2. MaxCompute 由阿里云自主研发,提供针对 ...

  9. 阿里云大数据型实例规格族d1配置性能详解

    阿里云大数据型实例规格族d1配置性能CPU.内存.适用场景.d1实例规格族,InstanceTypes分享大数据型实例规格族d1实例详解: 大数据型实例规格族d1配置特性 I/O优化实例 仅支持SSD ...

最新文章

  1. ​MySQL服务器调优思路图
  2. 【ajax+php】动态展示4级单位(省、市、县、镇)
  3. 阿里云POLARDB荣膺2019中国数据库年度最佳创新产品
  4. C++(4)--初识变量、数据类型
  5. Link方式安装eclipse插件
  6. 分享一个debian系统优秀的镜像源
  7. 慕课python七月_【慕课有约】七月老师:关于小程序的那些事
  8. paip.提升中文分词准确度---新词识别
  9. Jquery-微博发布案例
  10. 博睿APM获《金融电子化》2021年金融业新技术应用创新突出贡献奖
  11. Java调用百度/高德地图API实现根据经纬度查地名
  12. 什么是SVG及使用方式
  13. 千杯酒中检测那一杯毒酒的问题及思考
  14. poj3426(网络流)
  15. 目标检测-twostage
  16. 论文翻译阅读——Facial Emotion RecognitionUsing Deep Learning:Review And Insights
  17. 全国青少年软件编程等级考试--scratch-三级-真题-五彩糖葫芦
  18. 汇编实验1 两个多位十进制数相加的实验
  19. 35了,我该何去何从
  20. 【N32G457 】基于RT-Thread和N32G457的CAN网关

热门文章

  1. unity3d 摄像机跟随角色时被物体遮挡解决方案
  2. 太激动!Android修改全局字体样式,替换整个APP字体
  3. 利用多 GPU 加速深度学习模型训练
  4. 好用的android 串口驱动
  5. 2021 回头看看这一年
  6. JavaScript专题(二):深入理解iframe
  7. 学习英文-学以致用【场景:吃饭与家务】
  8. 做好淘宝客单页面的几个技巧和方法
  9. new File()获取图片地址
  10. Spring?Spring?Spring到底是啥?