大数据计算服务(MaxCompute,原名 ODPS)是一种快速、完全托管的 GB/TB/PB 级数据仓库解决方案。MaxCompute 向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。

数据质量问题一直是大数据分析系统关注的重点,如何发现数据质量问题,提升数据质量,一直是各生产及业务系统的追求点。通过此课程,可迅速掌握发现数据质量问题的方法,解决数据质量问题。

详细了解请点击:使用MaxCompute搭建社交好友推荐系统

(通过本案例,学员可了解影响数据质量的因素,出现数据质量问题的类型,掌握通过MaxCompute(DateIDE)设计数据质量监控的方法,最终独立解决常见的数据质量监控需求。)

内容列表

数据质量基本介绍

介绍什么是数据质量,数据质量对于数据分析、应用的重要性。

数据质量影响因素

介绍可能会影响到数据质量的因素,以及这些因素分别会如何影响数据质量。

数据质量问题类型

常见的数据质量问题的类型,以及各自的特点和影响。

阿里云相关产品介绍

介绍本课程中用到的阿里云产品大数据计算服务和大数据开发套件。

阿里云相关产品基本操作演示

演示本课程中用到的阿里云产品大数据计算服务和大数据开发套件。

电商分析平台数据质量核查

介绍项目背景、项目实施流程以及其中的关键步骤和技术。

【在线实验】MaxCompute 数据质量核查

本实验通过MaxCompute对一家销售公司的经营数据进行监控,并最终输出数据质量监控报告。

适合人群

  • 大数据开发者
  • 大数据分析师

阿里云大学官网(阿里云大学 - 官方网站,云生态下的创新人才工场)

什么是 MaxCompute相关推荐

  1. MaxCompute动态更新表中某个(多个)字段的数据

    功能 MaxCompute支持了delete.update功能,但当您需要使用多个insert.update.delete对目标表进行批量操作时,需要编写多条SQL语句,然后进行多次全表扫描才能完成操 ...

  2. [MaxCompute MapReduce实践]通过简单瘦身,解决Dataworks 10M文件限制问题

    用户在DataWorks上执行MapReduce作业的时候,文件大于10M的JAR和资源文件不能上传到Dataworks,导致无法使用调度去定期执行MapReduce作业. 解决方案: 第一步:大于1 ...

  3. 阿里云大数据计算服务MaxCompute(下篇)

    关于阿里云大数据计算服务MaxCompute的详细内容: 阿里云大数据计算服务MaxCompute使用教程 (MaxCompute(原ODPS)是一项大数据计算服务,它能提供快速.完全托管的PB级数据 ...

  4. 王坚十年前的坚持,才有了今天世界顶级大数据计算平台MaxCompute...

    如果说十年前,王坚创立阿里云让云计算在国内得到了普及,那么王坚带领团队自主研发的大数据计算平台MaxCompute则推动大数据技术向前跨越了一大步. 数据是企业的核心资产,但十年前阿里巴巴的算力已经无 ...

  5. MaxCompute studio与权限那些事儿

    背景知识 MaxCompute拥有一套强大的安全体系,来保护项目空间里的数据安全.用户在使用MaxCompute时,应理解权限的一些基本概念: 权限可分解为三要素,即主体(用户账号或角色),客体(表/ ...

  6. 大数据处理也要安全--关于MaxCompute的安全科普

    [TOC] 1.企业大数据处理现状 当今社会数据收集手段不断丰富,行业数据大量积累,数据规模已增长到了传统软件行业无法承载的海量数据(百GB.TB乃至PB)级别.基于此,阿里云推出有了一套快速.完全托 ...

  7. 重磅!MaxCompute助力阿里开源自研语音识别模型DFSMN,准确率高达96.04%

    阿里开源语音识别模型DFSMN 在近期举行的云栖大会武汉峰会上,装有DFSMN语音识别模型的"AI收银员"在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内 ...

  8. MaxCompute助力OSS支持EB级计算力

    一. MaxCompute是什么? 你的OSS数据是否作堆积在一旁沉睡已久,存储成本变为企业负担?你是否想唤醒沉睡的数据,驱动你的业务前行?MaxCompute可以帮助你高效且低成本的解决这些问题,通 ...

  9. MaxCompute Studio使用心得系列7—作业对比

    2019独角兽企业重金招聘Python工程师标准>>> 在数据开发过程中,我们通常需要将两个作业进行对比从而定位作业运行性能或者结果有差异的问题,但是对比作业时需要同时打开两个stu ...

  10. 王坚十年前的坚持,才有了今天世界顶级大数据计算平台MaxCompute

    2019独角兽企业重金招聘Python工程师标准>>> 如果说十年前,王坚创立阿里云让云计算在国内得到了普及,那么王坚带领团队自主研发的大数据计算平台MaxCompute则推动大数据 ...

最新文章

  1. python中intvar_在Python线程中使用Intvar/DoubleVar是否安全?
  2. java 最小化 api_Java的API设计实践
  3. MultiByteToWideChar和WideCharToMultiByte用法详解
  4. ajax常见问题汇总(二)
  5. 如何在freemarker寻找元素_如何让你的网站ui设计更加优秀
  6. maven插件之build-helper-maven-plugin
  7. linux内核模块编写,Linux内核模块编程
  8. restful风格的增删改查
  9. MATLAB安装机器人学工具箱
  10. ssm框架使用resultful_SSM框架整合完整案例
  11. 有一个写代码很厉害的老板是怎样一种体验?
  12. 智能云如何加速产业智能化?百度CTO王海峰2020全球智博会擘画蓝图
  13. xp 与 windows 7 共享收藏夹
  14. CSS3 transform对fixed元素造成的影响笔记
  15. 求解-----组合优化问题
  16. 阿里云服务器防止ddos被攻击
  17. 2022年上半年 全球值得关注的10项新药临床试验
  18. # Conda environment for TensorFlow and ROOT(HEP) in Mac (M1)
  19. 远程桌面瘦客户机的优点和缺点
  20. 泡泡博客社区源码,简洁,轻便php源码

热门文章

  1. MAC下的Sublime Text关闭自动更新提示,关闭更新检查,适用于Sublime 3和Sublime 4
  2. 如何实现根据照片获取地理位置及如何防御照片泄漏地理位置
  3. Unity2021接入讯飞语音听写(Android)
  4. 四阶及以上魔方公式技巧大全
  5. Vue3 第二十二篇:双向绑定样式style
  6. oracle hm,Oracle 11g 新特性 – HM(Hang Manager)简介
  7. AD10 PCB文件统一设置字体大小(默认字体大小)
  8. mysql成绩表_mysql--学生课程成绩表
  9. Overleaf在线版常用代码
  10. 2208988800一个奇怪的数字