**黑色字体部分为考纲(截至2022年),蓝色字体部分为笔记,仅供参考

PART 1 数据分析概念与职业操守

1、数据分析概念、方法论、角色

【领会】

数据分析基本概念(数据分析、数据挖掘、大数据)

数据分析目的及其意义

数据分析方法与流程

数据分析的不同角色与职责

2、数据分析师职业道德与行为准则

【领会】

数据分析师职业道德操守

数据分析师专业行为准则

3、大数据立法、安全、隐私

【领会】

国外隐私相关法律要求(参阅《国际数据保护规则要览》)

国内大数据立法的历程和展望(参阅《中国大数据法治发展报告》)

欧盟《通用数据保护条例》(General Data Protection Regulation,简称GDPR)中企业和个人的数据使用权限

PART 2 数据结构

总体要求

理解表格结构与表结构的数据特征、理解表结构与表结构数据获取操作方法、理解表结构数据连接及汇总的逻辑、能够应用表结构连接及汇总逻辑关联多表进行汇总求值计算、能够制作ER关系图

1、表格结构数据特征

【领会】

表格结构数据概念

表格结构数据处理工具

【熟知】

表格结构数据特征

2、表格结构数据获取、引用、查询与计算

【领会】

表格结构数据获取方法

【熟知】

单元格区域的特征

【应用】

表格结构数据的引用方法

表格结构数据的查询方法

表格结构数据的常用函数

3、表结构数据特征

【熟知】

理解主键的意义

表的业务记录单位。在一个数据表中的所有非主键字段都要围绕主键展开

理解维度及度量的意义

理解缺失值

表结构数据特征

表结构数据与表格结构数据差异

4、表结构数据获取、加工与使用

【领会】

表结构数据获取渠道及方法

【熟知】

表结构数据连接逻辑

表结构数据汇总逻辑

ETL作用、特征

【应用】

应用E-R图

计算两表连接汇总值

应用ETL获取及处理数据

PART 3 数据库应用

总体要求

理解数据库的基本概念、理解DDL及DML语言、能够根据业务需求及数据特征使用查询语言从数据库中获取准确、完整的数据信息、能够应用数据库函数进行数据处理及计算

1、数据库相关概念

【领会】

数据库分类

SQL语言的功能

【熟知】

数据库、数据库管理系统与SQL之间的关系

2、DDL数据定义语言

【领会】

数据库基本结构

【熟知】

数据类型

约束条件

数据库三大范式

  1. 数据表中的每一列(每个字段)必须是不可拆分的最小单元
  2. 表中所有的列都必须依赖于主键
  3. 任何非主属性不依赖于其他非主属性

五大约束

  1. 主键约束
  2. 非空约束
  3. 唯一约束
  4. 外键约束
  5. 默认值约束

数据完整性

  • 实体完整性

    • 关系中的主属性值不能为Null且不能有相同值
  • 域完整性
    • 字段的值域、字段的类型及字段的有效规则等约束
  • 参照完整性
    • 关系中的外键必须是另一个关系的主键有效值,或者是NULL
  • 可以通过四种方式来实现
    • 约束
    • 规则
    • 默认值
    • 触发器
  • 完整性约束包括
    • 主键约束(PRIMARY KEY)
    • 外键约束(FOREIGN KEY)
    • 唯一约束(UNIQUE)
    • 非空约束(NOT NULL)
    • 检查约束(CHECK)

【应用】

创建、选用、删除数据库

create database xxxx;

use xxxx;

drop database xxxx;

创建、修改、删除表

create table yyyy;

alter table yyyy add|modify|drop|rename column

drop table yyyy;

3、DML数据操作语言

【领会】

添加数据的步骤

【熟知】

添加、修改、删除数据的语法规则

【应用】

添加数据

insert into table (columns) values (v1s)

修改数据

update table set column = value where …

删除数据

delete from table where …

4、单表查询

【领会】

虚拟结果集

【熟知】

运算符

SQL语句的书写顺序和执行逻辑

【应用】

基本查询:去重查询、设置别名

distinct

as

条件查询:多条件查询、空值查询、模糊查询

where

is null

like

分组查询:分组聚合、分组后筛选

group by … having

查询结果排序、限制查询结果数量

order by

limit

row_number()

5、多表查询

from a,b,c

【领会】

对应关系:一对一、一对多、多对多

连接方式:内连接、左连接、右连接

连接条件:等值连接、不等值连接

【熟知】

连接查询的逻辑和联合查询规则

【应用】

连接查询:内连接、左连接、右连接

inner join

left join

right join

联合查询:去重、不去重

union/union all

6、子查询

【领会】

子查询分类

【熟知】

子查询位置、子查询操作符

【应用】

子查询语法规则

子查询优化

7、数据库函数

【领会】

计算字段

【熟知】

函数功能及参数

【应用】

数学函数、字符串函数、日期时间函数、分组合并函数、逻辑函数

PART 4 描述性统计分析

总体要求

理解统计基本概念、理解描述性统计相关知识内容、理解描述性统计图表定义及适用场景、能够应用描述性统计知识描述及探索业务问题

1、统计基本概念

【熟知】

统计学含义及其应用

统计学的基本概念:数据、总体、样本、参数、变量

参数估计

  1. 估计量:用于估计总体参数的随机变量

    1. 如样本均值,样本比例,样本方差
    2. 例如:样本均值就是总体均值的一个估计量
    3. 参数用θ表示,估计量用表示
    4. 估计值:估计参数时计算出来的统计量的具体值
    5. 估计方法
      1. 点估计

        1. 矩估计法
        2. 最大似然法
        3. 顺序统计量估计法
        4. 最小二乘法
      2. 区间估计
    6. 点估计
      1. 用样本的估计量直接作为总体参数的估计值
      2. 没有给出估计值接近总体参数程度的信息
    7. 区间估计
      1. 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到
      2. 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率量度
        1. x为点估计值
        2. z为置信水平
        3. σ为标准差
        4. ±之后的值称为统计误差
      3. 置信水平
        1. 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平
      4. 影响区间宽度的因素
        1. 总体样本的离散程度
        2. 样本容量
        3. 置信水平1-σ
    8. 估计量的评价
      1. 一致性:随着样本量的增大,估计量的值越来越接近被估计的总体参数
      2. 有效性:D()标准差越小越有效
      3. 无偏性:E()=

        数据分析师CDA认证 Level Ⅰ笔记(完结)相关推荐

        1. 阿里云大数据分析师职业认证

          阿里云大数据分析师ACP认证(Alibaba Cloud Certified Professional - Data Analyst) 是阿里云大数据行业认证体系中的职业认证,同时也是一个跨平台.通用 ...

        2. 大数据分析师高级证书_大数据分析师(ACP)认证考试大纲

          阿里云行业认证:大数据分析师专业认证考试( ACP 级)大纲 阿里云大数据行业认证 - 大数据分析师专业认证介绍: 阿里云大数据行业认证 - 大数据分析师专业认证( ACP - AlibabaClou ...

        3. 阿里云大数据分析师(ACP)认证,该如何备考?

          先来了解一下阿里云认证: 阿里云认证是基于核心技术及岗位的权威认证, 阿里云针对不同产品类别.用户成长阶段.生态岗位,精心打造不同的认证考试. 个人:证明您在对应技术领域的专业度,能够基于阿里云产品解 ...

        4. 阿里云大数据助理工程师ACA认证最新笔记(2021)

          阿里云大数据助理工程师ACA认证最新笔记(2020) 首先谈论一下考试相关 本人与最近学习并通过了阿里云云计算助理工程师ACA认证,购买了认证包,有6个月的时间,无数次的观看视频,每个沙箱实验都有两次 ...

        5. 2023年广东数据分析师CPDA认证招生简章(理论+实战)

          CPDA数据分析师认证是中国大数据领域有一定权威度的中高端人才认证,它不仅是中国较早大数据专业技术人才认证.更是中国大数据时代先行者,具有广泛的社会认知度和权威性. 无论是地方政府引进人才.公务员报考 ...

        6. 如何两周快速通过 阿里云大数据分析师acp认证(及免费获取ACA认证资格)

          目录 话不多说,学习资料(视频+模拟题300道): 阿里云大数据分析师 ACP 认证介绍: 阿里云大数据分析师专业认证的报名方式: 阿里云大数据分析师认证所需具备的前置知识: 阿里云大数据分析师认证相 ...

        7. 阿里云大数据分析师ACP认证 视频教程

          阿里云大数据行业认证-大数据分析师认证(ACP-Alibaba Cloud Certified Professional)是大数据行业认证体系中的技能认证,同时也是一个跨平台.通用型专业技术认证. 课 ...

        8. CDA lever-1 备考经验分享 转数据分析师CDA证书备考 考试相关说明

          非常开心在2023年一开始就考过了CDA lever-1,也是今年的第一个证书,真真真是一个开门红,虽然很遗憾没有考到A,但是最起码得到B,也算过了,不算亏.下边是我本次考试的成绩. 考试注册报名与考 ...

        9. [新手-数据分析师]numpy学习笔记(2nd)

          为什么80%的码农都做不了架构师?>>>    今天主意是做numpy矩阵的运算. a = np.arange(9).reshape(3,3) b = np.ones((3,3)) ...

        最新文章

        1. UniT | Facebook发布全新智能通用Agent!
        2. C# Byte数组与Int16数组之间的转换
        3. 【Android Protobuf 序列化】Protobuf 使用 ( protobuf-gradle-plugin 插件简介 | Android Studio 中配置插件 | AS 中编译源文件 )
        4. 记录一个layui框架之自定义模块出现的问题
        5. python3的web开发中出现UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid star
        6. 前端开发 元素的浮动 文字环饶效果 横向排列效果 0229
        7. 计算机与程序设计基础 vb,《VB程序设计基础》第4章 函数与过程
        8. hdu2089 不要62
        9. HTTPS性能优化实践
        10. P1441 砝码称重
        11. 平分物品价值java_网易互联网8.8笔试_第2题平分物品_自己的题解记录
        12. hyper运算符_查询构造器
        13. java对list里面按照分数排名_近3年全国高校高考录取分数线排名,600分以上高校55所...
        14. -XX:GCTimeRatio
        15. ASPP - 空洞空间金字塔池化
        16. 计算机软件实习每日学习打卡(6)20201227
        17. SONY索尼PXW-X280摄像机断电MXF/RSV视频文件损坏修复技术
        18. NodeJs搭建本地服务器之使用手机访问
        19. 怎样在M1或Intel Mac上重置NVRAM
        20. 使用BootStrap时去除a标签的下划线

        热门文章

        1. c++ASCII码转字符
        2. [C#] 使用 Excel 和 Math.Net 进行曲线拟合和数据预测
        3. 转:利用python调用谷歌翻译API
        4. 关于黑洞,那些你所不知道的人和事
        5. 【IoT】TI BLE CC2541 串口控制蓝牙详解
        6. JLX12864G液晶显示屏驱动
        7. 怎样网上注册自己的商标
        8. 7 种 基本比例尺地形图的分幅和编号的数量关系
        9. MySQL——索引的创建与删除
        10. 简单的红绿灯c语言程序,基于Protues仿真的简单交通信号灯附C语言程序