阅读权限50威望2 级论坛币2119 个学术水平357 点热心指数383 点信用等级313 点经验103301 点帖子917精华在线时间8677 小时注册时间2012-3-28最后登录2020-10-28

学术权威

26%

学术权威

积分 12299, 距离下一级还需 6001 积分

权限: 自定义头衔, 签名中使用图片, 隐身, 设置帖子权限, 设置回复可见, 签名中使用代码

道具: 涂鸦板, 彩虹炫, 雷达卡, 热点灯, 显身卡, 匿名卡, 金钱卡, 抢沙发, 变色卡, 提升卡, 沉默卡, 千斤顶

下一级可获得

道具: 置顶卡

-

还不是VIP/贵宾

购买后可立即获得

权限: 隐身

道具: 金钱卡, 涂鸦板, 变色卡, 彩虹炫, 雷达卡, 热点灯

TA的文库 其他...威望2 级论坛币

2119 个通用积分7928.5981学术水平357 点热心指数383 点信用等级313 点经验103301 点帖子917精华在线时间8677 小时注册时间2012-3-28最后登录2020-10-28

开心

2018-10-15 09:29:30

签到天数: 12 天

连续签到: 1 天

[LV.3]偶尔看看II

人脉引爆点

发表于 2019-3-29 17:15:18

|只看作者

|倒序

Python虽然是一门编程语言,但是在数据分析领域实现的功能和Excel的基本功能一样,而Excel又是大家比较熟悉、容易上手的软件,可以通过Excel数据分析去对比学习Python数据分析。

2019-3-29 17:10:13 上传

下载附件 (47.4 KB)

2019-3-29 17:14:41 上传

本书将数据分析过程中涉及的每一个操作都对照讲解,让你从熟悉的Excel操作中去学习对应的Python实现,而不是直接学习Python代码,大大降低了学习门槛,消除了大家对代码的恐惧心理。

这也是本书的一大特色,让读者可以像学Excel数据分析一样,轻松学习Python数据分析。

内容简介

集Python、Excel、数据分析为一体是本书的一大特色,本书围绕整个数据分析的常规流程:熟悉工具—明确目的—获取数据—熟悉数据—处理数据—分析数据—得出结论—验证结论—展示结论进行Excel和Python的对比实现,告诉你每一个过程中都会用到什么,过程与过程之间有什么联系。本书既可以作为系统学习数据分析操作流程的说明书,也可以作为一本数据分析师案头必备的实操工具书。

本书通过对比Excel功能操作去学习Python的代码实现,而不是直接学习Python代码,大大降低了学习门槛,消除了读者对代码的恐惧心理。适合刚入行的数据分析师,也适合对Excel比较熟练的数据分析师,以及从事其他岗位想提高工作效率的职场人。

作者介绍

张俊红,某互联网公司数据分析师,擅长Python、Sql、Excel,对数据分析、机器学习领域比较熟悉。喜欢分享,致力于做一个数据科学路上的终身学习者,实践者,分享者。个人微信公众号“张俊红”定期推送数据分析、机器学习、网络爬虫、Python 编程系列文章。

精彩书评

数据分析的门槛可以很高,也可以很低,但数据分析很重要!这本书不是晦涩难懂的学术教材,而是适合不同层次职场人士学习的工具书,通俗易懂地阐述了数据分析的基础及在不同工具下的主要实践,对于初学者或是资深数据爱好者都有很好的启发和助益。

——黄小伟 有赞数据分析团队负责人/R语言中文社区创始人

大数据时代,数据分析是每个职场人士的必备技能之一,你掌握了吗?本书以人人都熟悉的做菜场景为类比,用轻松的语言讲述数据分析的核心要素。本书是初入数据分析领域的读者的一个很好的入门教材,同时也适合有一定分析经验的读者参考。

——黄崇杰 平安壹钱包数据营销总监

数据分析工作中80%以上的时间都在处理底层数据。一份“高大上”的数据分析报告实际上只花费了数据分析师不到20%的时间。张俊红的这本书出现的正是时候,Excel好用但是在处理大数据时效率低下,掌握了Python,数据分析工作将如虎添翼。数据分析师动动手指产出分析报告的美好时光指日可待了!

——刘洋 阿里巴巴高级产品专家

本书为传统数据分析人员迈向大数据时代指明方向,阅读本书可以增加你的职场竞争优势。

——闵军 找钢网数据中心总经理

本书是一本少见的结合了Excel、Python的数据分析书。Excel和Python作为基础的数据分析工具,对于数据分析师来说十分必要,相信任何一个有志于学习数据分析的读者,都能从此书中收获良多。

——张浩彬 广东柯内特环境科技有限公司首席数据科学家

本书通过Python来分析数据,作者在介绍数据分析操作步骤的过程中展示了大量的对数据分析的思考,对于想从事数据分析的读者而言,这是一本很好的工具书。

——赵良 中国统计网联合创始人

作为这几年十分热门的编程语言之一,Python在数据分析方面的能力几乎是无限的,限制就在于使用者本身的能力和认知。对数据分析师而言,用Python做数据分析已经成为必备技能。本书对照Excel,把Python的相关知识娓娓道来。既兼顾到不同工具的应用场景,又将使用技巧融入其中。推荐刚入门的数据分析师阅读本书。

——宋天龙 《Python数据分析与数据化运营》作者

Excel与Python都是数据分析的利器。本书从Excel与Python的实际应用出发,书中的知识都是作者多年一线工作的经验总结。

——王颖祥 永辉超市大数据合伙人

目录

入门篇

第1 章 数据分析基础 . 2

1.1 数据分析是什么 2

1.2 为什么要做数据分析 2

1.2.1 现状分析 . 3

1.2.2 原因分析 . 3

1.2.3 预测分析 . 3

1.3 数据分析究竟在分析什么 4

1.3.1 总体概览指标 . 4

1.3.2 对比性指标 . 4

1.3.3 集中趋势指标 . 4

1.3.4 离散程度指标 . 5

1.3.5 相关性指标 . 5

1.3.6 相关关系与因果关系 . 6

1.4 数据分析的常规流程 6

1.4.1 熟悉工具 . 6

1.4.2 明确目的 . 7

1.4.3 获取数据 . 7

1.4.4 熟悉数据 . 7

1.4.5 处理数据 . 7

1.4.6 分析数据 . 8

1.4.7 得出结论 . 8

1.4.8 验证结论 . 8

1.4.9 展示结论 . 8

1.5 数据分析工具:Excel 与Python .. 8

实践篇

第2 章 熟悉锅——Python 基础知识 . 12

2.1 Python 是什么 .. 12

2.2 Python 的下载与安装 .. 13

2.2.1 安装教程 ... 13

2.2.2 IDE 与IDLE . 17

2.3 介绍Jupyter Notebook 17

2.3.1 新建Jupyter Notebook 文件 17

2.3.2 运行你的第一段代码 ... 19

2.3.3 重命名Jupyter Notebook 文件 19

2.3.4 保存Jupyter Notebook 文件 19

2.3.5 导入本地Jupyter Notebook 文件 20

2.3.6 Jupyter Notebook 与Markdown ... 21

2.3.7 为Jupyter Notebook 添加目录 21

2.4 基本概念 .. 26

2.4.1 数 ... 26

2.4.2 变量 ... 26

2.4.3 标识符 ... 27

2.4.4 数据类型 ... 28

2.4.5 输出与输出格式设置 ... 28

2.4.6 缩进与注释 ... 29

2.5 字符串 .. 30

2.5.1 字符串的概念 ... 30

2.5.2 字符串的连接 ... 30

2.5.3 字符串的复制 ... 30

2.5.4 获取字符串的长度 ... 30

2.5.5 字符串查找 ... 31

2.5.6 字符串索引 ... 31

2.5.7 字符串分隔 ... 32

2.5.8 移除字符 ... 32

2.6 数据结构——列表 .. 33

2.6.1 列表的概念 ... 33

2.6.2 新建一个列表 ... 33

2.6.3 列表的复制 ... 34

2.6.4 列表的合并 ... 34

2.6.5 向列表中插入新元素 ... 34

2.6.6 获取列表中值出现的次数 ... 35

2.6.7 获取列表中值出现的位置 ... 35

2.6.8 获取列表中指定位置的值 ... 36

2.6.9 删除列表中的值 ... 36

2.6.10 对列表中的值进行排序 . 37

2.7 数据结构——字典 .. 37

2.7.1 字典的概念 ... 37

2.7.2 新建一个字典 ... 37

2.7.3 字典的keys()、values()和items()方法 ... 37

2.8 数据结构——元组 .. 38

2.8.1 元组的概念 ... 38

2.8.2 新建一个元组 ... 38

2.8.3 获取元组的长度 ... 38

2.8.4 获取元组内的元素 ... 39

2.8.5 元组与列表相互转换 ... 39

2.8.6 zip()函数 ... 39

2.9 运算符 .. 40

2.9.1 算术运算符 ... 40

2.9.2 比较运算符 ... 40

2.9.3 逻辑运算符 ... 41

2.10 循环语句 41

2.10.1 for 循环 ... 41

2.10.2 while 循环 ... 42

2.11 条件语句 43

2.11.1 if 语句 . 43

2.11.2 else 语句 .. 44

2.11.3 elif 语句 .. 45

2.12 函数 46

2.12.1 普通函数 . 47

2.12.2 匿名函数 . 48

2.13 高级特性 49

2.13.1 列表生成式 . 49

2.13.2 map 函数 . 50

2.14 模块 50

第3 章 Pandas 数据结构 . 51

3.1 Series 数据结构 ... 51

3.1.1 Series 是什么 51

3.1.2 创建一个Series 52

3.1.3 利用index 方法获取Series 的索引 53

3.1.4 利用values 方法获取Series 的值 ... 53

3.2 DataFrame 表格型数据结构 ... 53

3.2.1 DataFrame 是什么 53

3.2.2 创建一个DataFrame 54

3.2.3 获取DataFrame 的行、列索引 ... 56

3.2.4 获取DataFrame 的值 ... 56

第4 章 准备食材——获取数据源 .. 57

4.1 导入外部数据 .. 57

4.1.1 导入.xlsx 文件 .. 57

4.1.2 导入.csv 文件 ... 60

4.1.3 导入.txt 文件 63

4.1.4 导入sql 文件 65

4.2 新建数据 .. 67

4.3 熟悉数据 .. 67

4.3.1 利用head 预览前几行 . 67

4.3.2 利用shape 获取数据表的大小 68

4.3.3 利用info 获取数据类型 .. 69

4.3.4 利用describe 获取数值分布情况 71

第5 章 淘米洗菜——数据预处理 .. 73

5.1 缺失值处理 .. 73

5.1.1 缺失值查看 ... 73

5.1.2 缺失值删除 ... 75

5.1.3 缺失值填充 ... 77

5.2 重复值处理 .. 78

5.3 异常值的检测与处理 .. 81

5.3.1 异常值检测 ... 81

5.3.2 异常值处理 ... 82

5.4 数据类型转换 .. 83

5.4.1 数据类型 ... 83

5.4.2 类型转换 ... 84

5.5 索引设置 .. 86

5.5.1 为无索引表添加索引 ... 86

5.5.2 重新设置索引 ... 87

5.5.3 重命名索引 ... 88

5.5.4 重置索引 ... 89

第6 章 菜品挑选——数据选择 . 91

6.1 列选择 .. 91

6.1.1 选择某一列/某几列 .. 91

6.1.2 选择连续的某几列 ... 92

6.2 行选择 .. 93

6.2.1 选择某一行/某几行 .. 93

6.2.2 选择连续的某几行 ... 94

6.2.3 选择满足条件的行 ... 95

6.3 行列同时选择 .. 96

6.3.1 普通索引+普通索引选择指定的行和列 . 97

6.3.2 位置索引+位置索引选择指定的行和列 . 97

6.3.3 布尔索引+普通索引选择指定的行和列 . 98

6.3.4 切片索引+切片索引选择指定的行和列 . 98

6.3.5 切片索引+普通索引选择指定的行和列 . 99

第7 章 切配菜品——数值操作 ... 100

7.1 数值替换 100

7.1.1 一对一替换 . 100

7.1.2 多对一替换 . 102

7.1.3 多对多替换 . 103

7.2 数值排序 104

7.2.1 按照一列数值进行排序 . 104

7.2.2 按照有缺失值的列进行排序 . 106

7.2.3 按照多列数值进行排序 . 106

7.3 数值排名 108

7.4 数值删除 . 110

7.4.1 删除列 .. 110

7.4.2 删除行 .. 111

7.4.3 删除特定行 .. 112

7.5 数值计数 . 113

7.6 唯一值获取 . 114

7.7 数值查找 . 115

7.8 区间切分 . 116

7.9 插入新的行或列 . 119

7.10 行列互换 .. 120

7.11 索引重塑 .. 121

7.12 长宽表转换 .. 122

7.12.1 宽表转换为长表 ... 123

7.12.2 长表转换为宽表 ... 125

7.13 apply()与applymap()函数 ... 126

第8 章 开始烹调——数据运算 ... 127

8.1 算术运算 127

8.2 比较运算 128

8.3 汇总运算 129

8.3.1 count 非空值计数 ... 129

8.3.2 sum 求和 . 130

8.3.3 mean 求均值 ... 130

8.3.4 max 求最大值 . 131

8.3.5 min 求最小值 . 132

8.3.6 median 求中位数 132

8.3.7 mode 求众数 ... 133

8.3.8 var 求方差 ... 134

8.3.9 std 求标准差 ... 134

8.3.10 quantile 求分位数 . 135

8.4 相关性运算 136

第9 章 炒菜计时器——时间序列 138

9.1 获取当前时刻的时间 138

9.1.1 返回当前时刻的日期和时间 . 138

9.1.2 分别返回当前时刻的年、月、日 . 138

9.1.3 返回当前时刻的周数 . 139

9.2 指定日期和时间的格式 140

9.3 字符串和时间格式相互转换 141

9.3.1 将时间格式转换为字符串格式 . 141

9.3.2 将字符串格式转换为时间格式 . 141

9.4 时间索引 142

9.5 时间运算 145

9.5.1 两个时间之差 . 145

9.5.2 时间偏移 . 145

第10 章 菜品分类——数据分组/数据透视表 .. 148

10.1 数据分组 .. 148

10.1.1 分组键是列名 ... 150

10.1.2 分组键是Series 151

10.1.3 神奇的aggregate 方法 . 152

10.1.4 对分组后的结果重置索引 ... 153

10.2 数据透视表 .. 154

第11 章 水果拼盘——多表拼接 . 158

11.1 表的横向拼接 .. 158

11.1.1 连接表的类型 ... 158

11.1.2 连接键的类型 ... 160

11.1.3 连接方式 ... 163

11.1.4 重复列名处理 ... 165

11.2 表的纵向拼接 .. 165

11.2.1 普通合并 ... 166

11.2.2 索引设置 ... 167

11.2.3 重叠数据合并 ... 167

第12 章 盛菜装盘——结果导出 . 169

12.1 导出为.xlsx 文件 . 169

12.1.1 设置文件导出路径 ... 170

12.1.2 设置Sheet 名称 170

12.1.3 设置索引 ... 170

12.1.4 设置要导出的列 ... 171

12.1.5 设置编码格式 ... 171

12.1.6 缺失值处理 ... 172

12.1.7 无穷值处理 ... 172

12.2 导出为.csv 文件 ... 173

12.2.1 设置文件导出路径 ... 173

12.2.2 设置索引 ... 174

12.2.3 设置要导出的列 ... 174

12.2.4 设置分隔符号 ... 174

12.2.5 缺失值处理 ... 174

12.2.6 设置编码格式 ... 175

12.3 将文件导出到多个Sheet 175

第13 章 菜品摆放——数据可视化 .. 176

13.1 数据可视化是什么 .. 176

13.2 数据可视化的基本流程 .. 176

13.2.1 整理数据 ... 176

13.2.2 明确目的 ... 177

13.2.3 寻找合适的表现形式 ... 177

13.3 图表的基本组成元素 .. 177

13.4 Excel 与Python 可视化 ... 179

13.5 建立画布和坐标系 .. 179

13.5.1 建立画布 ... 179

13.5.2 用add_subplot 函数建立坐标系 . 180

13.5.3 用plt.subplot2grid 函数建立坐标系 182

13.5.4 用plt.subplot 函数建立坐标系 183

13.5.5 用plt.subplots 函数建立坐标系 .. 184

13.5.6 几种创建坐标系方法的区别 ... 185

13.6 设置坐标轴 .. 185

13.6.1 设置坐标轴的标题 ... 185

13.6.2 设置坐标轴的刻度 ... 187

13.6.3 设置坐标轴的范围 ... 190

13.6.4 坐标轴的轴显示设置 ... 191

13.7 其他图表格式的设置 .. 191

13.7.1 网格线设置 ... 191

13.7.2 设置图例 ... 193

13.7.3 图表标题设置 ... 195

13.7.4 设置数据标签 ... 197

13.7.5 图表注释 ... 198

13.7.6 数据表 ... 199

13.8 绘制常用图表 .. 201

13.8.1 绘制折线图 ... 201

13.8.2 绘制柱形图 ... 204

13.8.3 绘制条形图 ... 208

13.8.4 绘制散点图 ... 209

13.8.5 绘制气泡图 211

13.8.6 绘制面积图 ... 212

13.8.7 绘制树地图 ... 213

13.8.8 绘制雷达图 ... 215

13.8.9 绘制箱形图 ... 217

13.8.10 绘制饼图 . 218

13.8.11 绘制圆环图 . 220

13.8.12 绘制热力图 . 221

13.8.13 绘制水平线和垂直线 . 223

13.9 绘制组合图表 .. 224

13.9.1 折线图+折线图 224

13.9.2 折线图+柱形图 225

13.10 绘制双坐标轴图表 226

13.10.1 绘制双y 轴图表 . 227

13.10.2 绘制双x 轴图表 . 228

13.11 绘图样式设置 228

进阶篇

第14 章 典型数据分析案例 234

14.1 利用Python 实现报表自动化 . 234

14.1.1 为什么要进行报表自动化 ... 234

14.1.2 什么样的报表适合自动化 ... 234

14.1.3 如何实现报表自动化 ... 235

14.2 自动发送电子邮件 .. 239

14.3 假如你是某连锁超市的数据分析师 .. 241

14.3.1 哪些类别的商品比较畅销 ... 242

14.3.2 哪些商品比较畅销 ... 242

14.3.3 不同门店的销售额占比 ... 243

14.3.4 哪些时间段是超市的客流高峰期 ... 244

14.4 假如你是某银行的数据分析师 .. 245

14.4.1 是不是收入越高的人坏账率越低 ... 246

14.4.2 年龄和坏账率有什么关系 ... 247

14.4.3 家庭人口数量和坏账率有什么关系 ... 248

第15 章 NumPy 数组 . 250

15.1 NumPy 简介 . 250

15.2 NumPy 数组的生成 . 250

15.2.1 生成一般数组 ... 251

15.2.2 生成特殊类型数组 ... 251

15.2.3 生成随机数组 ... 253

15.3 NumPy 数组的基本属性 . 255

15.4 NumPy 数组的数据选取 . 256

15.4.1 一维数据选取 ... 256

15.4.2 多维数据选取 ... 257

15.5 NumPy 数组的数据预处理 . 259

15.5.1 NumPy 数组的类型转换 .. 259

15.5.2 NumPy 数组的缺失值处理 .. 260

15.5.3 NumPy 数组的重复值处理 .. 260

15.6 NumPy 数组重塑 . 261

15.6.1 一维数组重塑 ... 261

15.6.2 多维数组重塑 ... 261

15.6.3 数组转置 ... 262

15.7 NumPy 数组合并 . 262

15.7.1 横向合并 ... 262

15.7.2 纵向合并 ... 263

15.8 常用数据分析函数 .. 264

15.8.1 元素级函数 ... 264

15.8.2 描述统计函数 ... 264

15.8.3 条件函数 ... 266

15.8.4 集合关系 ... 266

python和excel的区别-对比Excel,轻松学习Python数据分析相关推荐

  1. python和c 的区别-对比平台--C和Python之间的区别

    C和Python之间的主要区别在于,C是一种面向结构的编程语言,而Python是一种面向对象的编程语言.通常,C用于开发可硬件操作的应用程序,而python被用作通用编程语言.C语言在编译器下运行,而 ...

  2. 『对比Excel,轻松学习Python数据分析』新书发布

    之前在公众号提过,我写了一本书,现在这本书终于面世了,这本书就是『对比Excel,轻松学习Python数据分析』,这本书是写什么的,以及这本书怎么写的,相信大家通过书名就能了解一二,但还是有必要专门写 ...

  3. 好书推荐:《对比Excel,轻松学习Python数据分析》

    之前就一直有打算出一个结合Excel的Python数据分析的教程,刚好张俊红同学就出了书籍,后面写相关文章又多了一本好书.我首先说说我的看法,为什么要和Excel做结合了. Excel大家都熟悉,结合 ...

  4. asp sql查询过滤空格_对比Excel,轻松学习SQL数据分析数据笔记02

    本文主要梳理<对比Excel,轻松学习SQL数据分析>对于自己有用的sql知识.这本书中的所有代码和函数均适用于my sql 8.0版本. SQL的基本功能数据定义(DDL)--对数据库, ...

  5. 怎么学python-如何轻松学习Python数据分析

    1.实际的工作 如果你是一名数据分析师,我相信你对上面的这些词应该不陌生.我自己在刚开始做数据分析的时候,基本上每天就是Excel,就是Excel里面的vlookup.sumifs.数据透视表这些,s ...

  6. 如何轻松学习Python数据分析?

    总第135篇/张俊红 今天这篇文章来聊聊如何轻松学习『Python数据分析』,我会以一个数据分析师的角度去聊聊做数据分析到底有没有必要学习编程.学习Python,如果有必要,又该如何学习才能做到毫不费 ...

  7. 学python处理数据_如何轻松学习Python数据分析?

    原标题:如何轻松学习Python数据分析? 今天这篇文章来聊聊如何轻松学习『Python数据分析』,我会以一个数据分析师的角度去聊聊做数据分析到底有没有必要学习编程.学习Python,如果有必要,又该 ...

  8. python怎么学最快-怎么样快速高效学习Python

    怎么样快速高效学习Python.最近学习Python语言的伙伴越来越多,但大多数人都没有太多时间用在学习上.那么怎么样学习Python时间短又高效的方法就很重要了.下面我把我学习python的方法简单 ...

  9. python零基础怎么学-零基础如何学习Python?老男孩Python入门培训

    现在越来越多的人想要学习Python课程,在学习Python的过程中不少人都会关注学习Python难吗?今天老男孩IT教育小编就为大家详细的解读一下吧. 0基础学习Python语言可以吗?首先个人认为 ...

最新文章

  1. php gt lte gte,springdata jpa封装数据库关键字(EQ, LIKE, GT, LT, GTE, LTE,IN)
  2. JAVA中的常量定义在class中还是interface中比较合理?
  3. 成功解决将python的列表格式输出数值(如pandas.read_excel().describe()),批量转到表格内daiding
  4. (第一课)Python学习之蟒蛇绘制
  5. H.264 Quantization
  6. php及时提醒反馈,php,实时交互_请问PHP脚本执行时如何实时提供反馈,php,实时交互 - phpStudy...
  7. C++继承时名字的遮蔽
  8. 利用aspnetPager控件加存储过程实现对gridview的分页
  9. RxBinding系列之RxTextView(二)
  10. static 和 const的解释(转载)
  11. java setw_C++ setw:格式化输出(详解版)
  12. rust倒地了怎么起来_ggxx出招表
  13. RAR压缩包没有密码如何解压
  14. JAVA 根据身份证获取年龄
  15. sin60度 用计算机,cos60度等于多少啊
  16. 问卷星调查问卷自动填写问卷的js
  17. ORA-12528: TNS: 监听程序: 所有适用例程都无法建立新连
  18. bug难免,但规避bug的五大方式你看了吗!
  19. Multisim 自定义元件库:创建-使用-仿真
  20. 组态王或SCADA与西门子200Smart通讯配置流程

热门文章

  1. Surfaceview调用Camera实现拍照
  2. 鸿蒙对比ios流畅,鸿蒙OS 2.0对比iOS 14:苹果流畅度完败?
  3. python flask 微信_使用Flask创建微信公众号
  4. 〖Python零基础入门篇㉟〗- 私有函数、私有变量及封装
  5. 云原生、工业互联网之浅见
  6. python开发要学哪些内容_Python开发工程师需要学习哪些内容?
  7. 1. 不吹不擂,第一篇就能提升你对Bean Validation数据校验的认知
  8. python手机自动化测试脚本语言_python脚本语言? Appium移动自动化测试
  9. ES索引生命周期管理ILM
  10. OSM数据分析及图形化显示以及各组员之间的关系Relation的存储