商品参数

Python统计分析

定价 79.00

出版社 人民邮电出版社

版次 1

出版时间 2018年12月

开本 16开

作者 [奥地利]托马斯·哈斯尔万特(Thomas Haslwanter)

装帧 平装-胶订

页数

字数

ISBN编码 9787115493842

重量 392

内容介绍

本书以基础的统计学知识和假设检验为重点,简明扼要地讲述了Python在数据分析、可视化和统计建模中的应用。主要包括Python的简单介绍、研究设计、数据管理、概率分布、不同数据类型的假设检验、广义线性模型、生存分析和贝叶斯统计学等从入门到高ji的内容。 本书利用Python这门开源语言,不仅在直观上对数据分析和统计检验提供了很好的理解,而且在相关数学公式的讲解上也能够做到深入浅出。本书的可操作性很强,配套提供相关的代码和数据,读者可以依照书中所讲,复现和加深对相关知识的理解。 本书适合对统计学和Python有兴趣的读者,te别是在实验学科中需要利用Python的强大功能来进行数据处理和统计分析的学生和研究人员。

目录

第部分 Python和统计学

第 1章 为什么学习统计学 2

第 2章 Python 4

2.1 开始 4

2.1.1 惯例 4

2.1.2 发行版和包 5

2.1.3 安装Python 7

2.1.4 安装R和rpy2 8

2.1.5 个性化IPython/Jupyter 9

2.1.6 Python资源 12

2.1.7 个Python程序 13

2.2 Python数据结构 14

2.2.1 Python数据类型 14

2.2.2 索引和切片 16

2.2.3 向量和数组 17

2.3 IPython/Jupyter:一个交互式的Python编程环境 18

2.3.1 Qt控制台的个会话 19

2.3.2 Notebook和rpy2 21

2.3.3 IPython小贴士 23

2.4 开发Python程序 24

2.4.1 将交互式命令转化为一个Python程序 24

2.4.2 函数、模块和包 26

2.4.3 Python小贴士 30

2.4.4 代码版本控制 31

2.5 Pandas:用于统计学的数据结构 31

2.5.1 数据处理 31

2.5.2 分组(Grouping) 33

2.6 Statsmodels:统计建模的工具 34

2.7 Seaborn:数据可视化 35

2.8 一般惯例 36

2.9 练习 36

第3章 数据输入 38

3.1 从文本文件中输入 38

3.1.1 目视检查 38

3.1.2 读入ASCII数据到Python中 38

3.2 从MS Excel中导入 42

3.3 从其他格式导入数据 43

第4章 统计数据的展示 45

4.1 数据类型 45

4.1.1 分类数据 45

4.1.2 数值型 46

4.2 在Python中作图 46

4.2.1 函数式和面向对象式的绘图方法 47

4.2.2 交互式绘图 48

4.3 展示统计学数据集 52

4.3.1 单变量数据 53

4.3.2 二元变量和多元变量绘图 59

4.4 练习 61

第2部分 分布和假设检验

第5章 背景 63

5.1 总体和样本 63

5.2 概率分布 64

5.2.1 离散分布 64

5.2.2 连续分布 65

5.2.3 期望值和方差 65

5.3 自由度 66

5.4 研究设计 66

5.4.1 术语 67

5.4.2 概述 67

5.4.3 研究类型 68

5.4.4 实验设计 69

5.4.5 个人建议 72

5.4.6 临床研究计划 73

第6章 单变量的分布 74

6.1 分布的特征描述 74

6.1.1 分布中心 74

6.1.2 量化变异度 76

6.1.3 分布形状的参数描述 79

6.1.4 概率密度的重要展示 81

6.2 离散分布 82

6.2.1 伯努利分布 82

6.2.2 二项分布 83

6.2.3 泊松分布 85

6.3 正态分布 86

6.3.1 正态分布的例子 88

6.3.2 中心极限定理 88

6.3.3 分布和假设检验 89

6.4 来自正态分布的连续型分布 90

6.4.1 t分布 90

6.4.2 卡方分布 92

6.4.3 F分布 94

6.5 其他连续型分布 95

6.5.1 对数正态分布 96

6.5.2 韦伯分布 96

6.5.3 指数分布 97

6.5.4 均匀分布 98

6.6 练习 98

第7章 假设检验 100

7.1 典型分析步骤 100

7.1.1 数据筛选和离群值 100

7.1.2 正态性检验 101

7.1.3 转换 104

7.2 假设概念、错误、p值和样本量 104

7.2.1 一个例子 104

7.2.2 推广和应用 105

7.2.3 p值的解释 106

7.2.4 错误的类型 107

7.2.5 样本量 108

7.3 灵敏度和特异度 110

7.4 受试者操作特征(ROC)曲线 113

第8章 数值型数据的均值检验 114

8.1 样本均值的分布 114

8.1.1 单样本均值的t检验 114

8.1.2 Wilcoxon符号秩和检验 116

8.2 两组之间的比较 117

8.2.1 配对t检验 117

8.2.2 独立组别之间的t检验 118

8.2.3 两组之间的非参数比较:Mann-Whitney检验 118

8.2.4 统计学假设检验与统计学建模 118

8.3 多组比较 120

8.3.1 方差分析(ANOVA) 120

8.3.2 多重比较 123

8.3.3 Kruskal–Wallis检验 125

8.3.4 两因素方差分析 126

8.3.5 三因素方差分析 126

8.4 总结:选择正确的检验方法进行组间比较 127

8.4.1 典型的检验 127

8.4.2 假设的例子 128

8.5 练习 129

第9章 分类数据的检验 131

9.1 单个率 131

9.1.1 置信区间 131

9.1.2 解释 132

9.1.3 例子 132

9.2 频数表 133

9.2.1 单因素卡方检验 133

9.2.2 卡方列联表检验 134

9.2.3 Fisher精que检验 136

9.2.4 McNemar检验 139

9.2.5 Cochran's Q检验 140

9.3 练习 141

第 10章 生存时间分析 144

10.1 生存分布 144

10.2 生存概率 145

10.2.1 删失 145

10.2.2 Kaplan–Meier生存曲线 146

10.3 在两组间比较生存曲线 148

第三部分 统计建模

第 11章 线性回归模型 150

11.1 线性相关 150

11.1.1 相关系数 150

11.1.2 秩相关 151

11.2 一般线性回归模型 152

11.2.1 例子1:简单线性回归 153

11.2.2 例子2:二次方拟合 153

11.2.3 决定系数 154

11.3 Patsy:公式的语言 155

11.4 用Python进行线性回归分析 158

11.4.1 例子1:拟合带置信区间的直线 158

11.4.2 例子2:嘈杂的二次多项式 159

11.5 线性回归模型的结果 162

11.5.1 例子:英国的烟草和酒精 162

11.5.2 带有截距的回归的定义 165

11.5.3 R2值 165

11.5.4 调整后的R2值 165

11.5.5 模型的系数和它们的解释 168

11.5.6 残差分析 171

11.5.7 异常值 174

11.5.8 用Sklearn进行回归 175

11.5.9 结论 176

11.6 线性回归模型的假设 177

11.7 线性回归模型结果的解释 180

11.8 Bootstrapping 180

11.9 练习 181

第 12章 多元数据分析 182

12.1 可视化多元相关 182

12.1.1 散点图矩阵 182

12.1.2 相关性矩阵 182

12.2 多重线性回归 184

第 13章 离散数据的检验 185

13.1 等级资料的组间比较 185

13.2 Logistic回归 186

13.3 广义线性模型 188

13.3.1 指数族分布 189

13.3.2 线性预测器和连接函数 189

13.4 有序Logistic回归 189

13.4.1 问题定义 189

13.4.2 优化 191

13.4.3 代码 191

13.4.4 性能 191

第 14章 贝叶斯统计学 193

14.1 贝叶斯学派与频率学派的解释 193

14.2 计算机时代的贝叶斯方法 195

14.3 例子:用马尔可夫链蒙特卡洛模拟分析挑战者号灾难 195

14.4 总结 198

参考答案 199

术语表 219

参考文献 223

python统计分析pdf托马斯_Python统计分析相关推荐

  1. python读取pdf表格_Python使用Tabula提取PDF表格数据

    今天遇到一个批量读取pdf文件中表格数据的需求,样式大体是以下这样: python读取PDF无非就是三种方式(我所了解的),pdfminer.pdf2htmlEX 和 Tabula.综合考虑后,选择了 ...

  2. python读取pdf文件_python读取pdf文件

    广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 一.安装pdfminer3k模块?二. 读取pdf文件import sysimp ...

  3. python统计分析pdf下载_Python金融大数据分析PDF高清文档下载

    Python凭借其简单.易读.可扩展性以及拥有巨大而活跃的科学计算社区,在需要分析.处理大量数据的金融行业得到了广泛而迅速的应用,并且成为该行业开发核心应用的shouxuan编程语言.<Pyth ...

  4. python批量分析表格_Python统计分析execl文件列表值的方法

    用Python统计分析execl文件列表值的方法,采用python批量统计分析Excel表格数据工具代码编写示例.Python实现文件操方法有很多,python excel处理数据简洁方便. 下边关于 ...

  5. python处理pdf实例_Python实战-从菜鸟到大牛的进阶之路pdf_Python教程

    资源名称:Python实战-从菜鸟到大牛的进阶之路 pdf 第1章 Python 处理 cassandra 升级后的回滚脚本 第 2 章 多套方案来提高 python web 框架的并发处理能力 第 ...

  6. 用python汇总pdf文件_Python处理PDF文件-简译与总结

    最近看到一篇介绍Python中pyPDF模块的文章,详细介绍了使用pyPDF模块获取PDF文件信息,合并拆分PDF文件等功能.很方便,在此搬运分享以下: 全文介绍了以下几方面的功能 提取文件信息 旋转 ...

  7. python处理pdf实例_python 使用pdfminer3k 读取PDF文档的例子

    1.安装 pdfminer3k 通过pip安装: pip install pdfminer3k 下载安装:在网页 https://pypi.org/project/pdfminer3k/1.3.1/# ...

  8. python处理pdf 层_Python处理PDF及生成多层PDF实例代码

    Python提供了众多的PDF支持库,本文是在Python3环境下,试用了两个库来完成PDF的生成的功能.PyPDF对于读取PDF支持较好,但是没找到生成多层PDF的方法.Reportlab看起来更成 ...

  9. python识别pdf文字_Python 神工具包!翻译、文字识别、语音转文字统统搞定

    今天给大家介绍一款 Python 制作的实用工具包,包含多种功能: 音频转文字 文字转语音 截图 OCR文字识别 复制翻译 举个例子,比如截图 OCR 文字识别就有很多实用场景. 常会遇到有些 PDF ...

  10. python处理pdf实例_python实现pdf转word的例子

    pdf转word的效果一般都很差,下面使用pdfminer和docx框架,前者用来读取pdf的文本内容,后者用来写到word文件中.仅作入门级参考. 例子如下: #!/usr/bin/env pyth ...

最新文章

  1. MySQL数据库修改表结构
  2. VMware下Windows2003R2虚拟机磁盘扩容方法
  3. Go游戏服务器开发的一些思考(九):Docker桥接网络及固定IP (二)
  4. checked_delete问题: Beyond the C++ STL: an introduction to boostdeleter::do_it
  5. 《认清C++语言》のrandom_shuffle()和transform()算法
  6. Python3 字典 items() 方法
  7. java接收前台tex格式t数据_java 下载文件时,设置response.setContentType 根据文件类型...
  8. nodejs 任务调度bull 测试解析
  9. unity打开excel表格_Unity3D读取之(二)——读取Excel文件内容
  10. Spring AOP原理分析(一)-- AOP相关概念
  11. 最简单的三步yum配置阿里源
  12. 用vue做一个app
  13. 求大于200的最小质数
  14. WifiRemoteStationManager中速率控制算法详解
  15. pytorch张量相乘matmul函数
  16. 服务器开机后,自动启动某程序,并且打开Google浏览器,全屏展示
  17. 最棒的 7 个 Laravel admin 后台管理系统推荐 - 卡拉云
  18. math_常用放缩不等式及其变形@指数@对数@三角函数@一次函数
  19. 如何用php农场项目,2020全新亲测php农场游戏源码-金币菇种植理财区块链源码 带商城系统...
  20. 大家常见的以ESP32为代表的WIFI、蓝牙双模模块,今天启明云端带来了一款低功耗、距离远的LoRa+蓝牙无线通讯模块WT5105-L1,我们一起看看这款模块在功能上有哪些优势?

热门文章

  1. NXP与STM32单片机程序架构
  2. 什么是android原生系统版本,定制安卓和原生Android到底有哪些不同之处?彻底真相了...
  3. VLAN详解系列:(6)VLAN间路由详解
  4. 三.卡尔曼滤波器(EKF)开发实践之三: 基于三个传感器的海拔高度数据融合
  5. PDF免费压缩、在线压缩
  6. 社交网络分析中重要指标说明
  7. android聊天软件开发,实战篇(1)
  8. js格式化日期或者日期时间
  9. Ubuntu 18.04 如何调整桌面图标大小
  10. 2021年烷基化工艺考试内容及烷基化工艺考试资料