前 言

如今,我们生活在一个万物互联的世界,每天都在产生海量数据,不可能依靠人力去分析产生的所有数据并做出决策。人类的决策越来越多地被计算机辅助决策所取代,这也得益于数据科学的发展。数据科学已经深入到我们互联世界中的每个角落,市场对那些十分了解数据科学算法并且有能力用这些算法进行编程的人才需求是不断增长的。数据科学是多领域交叉的,简单列举几个:数据挖掘、机器学习、统计学等。这对那些渴望成为数据科学家以及已经从事这一领域的人们在各方面都倍感压力。把算法当成黑盒子应用到决策系统里,可能会适得其反。面对着无数的算法和数不清的问题,我们需要充分掌握潜在的算法理论,这样才能给每个指定的问题选择最好的算法。

作为一门编程语言,Python演变至今,已经成为数据科学家的首选之一。在快速原型构建方面,它能充分发挥了脚本语言的能力,对于成熟软件的开发,它精巧的语言结构也十分适合,再加上它在数值计算方面神奇的库,这些都使得它被众多数据科学家和一般的科学编程群体所推崇。不仅如此,由于Django和Flaskweb等Web框架的出现,Python 在Web开发人员中也很受欢迎。

本书通过精心编写的内容和精选的主题来满足读者的需求,无论是新手还是经验丰富的数据科学家都将从中获益。本书的内容涉及数据科学的不同方面,包括数据探索、数据分析与挖掘、机器学习、大规模机器学习等。每一章都经过精心编写,带领读者探索相关领域。本书为读者提供了足够的数学知识来理解不同深度的算法功能。只要你有需求,我们都能为好学的读者提供充分的指导,各个主题都十分便于读者学习和理解。

本书给读者带来了数据科学的艺术力和Python编程的力量,并帮助他们掌握数据科学的概念。了解Python语言并不是死板地跟随本书学习,非Python程序员可以从第1章开始阅读,里面涵盖了Python数据结构及函数编程等概念。

前几章涵盖了数据科学的基础知识,后面的章节则致力于高级数据科学算法。目前最先进的算法已经引领数据科学家在不同的行业实践中进行探索,这些算法包括集成方法、随机森林、正则化回归等,书中将会详细介绍。一些在学术界流行而仍未广泛引入到主流应用中的算法,例如旋转森林等在文中也有详细介绍。

目前市场上有许多个人撰写的数据科学方面的书籍,但我认为它们在将隐藏在数据科学算法背后的数学原理和一些实施中的细节相结合方面仍存在很大空缺,本书志在填补这一空白。每一个主题,恰如其分的数学知识讲解能引导读者理解算法工作原理。我相信读者可以在他们的应用中充分感受这些方法带来的效益。

这里有一个忠告,虽然我们尽可能用客观的语言给读者解释这些主题,但它们并没有作为成品在极端的条件下进行过严格测试。成品的数据科学代码必须符合严格的工程规范。

本书可以作为学习数据科学方法的指南和快速参考书。这是一本独立的、介绍数据科学给新手和一些有一点算法基础的人的书,帮助他们成为这个行业的专家。

[ 第1章 Python在数据科学中的应用

1.1 简介](https://yq.aliyun.com/articles/90942/)

1.2 使用字典对象

1.2.1 准备工作

1.2.2 操作方法

1.2.3 工作原理

1.2.4 更多内容

1.2.5 参考资料

1.3 使用字典的字典

1.3.1 准备工作

1.3.2 操作方法

1.3.3 工作原理

1.3.4 参考资料

1.4 使用元组

1.4.1 准备工作

1.4.2 操作方法

1.4.3 工作原理

1.4.4 更多内容

1.4.5 参考资料

1.5 使用集合

1.5.1 准备工作

1.5.2 操作方法

1.5.3 工作原理

1.5.4 更多内容

1.6 写一个列表

1.6.1 准备工作

1.6.2 操作方法

1.6.3 工作原理

1.6.4 更多内容

1.7 从另一个列表创建列表——列表推导

1.7.1 准备工作

1.7.2 操作方法

1.7.3 工作原理

1.7.4 更多内容

1.8 使用迭代器

1.8.1 准备工作

1.8.2 操作方法

1.8.3 工作原理

1.8.4 更多内容

1.9 生成一个迭代器和生成器

1.9.1 准备工作

1.9.2 操作方法

1.9.3 工作原理

1.9.4 更多内容

1.10 使用可迭代对象

1.10.1 准备工作

1.10.2 操作方法

1.10.3 工作原理

1.10.4 参考资料

1.11 将函数作为变量传递

1.11.1 准备工作

1.11.2 操作方法

1.11.3 工作原理

1.12 在函数中嵌入函数

1.12.1 准备工作

1.12.2 操作方法

1.12.3 工作原理

1.13 将函数作为参数传递

1.13.1 准备工作

1.13.2 操作方法

1.13.3 工作原理

1.14 返回一个函数

1.14.1 准备工作

1.14.2 操作方法

1.14.3 工作原理

1.14.4 更多内容

1.15 使用装饰器改变函数行为

1.15.1 准备工作

1.15.2 操作方法

1.15.3 工作原理

1.16 使用lambda创造匿名函数

1.16.1 准备工作

1.16.2 操作方法

1.16.3 工作原理

1.17 使用映射函数

1.17.1 准备工作

1.17.2 操作方法

1.17.3 工作原理

1.17.4 更多内容

1.18 使用过滤器

1.18.1 准备工作

1.18.2 操作方法

1.18.3 工作原理

1.19 使用zip和izip函数

1.19.1 准备工作

1.19.2 操作方法

1.19.3 工作原理

1.19.4 更多内容

1.19.5 参考资料

1.20 从表格数据使用数组

1.20.1 准备工作

1.20.2 操作方法

1.20.3 工作原理

1.20.4 更多内容

1.21 对列进行预处理

1.21.1 准备工作

1.21.2 操作方法

1.21.3 工作原理

1.21.4 更多内容

1.22 列表排序

1.22.1 准备工作

1.22.2 操作方法

1.22.3 工作原理

1.22.4 更多内容

1.23 采用键排序

1.23.1 准备工作

1.23.2 操作方法

1.23.3 工作原理

1.23.4 更多内容

1.24 使用itertools

1.24.1 准备工作

1.24.2 操作方法

1.24.3 工作原理

[第2章 Python环境

2.1 简介](https://yq.aliyun.com/articles/91121/)

2.2 使用NumPy库

2.2.1 准备工作

2.2.2 操作方法

2.2.3 工作原理

2.2.4 更多内容

2.2.5 参考资料

2.3 使用matplotlib进行绘画

2.3.1 准备工作

2.3.2 操作方法

2.3.3 工作原理

2.3.4 更多内容

2.4 使用scikit-learn进行机器学习

2.4.1 准备工作

2.4.2 操作方法

2.4.3 工作原理

2.4.4 更多内容

2.4.5 参考资料

第3章 数据分析——探索与争鸣

第4章 数据分析——深入理解

第5章 数据挖掘——海底捞针

第6章 机器学习1

第7章 机器学习2

第8章 集成方法

第9章 生长树

第10章 大规模机器学习——在线学习

python数据科学指南是什么_《Python数据科学指南》——导读相关推荐

  1. 数据透视表 字段交叉_删除数据透视表的计算字段的宏

    数据透视表 字段交叉 Have you ever recorded a macro to remove pivot table calculated fields? Just turn on the ...

  2. python网络数据采集 第三版_(数据科学学习手札31)基于Python的网络数据采集(初级篇)...

    一.简介 在实际的业务中,我们手头的数据往往难以满足需求,这时我们就需要利用互联网上的资源来获取更多的补充数据,但是很多情况下,有价值的数据往往是没有提供源文件的直接下载渠道的(即所谓的API),这时 ...

  3. python内置函数多少个_每个数据科学家都应该知道的10个Python内置函数

    python内置函数多少个 Python is the number one choice of programming language for many data scientists and a ...

  4. python写spark的效率问题_“大数据架构”Spark 3.0发布,重大变化,性能提升18倍...

    我们激动地宣布,作为Databricks运行时7.0的一部分,可以在Databricks上使用Apache SparkTM 3.0.0版本.3.0.0版本包含超过3400个补丁,是开源社区做出巨大贡献 ...

  5. python大数据运维工程师待遇_大数据开发、运维、数据分析分别是干什么的?哪个薪资最高?...

    玩转大数据首先要明确自己将要学习的方向,没有人能一下子吃透大数据里面所有的东西. 在大数据的世界里面主要有三个学习方向,大数据开发师.大数据运维师.大数据架构师. 哪个好?我不知道你所说的哪个好?指的 ...

  6. python中列表数据汇总和平均值_对数据进行分类,计算每个类别的平均值和标准差...

    我假设你的矩阵在一个列表列表中,并向你展示如何开始.(然而,正如我在一篇评论中提到的,如果你把矩阵放在一个numpy array或matrix中,它也会变得更加简单和快速.) 如果您只是将该值作为一个 ...

  7. python规模大小的指标是_训练数据多少才够用

    [导读]机器学习获取训练数据可能很昂贵.因此,机器学习项目中的关键问题是确定实现特定性能目标需要多少训练数据.在这篇文章中,我们将对从回归分析到深度学习等领域的训练数据大小的经验和研究文献结果进行快速 ...

  8. python大数据运维常用脚本_大数据岗位要求之大数据运维

    继续介绍大数据系列岗位要求,大数据运维可能是"技术含量最高"的职位之一,这里说的大数据运维主要是指hadoop生态体系方面的运维,在一些小公司或者传统行业的大公司也会使用oracl ...

  9. python在土木工程中的应用_大数据技术及其在土木工程中的应用

    朱之宇 黄程 摘要:随着科技的不断发展,互联网技术的不断革新,信息化时代的到来,各种信息的处理更是十分的复杂,但是随着大数据技术的出现,信息处理的速度和能力变得更强大,一方面大数据能够广泛的应用于各行 ...

  10. 大数据数据科学家常用面试题_进行数据科学工作面试

    大数据数据科学家常用面试题 During my time as a Data Scientist, I had the chance to interview my fair share of can ...

最新文章

  1. oracle里面查询重复数据的方法
  2. 2018-12 jdk_JDK 12新闻(2018年9月13日)
  3. 多元线性回归matlab代码例题_多元线性回归matlab程序
  4. 北交大实验室爆炸事故后续
  5. 反斜杠在C/C++中的作用
  6. 深入理解Dalvik字节码指令及Smali文件
  7. 红帽linux进阶,Linux进阶第二天
  8. 在Android开发中如何移除EditText上的输入焦点
  9. 免费MD5破解、在线查询网站
  10. 【洛谷试炼场】普及练习场——贪心
  11. 致远项目管理SPM系统之合同基本信息管理
  12. Jxls excel 导出带图片
  13. 面试问题——英语38 教育孩子 管理时间 看电视
  14. java 实现 excel normsdist_Excel实现的NORM NORMDIST函数中的幻数
  15. (Adventure项目)自行车业务数据分析报告(三)
  16. 嵌入式开发中遇见的问题1-printf函数
  17. 在 VMware Workstation 16 Pro 中安装 Ubuntu Server 22.04.1 并配置静态 IP 地址
  18. oracle的package是什么意思,Oracle的Package的作用及用法
  19. 实战-PHP远程代码执行漏洞
  20. 马上着手开发 iOS 应用程序 (Start Developing iOS Apps Today)(中文)

热门文章

  1. Angular应用里HTTP请求的错误处理
  2. Java单例模式(Singleton)的五种实现
  3. 如何为SAP API Portal上创建的API增添API key验证保护功能
  4. create-react-app的template和assembed resource
  5. cross component navigation in HCP
  6. jMeter的Cookie Manager用法
  7. SAP CRM呼叫中心点了interact按钮后的处理逻辑
  8. 如何快速找到settype被assign的product category
  9. Java Spring源码研究之BeanNameUrlHandlerMapping
  10. Ui5 tool debug - ctrl alt shift s