Python for Data Analysis
本文只是一篇类似导向性的分享, 并没有原创内容, 主要是书籍和网络资源的整理, 仅供参考. 可能会有后续补充更新.
资源
A Byte of Python 这是给没有使用过 Python 的人员的入门级材料, 如果有编程基础的话应当一两天就可以上手了.
- Python for Data Analysis
Python for Finance 2015年的新书, 相比前者, 也涵盖了基础的介绍, 适合初学.
NumPy for Matlab Users
Python for Data Analysis 这本书介绍的生态已经非常详尽了, 以下是一些补充. 只是给定关键词, 有兴趣的可以进一步查阅资料.
对其他数据分析语言的用户的友好文档
NumPy for R (and S-Plus) users
NumPy for MATLAB users
集成生态的发布版本
科学计算的生态, 一个个安装起来也未必省心, 尤其是 Windows, 有集成了诸如 Numpy, Scipy 等库的第三方发布版本.比如 Anaconda
开发 / 研究工具
IPython notebook : 相当于 RStudio 中 Rmd 的编辑和运行的模式, 不过个人认为使用起来更加方便.
Pycharm : 更加贴近开发的 IDE.
Spyder : 更加接近 Matlab 环境的开发.
IPython Notebook
IPython Notebook - a web-based interactive computational environment
Minibook
http://ipython-books.github.io/minibook/
外面已经有电子版的了, 里面的内容也涵盖了基本的 numpy 及其科学计算生态的简单介绍. 非常推荐 入门学习.
Cookbook
http://ipython-books.github.io/cookbook/
暂时还没有找到电子资源, 好在网站本身也开放了大量示例, 也是很好的学习资源.
有好的资源欢迎分享
性能提升
Python 的数据工具的底层已经做了相当的优化, 除非是生产环境对性能要求非常苛刻, 一般也很少使用, 可以不多做考虑.
Cython : Cython is an optimising static compiler for both the Python programming language and the extended Cython programming language (based on Pyrex). 瓶颈的内容可以使用 Cython 配合 C/C++ 做模块替换.
Pypy : PyPy is a fast, compliant alternative implementation of the Python language. 是 Python 语法的替换实现, 但是对于 Numpy 生态的支持还不属于稳定阶段.
数据存储
HDF5
HDF5 is a data model, library, and file format for storing and managing data. It supports an unlimited variety of datatypes, and is designed for flexible and efficient I/O and for high volume and complex data.
Pandas 有对 hdf5 格式数据的支持.
HDF5 for Python
TODO
相关资源的链接完善
教程文档/视频的列举
例子的给定
更新历史
- 2015-02-20 添加了 IPython Notebook 和 Python for Finance 的相关学习资源
- 2015-02-05 添加对其他数据分析语言的用户的友好文档
- 2015-01-31 创建
转载于:https://www.cnblogs.com/hanzhichao2000/p/python-for-data-analysis.html
Python for Data Analysis相关推荐
- 数据分析---《Python for Data Analysis》学习笔记【04】
<Python for Data Analysis>一书由Wes Mckinney所著,中文译名是<利用Python进行数据分析>.这里记录一下学习过程,其中有些方法和书中不同 ...
- python for data analysis 操作usagov_bitly_data示例
python for data analysis 操作usagov_bitly_data示例 import json path = 'ch02/usagov_bitly_data2012-03-16- ...
- python 数据分析 百度网盘_[百度网盘]利用Python进行数据分析(Python For Data Analysis中文版).pdf - Jan-My31的博客 - 磁力点点...
利用Python进行数据分析(Python For Data Analysis中文版).pdf - Jan-My31的博客 2018-5-27 · 链接:https://pan.baidu.com/s ...
- 《利用Python进行数据分析: Python for Data Analysis 》学习随笔
NoteBook of <Data Analysis with Python> 3.IPython基础 Tab自动补齐 变量名 变量方法 路径 解释 ?解释, ??显示函数源码 ?搜索命名 ...
- 《Python for Data Analysis》之 Series
pandas的主要数据结构:Series Pandas所能满足的需求: 具备按轴自动或显式数据对齐功能的数据结构.这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误. ...
- [学习笔记]Python for Data Analysis, 3E-9.绘图和可视化
进行信息可视化(有时称为绘图)是数据分析中最重要的任务之一.它可能是探索过程中的一部分-例如,帮助识别异常值或所需的数据转换,或作为生成模型想法的一种方式.对于其他人来说,为Web构建交互式可视化可能 ...
- 第13章 Python建模库介绍--Python for Data Analysis 2nd
本书中,我已经介绍了Python数据分析的编程基础.因为数据分析师和科学家总是在数据规整和准备上花费大量时间,这本书的重点在于掌握这些功能. 开发模型选用什么库取决于应用本身.许多统计问题可以用简单方 ...
- 第03章 Python的数据结构、函数和文件--Python for Data Analysis 2nd
本章讨论Python的内置功能,这些功能本书会用到很多.虽然扩展库,比如pandas和Numpy,使处理大数据集很方便,但它们是和Python的内置数据处理工具一同使用的. 我们会从Python最基础 ...
- [学习笔记]Python for Data Analysis, 3E-8.数据整理:连接、合并和重塑
在许多应用程序中,数据可能分布在多个文件或数据库中,或者以不便于分析的形式排列.本章重点介绍有助于合并.联接和重新排列数据的工具. 首先,介绍一下pandas中的分层索引的概念,这个概念在其中一些操作 ...
最新文章
- python 自定义模块怎么用_python自定义模块使用说明
- 树莓派实现AD转换(pcf8591模块)
- 12 Django cooking与session
- 使用Magicodes.SwaggerUI快速配置SwaggerUI以及设置API分组
- android http 三次 握手,面试解析:3次握手与4次挥手
- springboot和springcloud有什么关系
- 支持向量所在超平面方程_深入浅出机器学习算法:支持向量机
- Java中的文件压缩
- Linux系统发行版本介绍(一)——CentOS介绍
- php mac windows,苹果电脑是windows系统吗
- 深入研究:HTTP2的真正性能到底如何
- VS2012更改/重置默认开发环境
- 算法学习(五)—— 广度优先搜索
- cmos电路多余输入端能否悬空_CMOS电路多余输入端悬空会造成逻辑混乱,可以这样处理!...
- 一个app开发周期是多久?快速开发才是主流
- Java通过SMS短信平台实现发短信功能
- 洗扑克牌 (乱数排序)
- 【Beta】Scrum Meeting 4
- 19、网络配线架打线工艺
- html中图片动态效果代码,CSS3实现的图片动态交互效果
热门文章
- 判断数组中某个元素除自身外是否和其他数据不同_算法工程师要懂的3种算法数据结构:线性表详解...
- 语言的顺序表的合拼_2020语文中考专题五:语言运用和综合性学习。掌握基础题五种题型...
- 关于高德地图Android开发时地图只显示一次、第二次打开不定位的解决办法
- 每天一道LeetCode-----将二叉树原地平铺成链式结构
- 如何在windows下使用linux命令
- 买卖股票的最佳时机—leetcode121
- Px4源码框架结构图
- 8086汇编 贪吃蛇 源代码
- DRAM,SRAM,SDRAM的关系与区别
- RISC与CISC比较