ipython开发环境搭建以及pandas快速入门

  • 0.开发环境搭建
    • 技巧
    • 网页版ipython:ipython notebook
    • numpy
  • 1.pandas 快速入门一
    • 导入
    • 创建对象
  • 2. pandas 快速入门二
    • 空数据处理
    • apply的用法
    • count和mode函数
    • 数据合并
  • 3. pandas 快速入门三
    • 数据整形
    • 数据透视
    • 时间序列
    • 数据可视化
    • 数据载入和保存

0.开发环境搭建

pip install jupyter
pip install numpy
pip install matplotlib


然后进入ipython 看一下没有错就可以了

技巧

ipython解析器对比python更易阅读。


ipython可以使用问号?访问

%timeit看某段代码执行的效果:

网页版ipython:ipython notebook


启动ipython:


numpy


上一节讲过
补充一些:

1.pandas 快速入门一


https://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html
10 minutes to pandas

导入

创建对象

创建一个通过Series传递值的列表:注意S大写


DataFrame通过传递带有日期时间索引和带标签的列的NumPy数组来创建:

通过字典来创建
df.A 访问列的数据

访问前几行:默认前五行



尾部的数据

行标签和列标签


可以看统计数据

转置

排序
根据列排序

降序的

通过A的值进行排序

数据选择

或者是属性值

又或者

又又或者

数字标签


访问某个特定值:第二种访问效率更高,但是需要访问最初始的参数,单只使用日期是会报错的

通过iloc选行



访问某个特定元素,第二种方法更高效

通过%timeit看是否高效




用isin过滤出某值

修改表中数据用iat

直接修改一列

还有有一种方式是直接标量,列的数目要匹配不然会报错

2. pandas 快速入门二


空数据处理

制造一些缺失项
NaN是没有数据的

处理空数据的方法:
一是删除

二是替换

判断是否有空数据



空数据是不参与计算的

按行求平均值

累加值

广播的概念


df减去s s相当于一直横向扩展

apply的用法


自定义函数
返回的是数组的和

count和mode函数

首先创建一个数列

counts可以看出随机产生的每个数字有多少个

s.mode()产生最多的

数据合并


用iloc取数

把三部分合并

比较一下

还有一种合并的方法
先创建两个数据

left和right连接起来 通过key进行关联


在另一个数据合并的方法是
首先创建数据

插入一行数据

改变其中一个量,可以看到新插入的数据变化

分组

按照A来进行分组,foo一组bar一组,然后进行计算

分组也可以多个分组,先A 再B分小组
是一种双索引的结构

3. pandas 快速入门三


数据整形

数据整形就是把行和列的数据进行互换
首先是创建和索引

把列索引变成行索引


再使用unstack转换回来

再转换一次,它会把第二层索引转换成列

数据透视

数据透视是只看一部分
首先创建一个DataFrame

D的值,以C为列索引,AB为行索引

上面存在nan表示 在索引中再在原数组中数据是不存在的


时间序列



是不是像股票的交易量,每秒交易了多少
我们这是需要对大量的数据进行重新采样
用每两分钟求和的方式进行采样


除了data_range,还有period_range

转换成时间的格式

时间的计算

时间的加法

类别数据介绍
下面是一个学生分数等级

创建一个grade的列

这一列是一个category的数据


可以重新命名的

上面是根据值来排序的
下面是降序


数据可视化

然后我们要把数据画出来

数据载入和保存


保存到磁盘里

%ls进行查看

%more查看

然后读回来

指定索引列

大部分来自官网啦
还是要看看官网啊

【机器学习-数据科学】第二节:ipython开发环境搭建以及pandas快速入门相关推荐

  1. 第一课 第二节 集成开发环境

    1.IDE IDE--集成开发环境: 用于提供程序开发环境的应用程序,一般包括代码编辑器.编译器.调试器和图形用户界面工具.集成了代码编写功能.分析功能.编译功能.调试功能等一体化的开发软件服务套. ...

  2. 第二章 STC51开发环境搭建

     第二章 搭建开发环境 一.简介 本文介绍搭建开发环境 二.实验平台 单片机型号:STC12C5A60S2 编译软件:KEIL 硬件平台:达芬奇51开发版 三.版权声明 博主:文武先生 声明:喝水不忘 ...

  3. python上传数据到坚果云_django开发环境搭建(参考流程)

    对于一个初学者,在实际的开发环境中,应该采用什么的样的工具来开发django呢? 我想环境至少应该具备的特性有: 多版本python环境的支持 版本控制 自动测试框架 数据库支持迁移 部署的自动化 参 ...

  4. 3.机器学习—数据科学包3.2pandas基础

    pandas基础 一.pandas介绍 1.什么是pandas 2.pandas用途 3.课程内容 二.Ipython开发环境搭建 1.安装 2.新建运行环境 3.Ipython技巧 4.Ipytho ...

  5. 知识点总结Day01——JAVA基础知识、开发环境搭建、入门程序、常量、变量及数据类型

    目录 第一章 前言 一.Java概述 1.什么是Java 2.什么是编程语言 3.Java发展历史 二.计算机基础知识 1.二进制 2.字节 3.常见的DOS命令 第二章 Java开发环境搭建 一.搭 ...

  6. Android 应用开发(29)---android 开发环境搭建

    android 开发环境搭建 分类 Android 基础入门教程 现在主流的Android开发环境有: ①Eclipse + ADT + SDK ②Android Studio + SDK ③Inte ...

  7. 火云开发课堂 - 《使用Cocos2d-x 开发3D游戏》系列 第二节:Cocos引擎开发环境搭建与项目创建!

    <使用Cocos2d-x 开发3D游戏>系列在线课程 第二节:Cocos引擎开发环境搭建与项目创建! 视频地址:http://edu.csdn.net/course/detail/1330 ...

  8. 机器学习-数据科学库-day1

    机器学习-数据科学库-day1 机器学习-数据科学库-day1 matplotlib 机器学习-数据科学库-day1 数据分析课程包括: 基础概念与环境 matplotlib numpy pandas ...

  9. 机器学习---数据科学包-第2天

    1 pandas快速入门(一) .Series()方法.Series类型由一组数据及与之相关的数据索引组成. import pandas as pd import numpy as np s = pd ...

最新文章

  1. 记mac电脑下pycharm配置qt-creator开发环境
  2. 【PHP】Sublime下PHP网站开发指南
  3. deepin/ubuntu安装苹方字体
  4. Python 练习: 简单角色游戏程序
  5. 程序员一般都浏览这些网站,不仅仅提升编程水平!
  6. hdu 1261 字串数
  7. windows环境下使用virtualenv对python进行多版本隔离
  8. unity3d的uGUI基本操作
  9. 51nod1433--简单数学
  10. php 命令行扩展,PHP的命令行扩展Readline相关函数学习
  11. JAVA中Random分析
  12. 《Redis设计与实现》读书笔记
  13. 启动vpn报网络扩展错误(问题篇)
  14. 工业级Pass云平台SpringCloudAlibaba综合项目实战(二):解决方案和工作效率
  15. 使用谷歌浏览器自带的谷歌翻译提示“无法翻译此网页”
  16. php txt替换,文本替换专家批量替换TXT文本内容教程
  17. IDDD 实现领域驱动设计-SOA、REST 和六边形架构
  18. 董卿频上热搜的背后:阅读量之广令人惊叹,靠的不仅仅是坚持
  19. U盘产品如何做好软文推广利用软文来打造为产品引流宣传
  20. 太帅了!3分钟用ChatGPT生成一个美队的Logo图标!

热门文章

  1. 素数环 与 算法 全排列
  2. 单链表的初始化,整表创建,单个元素插入,单个元素删除,整表删除等操作...
  3. [笔记]Go语言写文件几种方式性能对比
  4. 生产者-消费者模式的实现
  5. redis事务的简单介绍
  6. wireshark抓包工具的使用及分析
  7. 感觉stm32太简单是一种自负吗?
  8. 漫画:什么是区块链?
  9. NLP——序列标注之命名实体识别
  10. mysql表单查询_表单查询实例