Df.map(),参数里可以传入一个函数或者有映射关系的字典型对象

Df.replace(, ),将某个值替换成另外一个值,可以一次性替换多个值,可以每个值都有不同的替换值,传入的参数也可以是字典

Pd.rename(index = str.title, columns = str.upper),重命名轴索引,这里的index设置为原有index首字母为大写,columns设置为原有的全部大写

Pd.cut(bins, labels),将数据进行划分,划分的依据是bins,比如bins如果为[18, 25, 35, 60, 100],那么就是前开后闭,labels参数,是用来设置面元名称的,如果传入的是面元的数量,那会根据数据的最小值和最大值计算等长分割

Pd.qcut(),可以根据分位数对数据进行划分,这个就是每个划分都有相同的频数,需要传入的划分数,也可以支持传入自定义的分位数,如[0, 0.1, 0.5, 0.9, 1.]

Np.sign(),符号函数

Np.random.permutation(),产生一个表示新顺序的整数数组

Df.take(),获取数据

Df.sample(n = 3, replace = True),选取随机子集,replace参数,是否有放回的取数据

Pd.get_dummies(df[‘key’],  prefix = ‘key’),将分类变量转换成“哑变量”,prefix参数为将DataFrame列加上一个前缀,df_with_dummy = df[[‘data1’]].join(dummies)

Pd.unique(),返回不重复的值

Pd.get_dummies(pd.cut(values, bins)),get_dummies和cut组合操作

‘::’.join(pieces),用两个冒号把所有元素和连起来

Python内置字符串方法:

Count:返回子串在字符串中的出现次数

Endswith、startswith:如果字符串以某个后缀结尾,返回True

Join:将字符串连接其他字符串序列

Index:如果字符串中找到子串,返回第一个字符所在的位置,如果没有返回-1

Find:返回第一个发现的子串的第一个字符所在的位置,如果没有返回-1

Rfind:返回最后一个发现的子串的第一个字符所在的位置,没有返回-1

Repalce:用另一个字符串替代指定子串

Strip,rstrip,lstrip,出去空白符(包括换行)

Split,通过指定的分隔符拆分为一串子串

lower,upper,分别将字符串转换为大写和小写

Ljust,rjust,用空格填充字符串的空白

Ser.str.contains(‘gmail’),判断是否含有字符串

层次化索引,

Df.unstack(),将层次化索引解开

df.stack(),转化为层次化索引

Df.swaplevel(‘key1’, ‘key2’),将这两个层更换顺序

Df.sort_index(level = 1),根据层次1进行排序

Frame.swaplevel(0, 1).sort_index(level = 0)

Frame.sum(level = ‘key2’),根据某层进行汇总统计

Df.set_index([‘a’, ‘d’], drop = True),将一个或者多个列转换为行索引,并且会创建一个新的DataFrame,drop参数是是否把那些列删除,False表示不删除,保留下来

Df.reset_index(),将层次化的索引转移到列里面

pandas数据分析读书笔记(三)相关推荐

  1. pandas数据分析读书笔记(四)

    Pd.merge(left = df1, right = df2, on = 'key', left_on = 'lkey', right_on = 'rkey', how = 'inner', su ...

  2. 深入浅出数据分析读书笔记

    深入浅出数据分析读书笔记 一.数据分析引言 1.数据分析的基本流程:确定--分解--评估--决策.一个完整的分析项目可能经过多轮流程 确定:客户的论点和数据 分解:将手头的资料汇总为有用的格式 评估: ...

  3. mysql数据库权威指南_MySQL_MySQL权威指南读书笔记(三),第二章:MYSQL数据库里面的数 - phpStudy...

    MySQL权威指南读书笔记(三) 第二章:MYSQL数据库里面的数据 用想用好MYSQL,就必须透彻理解MYSQL是如何看待和处理数据的.本章主要讨论了两个问题:一是SQL所能处理的数据值的类型:二是 ...

  4. 《编程之美》读书笔记(三):烙饼问题与搜索树

    <编程之美>读书笔记三:烙饼问题与搜索树 薛笛 EMail:jxuedi#gmail.com 前面已经写了一些关于烙饼问题的简单分析,但因为那天太累有些意犹未尽,今天再充实一些内容那这个问 ...

  5. 《How Tomcat Works》读书笔记(三)--Connector(连接器)

    <How Tomcat Works>读书笔记(三)--Connector(连接器) 这是<How Tomcat Works>第三四章的读书笔记.主要写了Tomcat4.0默认的 ...

  6. TCPIP详解Protocol 读书笔记(三) IP协议讲解

    TCP/IP详解:Protocol 读书笔记(三) Chapter3 IP:网际协议 文章目录 TCP/IP详解:Protocol 读书笔记(三) Chapter3 IP:网际协议 IP协议 IP数据 ...

  7. 《大型网站技术架构》读书笔记三:大型网站核心架构要素

    来源:http://www.cnblogs.com/edisonchou/p/3806348.html 此篇已收录至<大型网站技术架构>读书笔记系列目录贴,点击访问该目录可获取更多内容. ...

  8. 《淘宝技术这十年》读书笔记 (三). 创造技术TFS和Tair

    前面两篇文章介绍了淘宝的发展历程和Java时代的变迁:             <淘宝技术这十年>读书笔记 (一).淘宝网技术简介及来源             <淘宝技术这十年&g ...

  9. Spring揭秘 读书笔记 三 bean的scope与FactoryBean

    本书可作为王富强所著<<Spring揭秘>>一书的读书笔记  第四章 BeanFactory的xml之旅 bean的scope scope有时被翻译为"作用域&quo ...

最新文章

  1. Microbiome: 绝对定量环境样本细菌、真菌、真核群落丰度
  2. php源码十六进制加密,php-简单对称加密算法和字符串与十六进制之间的互转函数,php-十六进制_PHP教程...
  3. html入门学习(二)
  4. AIX系统CPU监控与评估
  5. 一次对路边饮用水RFID供应机的跑路玩法
  6. LeetCode 1536. 排布二进制网格的最少交换次数
  7. android用户登录volley,如何在Android上使用Volley进行基本身份验证?
  8. 【Hbase】命令行load数据文件到Hbase
  9. python实用案例教程第四章答案_python 入门到实践第四章案例
  10. 天津电动自行车外贸出口认证GCC合格证
  11. DSPE-PEG10-Mal可以提供不同分子量的PEG衍生物
  12. python 10个100以内随机整数编辑_Python在小学数学中的应用
  13. PLSQL创建表空间的方法
  14. 常用的关于表格的属性和函数
  15. 计算机英语第五版翻译,计算机专业英语教程第5版翻译
  16. git——04 远程仓库/标签/别名
  17. Rethink Robotics推出Sawyer智能协作机器人软件开发工具包
  18. 六月的天空,飘过大片云朵,抬头仰望,心中的那一抹温柔
  19. 321电分——各种不对称短路时故障处的短路电流和电压
  20. c语言 bnf,BNF

热门文章

  1. 每秒处理10万订单乐视集团支付架构读后感
  2. linux bmp图片怎么转换成ppm,[转载]图片解析 ppm图片bmp图片格式
  3. mysql client 使用_mysqlclient怎么使用
  4. 分布式系统(三) 分布式事务服务搭建
  5. matlab创新开放性实验,基于MATLAB 的自动控制原理实验仿真系统的设计
  6. 网上千万不要在非官方直营店铺买的商品排行榜
  7. Django REST framework+Vue 打造生鲜超市(二)
  8. DLL文件是什么东东?
  9. Linux查看进程 ps aux指令详解
  10. 计算机专业学生 | 要尝试去学会阅读源码,它能让你学会很多!