pandas数据分析读书笔记(三)
Df.map(),参数里可以传入一个函数或者有映射关系的字典型对象
Df.replace(, ),将某个值替换成另外一个值,可以一次性替换多个值,可以每个值都有不同的替换值,传入的参数也可以是字典
Pd.rename(index = str.title, columns = str.upper),重命名轴索引,这里的index设置为原有index首字母为大写,columns设置为原有的全部大写
Pd.cut(bins, labels),将数据进行划分,划分的依据是bins,比如bins如果为[18, 25, 35, 60, 100],那么就是前开后闭,labels参数,是用来设置面元名称的,如果传入的是面元的数量,那会根据数据的最小值和最大值计算等长分割
Pd.qcut(),可以根据分位数对数据进行划分,这个就是每个划分都有相同的频数,需要传入的划分数,也可以支持传入自定义的分位数,如[0, 0.1, 0.5, 0.9, 1.]
Np.sign(),符号函数
Np.random.permutation(),产生一个表示新顺序的整数数组
Df.take(),获取数据
Df.sample(n = 3, replace = True),选取随机子集,replace参数,是否有放回的取数据
Pd.get_dummies(df[‘key’], prefix = ‘key’),将分类变量转换成“哑变量”,prefix参数为将DataFrame列加上一个前缀,df_with_dummy = df[[‘data1’]].join(dummies)
Pd.unique(),返回不重复的值
Pd.get_dummies(pd.cut(values, bins)),get_dummies和cut组合操作
‘::’.join(pieces),用两个冒号把所有元素和连起来
Python内置字符串方法:
Count:返回子串在字符串中的出现次数
Endswith、startswith:如果字符串以某个后缀结尾,返回True
Join:将字符串连接其他字符串序列
Index:如果字符串中找到子串,返回第一个字符所在的位置,如果没有返回-1
Find:返回第一个发现的子串的第一个字符所在的位置,如果没有返回-1
Rfind:返回最后一个发现的子串的第一个字符所在的位置,没有返回-1
Repalce:用另一个字符串替代指定子串
Strip,rstrip,lstrip,出去空白符(包括换行)
Split,通过指定的分隔符拆分为一串子串
lower,upper,分别将字符串转换为大写和小写
Ljust,rjust,用空格填充字符串的空白
Ser.str.contains(‘gmail’),判断是否含有字符串
层次化索引,
Df.unstack(),将层次化索引解开
df.stack(),转化为层次化索引
Df.swaplevel(‘key1’, ‘key2’),将这两个层更换顺序
Df.sort_index(level = 1),根据层次1进行排序
Frame.swaplevel(0, 1).sort_index(level = 0)
Frame.sum(level = ‘key2’),根据某层进行汇总统计
Df.set_index([‘a’, ‘d’], drop = True),将一个或者多个列转换为行索引,并且会创建一个新的DataFrame,drop参数是是否把那些列删除,False表示不删除,保留下来
Df.reset_index(),将层次化的索引转移到列里面
pandas数据分析读书笔记(三)相关推荐
- pandas数据分析读书笔记(四)
Pd.merge(left = df1, right = df2, on = 'key', left_on = 'lkey', right_on = 'rkey', how = 'inner', su ...
- 深入浅出数据分析读书笔记
深入浅出数据分析读书笔记 一.数据分析引言 1.数据分析的基本流程:确定--分解--评估--决策.一个完整的分析项目可能经过多轮流程 确定:客户的论点和数据 分解:将手头的资料汇总为有用的格式 评估: ...
- mysql数据库权威指南_MySQL_MySQL权威指南读书笔记(三),第二章:MYSQL数据库里面的数 - phpStudy...
MySQL权威指南读书笔记(三) 第二章:MYSQL数据库里面的数据 用想用好MYSQL,就必须透彻理解MYSQL是如何看待和处理数据的.本章主要讨论了两个问题:一是SQL所能处理的数据值的类型:二是 ...
- 《编程之美》读书笔记(三):烙饼问题与搜索树
<编程之美>读书笔记三:烙饼问题与搜索树 薛笛 EMail:jxuedi#gmail.com 前面已经写了一些关于烙饼问题的简单分析,但因为那天太累有些意犹未尽,今天再充实一些内容那这个问 ...
- 《How Tomcat Works》读书笔记(三)--Connector(连接器)
<How Tomcat Works>读书笔记(三)--Connector(连接器) 这是<How Tomcat Works>第三四章的读书笔记.主要写了Tomcat4.0默认的 ...
- TCPIP详解Protocol 读书笔记(三) IP协议讲解
TCP/IP详解:Protocol 读书笔记(三) Chapter3 IP:网际协议 文章目录 TCP/IP详解:Protocol 读书笔记(三) Chapter3 IP:网际协议 IP协议 IP数据 ...
- 《大型网站技术架构》读书笔记三:大型网站核心架构要素
来源:http://www.cnblogs.com/edisonchou/p/3806348.html 此篇已收录至<大型网站技术架构>读书笔记系列目录贴,点击访问该目录可获取更多内容. ...
- 《淘宝技术这十年》读书笔记 (三). 创造技术TFS和Tair
前面两篇文章介绍了淘宝的发展历程和Java时代的变迁: <淘宝技术这十年>读书笔记 (一).淘宝网技术简介及来源 <淘宝技术这十年&g ...
- Spring揭秘 读书笔记 三 bean的scope与FactoryBean
本书可作为王富强所著<<Spring揭秘>>一书的读书笔记 第四章 BeanFactory的xml之旅 bean的scope scope有时被翻译为"作用域&quo ...
最新文章
- Microbiome: 绝对定量环境样本细菌、真菌、真核群落丰度
- php源码十六进制加密,php-简单对称加密算法和字符串与十六进制之间的互转函数,php-十六进制_PHP教程...
- html入门学习(二)
- AIX系统CPU监控与评估
- 一次对路边饮用水RFID供应机的跑路玩法
- LeetCode 1536. 排布二进制网格的最少交换次数
- android用户登录volley,如何在Android上使用Volley进行基本身份验证?
- 【Hbase】命令行load数据文件到Hbase
- python实用案例教程第四章答案_python 入门到实践第四章案例
- 天津电动自行车外贸出口认证GCC合格证
- DSPE-PEG10-Mal可以提供不同分子量的PEG衍生物
- python 10个100以内随机整数编辑_Python在小学数学中的应用
- PLSQL创建表空间的方法
- 常用的关于表格的属性和函数
- 计算机英语第五版翻译,计算机专业英语教程第5版翻译
- git——04 远程仓库/标签/别名
- Rethink Robotics推出Sawyer智能协作机器人软件开发工具包
- 六月的天空,飘过大片云朵,抬头仰望,心中的那一抹温柔
- 321电分——各种不对称短路时故障处的短路电流和电压
- c语言 bnf,BNF
热门文章
- 每秒处理10万订单乐视集团支付架构读后感
- linux bmp图片怎么转换成ppm,[转载]图片解析 ppm图片bmp图片格式
- mysql client 使用_mysqlclient怎么使用
- 分布式系统(三) 分布式事务服务搭建
- matlab创新开放性实验,基于MATLAB 的自动控制原理实验仿真系统的设计
- 网上千万不要在非官方直营店铺买的商品排行榜
- Django REST framework+Vue 打造生鲜超市(二)
- DLL文件是什么东东?
- Linux查看进程 ps aux指令详解
- 计算机专业学生 | 要尝试去学会阅读源码,它能让你学会很多!