Pandas的基本操作
基本都是关于DataFrame的
1. 读取数据
score_df = pd.read_csv('D:\\task1\Data\cleaned\\text', sep='\t', header=None)
不写header表示列名为第一行
注意地址中有转义字符的话需要双斜杠。比如'\t''\r'.
2. 更改、添加列名
score_df.columns = ['A', 'B', 'C'] # 注意该方法需要写全列名
score_df.rename(columns = {'A':'a', 'C':'c'}, inplace = True)
3. 合并DataFrame(以某个key为连接)
m_tb = pd.merge(score_df, resp_df, how='inner', left_on='mobile', right_on='phone', left_index=False, right_index=False, \
sort=True, suffixes=('_x', '_y'), copy=True, indicator=False)
详情百度
4. 选取满足特定条件的行(组成一个新的DataFrame)
m_tb[(m_tb['result']==3) & (m_tb[1]==1)]
5. 做列联表,两种方法
pd.crosstab(np.array(y_range), np.array(age_range))test_pd = pd.merge(pd.DataFrame(y_range, columns = ['salary_range']), pd.DataFrame(age_range, columns = ['age_range']),left_index=True, right_index=True)
test_pd.groupby(by = ['age_range', 'salary_range']).agg(len).unstack()
6. 选取特定值
dataframe[b][dataframe[a]==1].values[0]
7. 对特定的列做计算
contact_sample['new_order'] = contact_sample['raw_list'].apply(lambda x: sort_contact(x))
contact_sample[['new_order', 'add_list', 'add_cnt']] = contact_sample[['raw_list', 'original_order']].apply(lambda x: sort_contact(x[0], x[1]), axis = 1)transform_df=sample_df.groupby('TenantId')['TotalSize'].transform(lambda x: (x - x.mean()) / x.std())
Pandas的基本操作相关推荐
- python中的pandas的两种基本使用_Python:Pandas的基本操作和使用
Pandas整体内容概要 本文整体介绍 Pands的数据结构 Pands的读取与保存 数据的基本操作:数据的查看.检查.选择.删减.填充 数据的处理:合并.聚合.分组.filter.sort.grou ...
- Pandas索引基本操作
公众号:尤而小屋 作者:Peter 编辑:Peter 大家好,我是Peter~ 本文主要是记录Pandas中单层索引的一些基本操作. 10种索引 下面简单回顾下之前学习创建的10种索引: pd.Ind ...
- 【Python学习系列二十一】pandas库基本操作
pandas很强大,操作参考官网:http://pandas.pydata.org/pandas-docs/stable/ 也有一份10分钟入门的材料:http://pandas.pydata.org ...
- 【Pandas】数据分析工具Pandas的基本操作和可视化工具Matplotlib
1.Pandas简介 pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的 ...
- python炒股模块_Python数据分析-numpy模块、pandas模块.基本操作、股票案例
索引操作和列表同理 arr = np.random.randint(0,100,size=(5,6)) arr array([[14, 89, 71, 96, 1, 94], [30, 98, 10, ...
- Pandas的基本操作以及画图
1.读取文件操作 读取文件 data = pd.read_csv('./data/stock_day.csv') 删除一些列,让数据更简单些,再去做后面的操作 data = data.drop([&q ...
- Pandas快速上手(一):基本操作
本文包含一些 Pandas 的基本操作,旨在快速上手 Pandas 的基本操作. 读者最好有 NumPy 的基础,如果你还不熟悉 NumPy,建议您阅读NumPy基本操作快速熟悉. Pandas 数据 ...
- 【机器学习】Pandas练习题-提高你的数据分析技能
本文总结了pandas的常用操作,并做成练习题,练习题附答案,并且有完整数据集,建议读者把练习题完成.作者认为,做完练习题,pandas的基本操作没有问题了,以后碰到问题也可以查这些习题.(文末提供下 ...
- 简约而不简单|值得收藏的Pandas基本操作指南
Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.pandas提供了大量能使我们快 ...
- AI基础:Pandas简易入门
Pandas 简易入门 0.导语 pandas 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工 ...
最新文章
- sql列转行函数oracle,SQL列转行
- [转]英语飙升的好方法
- clear session on close of browser jsp
- 微服务是否使SOA变得无关紧要?
- 双linux grub rescue,Grub Rescue修复方法
- 多线程编程之一——问题提出
- OpenShift 4 - 部署 RabbitMQ 集群
- 开菜鸟驿站需要什么条件?投入成本大概要多少?
- 关于springboot集成redis及关于redis的Key 乱码问题
- flume channel monitor实现源码分析
- python属性查找 深入理解(attribute lookup)
- linux下的文件结构
- 实习成长之路——设计模式实战二:如何使用面向对象的思想设计一个功能需求?接口鉴权怎么用面向对象分析实现?
- Linux centosVMware mysql用户管理、常用sql语句、mysql数据库备份恢复
- 蓝桥杯官网练习系统基础练习(八)
- 爬虫练习生|爬虫前奏(爬虫介绍、工具的安装、爬虫分类、爬虫须知)
- 日更第17天:Linux常用命令之ps用法
- 阿凡题——智慧的背囊
- 如何清理Android应用缓存
- CAD梦想画图中的的“绘图工具——绘线命令”
热门文章
- 无人机倾斜摄影三维建模技术在智慧城市中的应用
- C语言链表详解(通俗易懂,超详细)
- zcu102_14_Zynq在Standalone下使用uGUI
- 系统漏洞是威胁计算机网络安全的形式,系统漏洞是威胁计算机网络安全的形式_网络 安全 银行 漏洞 川企_https 安全受到 威胁(2)...
- 音频特效生成与算法 2
- 微信小程序:全新圣诞节头像框制作生成微信小程序源码下载支持多模板
- ESP8266制作4G智能无人车按下前进松手即停和转弯调速的方案代码
- matplotlib常用图形
- 计算机网络实验-路由器IP地址配置及直连网络和ARP协议分析
- [LOJ6437][计算几何]PKUSC2018:PKUSC