数据分析基础——数据规整
一.数据连接
pd.merge(left,right)
将left和right进行含相同的部分进行合并,然后进行连接
pd.merge(left,right,one=['key1','key2'])
指定多个键进行合并
pd.merge(left,right,how='outer',one=['key1','key2'])
outer:全连接为并集
默认为inner 交集
pd.merge(left,right,,right_index=True)
根据索引连接将右侧行索引用来连接
二.数据合并
pd.concat()
沿轴方向将多个对象合并在一起
axis=0默认
join 合并方式为outer
series 合并时查看行索引有无重复
三.重塑和轴向旋转
data.stack()
将DataFrame对象变成series将列索引旋转为行索引,完成层级索引
r.unstack()
将层级索引展开,series->DataFrame 默认操作内层索引,即level=1
数据分析基础——数据规整相关推荐
- 利用Python进行数据分析:数据规整(基于DataFrame)
利用Python进行数据分析:数据规整 在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析.本部分关注可以聚合.合并.重塑数据的方法. 文章目录 利用Python进行数据分析:数据 ...
- Python数据分析—Pandas数据规整
数据规整 一.索引 二.分层索引 三.数据合并 1.merge方法 2.join方法 3.concat方法 四.数据分组与聚合 一.索引 # 查看索引 df.index # 指定索引,但个数必须保持一 ...
- Python数据分析6——数据规整
目录 索引与分层索引 索引 分层索引 分层索引的切片 数据重塑 数据合并 merge() join() concat() 数据的分组与聚合 自定义聚合函数 数据透视表 索引与分层索引 索引 查看索引: ...
- 利用python进入数据分析之数据规整化:清理、转换、合并、重塑(二)
数据转换 移除重复数据 In [106]: data = DataFrame({'k1': ['one'] * 3 + ['two'] * 4,'k2': [1, 1, 2, 3, 3, 4, 4]} ...
- 利用Python数据分析:数据规整化(五)
import pandas as pd from pandas import Series,DataFrame import numpy as np import re # 计算指标/哑变量(dumm ...
- 类的应用python平均分_【数据科学系统学习】Python # 数据分析基本操作[四] 数据规整化和数据聚合与分组运算...
本篇内容为整理<利用Python进行数据分析>,博主使用代码为 Python3,部分内容和书本有出入. 在前几篇中我们介绍了 NumPy.pandas.matplotlib 三个库的基本操 ...
- 数据规整:连接、联合与重塑(数据分析)
目录 第8章 数据规整:连接.联合与重塑 8.1 分层索引 8.1.1 重排序和层级排序 8.1.2 按层级进行汇总统计 8.1.3 使用DataFrame的列进行索引 8.2 联合与合并数据集 8. ...
- python dataframe groupby_【Python数据分析基础】入坑必备的数据预处理操作
本文解决的是2类目标业务: 有数据不知道怎么做数据分析操作的. 自己有思路不知道怎么落地实现的. Python数据分析基础必用品 office软件(推荐2016版) Python开发环境(推荐Anac ...
- swiper 滚回第一个数据_名企必备的数据分析基础技能:Python大法(一)
现如今,大数据的发展越来越好,也越来越多的企业中大数据分析已经朝着更好的方向发展.也正是因为这个原因,数据分析行业的人才需求也变得火爆起来,尤其是数据分析.数据挖掘.数据科学家等高端人才,越来越稀缺. ...
最新文章
- 程序员大危机,工作难逃监视系统“法眼”!
- 30段极简Python代码:这些小技巧你都Get了么
- clickhouse集群表删除_携程用ClickHouse轻松玩转每天十亿级数据更新
- yjv是电缆还是电线_BVV属于电线还是电缆?
- win10诊断启动后联网_小技巧:win10网络共享文件夹出现错误无法访问如何解决?...
- 集卡php源码,独角数卡自动发卡网PHP源码+教程:虚拟产品自助售卖
- WPF TextBox只能输入数字
- 面试官系统精讲Java源码及大厂真题 - 20 SynchronousQueue 源码解析
- 毕设日志——linux服务器anaconda下安装caffe
- 初三中考比一模能提高多少分?
- PAT 1074. 宇宙无敌加法器(20)-PAT乙级真题
- 使用微信JSSDK自定义微信分享标题、描述、和图标
- Tomcat优化之配置线程池高并发连接
- python切片详解_python切片及sys.argv[]用法详解
- 1-7华为HCNA认证eNSP基础B
- php mysql 博客,PHP操作MySQL
- Android零基础入门第18节:EditText的属性和使用方法
- ic卡识别程序c语言,求ID/IC卡的原理与C语言读取程序?
- 跨省游恢复,首旅如家发布暑期16座旅游目的地城市攻略
- 国内学生该怎么学好A-Level数学?