一.数据连接

pd.merge(left,right)

将left和right进行含相同的部分进行合并,然后进行连接

pd.merge(left,right,one=['key1','key2'])

指定多个键进行合并

pd.merge(left,right,how='outer',one=['key1','key2'])

outer:全连接为并集

默认为inner 交集

pd.merge(left,right,,right_index=True)

根据索引连接将右侧行索引用来连接

二.数据合并

pd.concat()

沿轴方向将多个对象合并在一起

axis=0默认

join 合并方式为outer

series 合并时查看行索引有无重复

三.重塑和轴向旋转

data.stack()

将DataFrame对象变成series将列索引旋转为行索引,完成层级索引

r.unstack()

将层级索引展开,series->DataFrame 默认操作内层索引,即level=1

数据分析基础——数据规整相关推荐

  1. 利用Python进行数据分析:数据规整(基于DataFrame)

    利用Python进行数据分析:数据规整 在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析.本部分关注可以聚合.合并.重塑数据的方法. 文章目录 利用Python进行数据分析:数据 ...

  2. Python数据分析—Pandas数据规整

    数据规整 一.索引 二.分层索引 三.数据合并 1.merge方法 2.join方法 3.concat方法 四.数据分组与聚合 一.索引 # 查看索引 df.index # 指定索引,但个数必须保持一 ...

  3. Python数据分析6——数据规整

    目录 索引与分层索引 索引 分层索引 分层索引的切片 数据重塑 数据合并 merge() join() concat() 数据的分组与聚合 自定义聚合函数 数据透视表 索引与分层索引 索引 查看索引: ...

  4. 利用python进入数据分析之数据规整化:清理、转换、合并、重塑(二)

    数据转换 移除重复数据 In [106]: data = DataFrame({'k1': ['one'] * 3 + ['two'] * 4,'k2': [1, 1, 2, 3, 3, 4, 4]} ...

  5. 利用Python数据分析:数据规整化(五)

    import pandas as pd from pandas import Series,DataFrame import numpy as np import re # 计算指标/哑变量(dumm ...

  6. 类的应用python平均分_【数据科学系统学习】Python # 数据分析基本操作[四] 数据规整化和数据聚合与分组运算...

    本篇内容为整理<利用Python进行数据分析>,博主使用代码为 Python3,部分内容和书本有出入. 在前几篇中我们介绍了 NumPy.pandas.matplotlib 三个库的基本操 ...

  7. 数据规整:连接、联合与重塑(数据分析)

    目录 第8章 数据规整:连接.联合与重塑 8.1 分层索引 8.1.1 重排序和层级排序 8.1.2 按层级进行汇总统计 8.1.3 使用DataFrame的列进行索引 8.2 联合与合并数据集 8. ...

  8. python dataframe groupby_【Python数据分析基础】入坑必备的数据预处理操作

    本文解决的是2类目标业务: 有数据不知道怎么做数据分析操作的. 自己有思路不知道怎么落地实现的. Python数据分析基础必用品 office软件(推荐2016版) Python开发环境(推荐Anac ...

  9. swiper 滚回第一个数据_名企必备的数据分析基础技能:Python大法(一)

    现如今,大数据的发展越来越好,也越来越多的企业中大数据分析已经朝着更好的方向发展.也正是因为这个原因,数据分析行业的人才需求也变得火爆起来,尤其是数据分析.数据挖掘.数据科学家等高端人才,越来越稀缺. ...

最新文章

  1. 程序员大危机,工作难逃监视系统“法眼”!
  2. 30段极简Python代码:这些小技巧你都Get了么
  3. clickhouse集群表删除_携程用ClickHouse轻松玩转每天十亿级数据更新
  4. yjv是电缆还是电线_BVV属于电线还是电缆?
  5. win10诊断启动后联网_小技巧:win10网络共享文件夹出现错误无法访问如何解决?...
  6. 集卡php源码,独角数卡自动发卡网PHP源码+教程:虚拟产品自助售卖
  7. WPF TextBox只能输入数字
  8. 面试官系统精讲Java源码及大厂真题 - 20 SynchronousQueue 源码解析
  9. 毕设日志——linux服务器anaconda下安装caffe
  10. 初三中考比一模能提高多少分?
  11. PAT 1074. 宇宙无敌加法器(20)-PAT乙级真题
  12. 使用微信JSSDK自定义微信分享标题、描述、和图标
  13. Tomcat优化之配置线程池高并发连接
  14. python切片详解_python切片及sys.argv[]用法详解
  15. 1-7华为HCNA认证eNSP基础B
  16. php mysql 博客,PHP操作MySQL
  17. Android零基础入门第18节:EditText的属性和使用方法
  18. ic卡识别程序c语言,求ID/IC卡的原理与C语言读取程序?
  19. 跨省游恢复,首旅如家发布暑期16座旅游目的地城市攻略
  20. 国内学生该怎么学好A-Level数学?

热门文章

  1. go使用交叉编译时,二进制文件运行不了,出现line 1: syntax error: unexpected newline
  2. 腾讯物联网系统TOS,内核移植起来比你想象的要简单
  3. LOX-8 Grease Paste tufoil fluoramics
  4. OCX 添加方法和事件
  5. 自考《操作系统概论》
  6. 如何去理解同花顺l2接口?
  7. python打印 字符串前面b
  8. MTK Android Driver:PMIC
  9. jquery中的循环技巧
  10. ●●●观世音菩萨●●●