DataFrame的merge(合并)操作

首先

import numpy as np
import pandas as pd
from pandas import Series,DataFrame

创建df1 df2

df1 = DataFrame({'key':['X','Y','Z','X'],'data_set_1':[1,2,3,4]})
print(df1)
df2 = DataFrame({'key':['X','B','C'],'data_set_2':[4,5,6]})
print(df2)

显示df1 和 df2

合并操作…

print(pd.merge(df1,df2))
print(pd.merge(df1,df2,on = 'key',how = 'right'))
print(pd.merge(df1,df2,on = 'key',how = 'left'))

Concatenate和combine

创建arr1和arr2

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
arr1 = np.arange(9).reshape(3,3)
print(arr1)
arr2 = np.arange(9).reshape(3,3)
print(arr2)


竖着连接,增加行数

print(np.concatenate([arr1,arr2]))#

结果

横着连接,增加列数

print(np.concatenate([arr1,arr2],axis=1))


创建Series并且进行两种方向的连接

s1 = Series([1,2,3],index=['X','Y','Z'])
print(s1)
s2 = Series([4,5],index=['A','B'])
print(s2)

print(pd.concat([s1,s2]))


另一个方向的连接

print(pd.concat([s1,s2],axis=1))


DataFrame的concat
创建

df1 = DataFrame(np.random.randn(4,3),columns=['X','Y','Z'])
print(df1)
df2 = DataFrame(np.random.randn(4,3),columns=['X','Y','A'])
print(df2)


连接

print(pd.concat([df1,df2]))


横着连接

print(pd.concat([df1,df2],axis=1))


第二个操作Combine(填充)

s1 = Series([2,np.nan,4,np.nan],index=['A','B','C','D'])
print(s1)
s2 = Series([1,2,3,4],index=['A','B','C','D'])
print(s2)


用s2去填充s1,如过s1对应位置空则填充,否则保持s1

print(s1.combine_first(s2))#用S2去填充S1


DataFrame

df1 = DataFrame({'X':[1,np.nan,3,np.nan],'Y':[5,np.nan,7,np.nan],'Z':[9,np.nan,11,np.nan]
})
print(df1)
df2 = DataFrame({'Z':[np.nan,10,np.nan,12],'A':[1,2,3,4]
})
print(df2)
print(df1.combine_first(df2))

用z和A去填充…

数据科学入门与实战:玩转pandas之四相关推荐

  1. python3数据科学入门与实战_Python3学习之Python3数据科学入门与实战视频教程

    Python3学习之Python3数据科学入门与实战视频教程 Python3数据科学入门与实战 这是一个数据驱动的时代,想要从事机器学习.人工智能.数据挖掘等前沿技术,都离不开数据跟踪,本课程通过Nu ...

  2. 数据科学入门与实战:玩转pandas实战项目分析航班晚点情况

    引入相关包 import numpy as np import pandas as pd from pandas import DataFrame,Series 读取数据文件 df = pd.read ...

  3. 数据科学入门与实战:玩转pandas之七数据透视

    数据透视 引入相关包 #透视表 import numpy as np import pandas as pd from pandas import DataFrame,Series 看看- df = ...

  4. 数据科学入门与实战:玩转pandas之七数据分箱技术,分组技术,聚合技术

    首先导入相关包 import pandas as pd import numpy as np from pandas import Series,DataFrame #数据分箱技术Binning 数据 ...

  5. 数据科学入门与实战:玩转pandas之六时间序列

    时间序列的操作基础 首先引入相关的包 import numpy as np import pandas as pd from pandas import Series,DataFrame from d ...

  6. 数据科学入门与实战:玩转pandas之五

    通过apply进行数据预处理 首先读入csv文件 df = pd.read_csv('apply_demo.csv') print(df.head()) 看看规模 print(df.size) 创建新 ...

  7. 数据科学入门与实战:玩转pandas之二

    Series,DateFrame的排序功能 引入相关的包 import numpy as np import pandas as pd from pandas import Series,DataFr ...

  8. 数据科学入门与实战:玩转pandas之三

    重命名DataFrame的Index 引入包 import numpy as np import pandas as pd from pandas import Series,DataFrame 创建 ...

  9. 数据科学入门与实战:玩转pandas之一

    首先引入相关的包 import numpy as np import pandas as pd from pandas import Series,DataFrame Serious的运算 创建两个S ...

最新文章

  1. 参数整定临界比例度实验_控制算法手记自动整定方法初步
  2. Spark On K8S(Standalone模式部署)
  3. python编程与下位机通讯_ros 与下位机通信
  4. Redis 多机多节点集群搭建方案(5.0版本)
  5. java并发之CopyOnWirteArrayList
  6. Python基础——import(导入模块)
  7. 使用javaGUI编写检测是否有网
  8. Mac 上设置文件共享教程
  9. 4.名词性从句的起源与本质
  10. 晶圆划片如何提高切割品质?陆芯半导体告诉你
  11. 史上最全的Nokia3250参数
  12. python生成动态二维码
  13. 付费的「小密圈」值不值得我们加入呢?
  14. 技术出身能做好管理吗?——能!
  15. 基于用户协同过滤算法的电影打分与推荐
  16. linux mysql scripts_linux安装mysql时执行scripts/mysql_install_db报错如何解决?
  17. IT研发技能表v3.1
  18. python graphx_如何使用Python/pyspark运行graphx?
  19. QSS样式表之PS黑色风格+白色风格+淡蓝色风格(开源)
  20. 免费的文档翻译软件有什么?这些软件值得收藏

热门文章

  1. 【BZOJ4008】亚瑟王,概率DP
  2. nmmqq.php?/lspc.html,html中的图片直接使用base64编码后的字符串代替详解
  3. bzoj1066 [SCOI2007]蜥蜴 网络流复制点模型
  4. 2017.9.12 连通数 失败总结
  5. 【英语学习】【Level 07】U04 Rest and Relaxation L6 Your home away from home
  6. 个人知识整理(javascript篇初识)
  7. MySQL令人咋舌的隐式转换
  8. java filter 回调_Java 异步回调机制实例分析
  9. SPH(光滑粒子流体动力学)流体模拟实现二:SPH算法(1)-数学原理
  10. linux程序只监听了ipv6端口,c-在Linux上侦听IPv6多播