数据科学入门与实战:玩转pandas之四
DataFrame的merge(合并)操作
首先
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
创建df1 df2
df1 = DataFrame({'key':['X','Y','Z','X'],'data_set_1':[1,2,3,4]})
print(df1)
df2 = DataFrame({'key':['X','B','C'],'data_set_2':[4,5,6]})
print(df2)
显示df1 和 df2
合并操作…
print(pd.merge(df1,df2))
print(pd.merge(df1,df2,on = 'key',how = 'right'))
print(pd.merge(df1,df2,on = 'key',how = 'left'))
Concatenate和combine
创建arr1和arr2
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
arr1 = np.arange(9).reshape(3,3)
print(arr1)
arr2 = np.arange(9).reshape(3,3)
print(arr2)
竖着连接,增加行数
print(np.concatenate([arr1,arr2]))#
结果
横着连接,增加列数
print(np.concatenate([arr1,arr2],axis=1))
创建Series并且进行两种方向的连接
s1 = Series([1,2,3],index=['X','Y','Z'])
print(s1)
s2 = Series([4,5],index=['A','B'])
print(s2)
print(pd.concat([s1,s2]))
另一个方向的连接
print(pd.concat([s1,s2],axis=1))
DataFrame的concat
创建
df1 = DataFrame(np.random.randn(4,3),columns=['X','Y','Z'])
print(df1)
df2 = DataFrame(np.random.randn(4,3),columns=['X','Y','A'])
print(df2)
连接
print(pd.concat([df1,df2]))
横着连接
print(pd.concat([df1,df2],axis=1))
第二个操作Combine(填充)
s1 = Series([2,np.nan,4,np.nan],index=['A','B','C','D'])
print(s1)
s2 = Series([1,2,3,4],index=['A','B','C','D'])
print(s2)
用s2去填充s1,如过s1对应位置空则填充,否则保持s1
print(s1.combine_first(s2))#用S2去填充S1
DataFrame
df1 = DataFrame({'X':[1,np.nan,3,np.nan],'Y':[5,np.nan,7,np.nan],'Z':[9,np.nan,11,np.nan]
})
print(df1)
df2 = DataFrame({'Z':[np.nan,10,np.nan,12],'A':[1,2,3,4]
})
print(df2)
print(df1.combine_first(df2))
用z和A去填充…
数据科学入门与实战:玩转pandas之四相关推荐
- python3数据科学入门与实战_Python3学习之Python3数据科学入门与实战视频教程
Python3学习之Python3数据科学入门与实战视频教程 Python3数据科学入门与实战 这是一个数据驱动的时代,想要从事机器学习.人工智能.数据挖掘等前沿技术,都离不开数据跟踪,本课程通过Nu ...
- 数据科学入门与实战:玩转pandas实战项目分析航班晚点情况
引入相关包 import numpy as np import pandas as pd from pandas import DataFrame,Series 读取数据文件 df = pd.read ...
- 数据科学入门与实战:玩转pandas之七数据透视
数据透视 引入相关包 #透视表 import numpy as np import pandas as pd from pandas import DataFrame,Series 看看- df = ...
- 数据科学入门与实战:玩转pandas之七数据分箱技术,分组技术,聚合技术
首先导入相关包 import pandas as pd import numpy as np from pandas import Series,DataFrame #数据分箱技术Binning 数据 ...
- 数据科学入门与实战:玩转pandas之六时间序列
时间序列的操作基础 首先引入相关的包 import numpy as np import pandas as pd from pandas import Series,DataFrame from d ...
- 数据科学入门与实战:玩转pandas之五
通过apply进行数据预处理 首先读入csv文件 df = pd.read_csv('apply_demo.csv') print(df.head()) 看看规模 print(df.size) 创建新 ...
- 数据科学入门与实战:玩转pandas之二
Series,DateFrame的排序功能 引入相关的包 import numpy as np import pandas as pd from pandas import Series,DataFr ...
- 数据科学入门与实战:玩转pandas之三
重命名DataFrame的Index 引入包 import numpy as np import pandas as pd from pandas import Series,DataFrame 创建 ...
- 数据科学入门与实战:玩转pandas之一
首先引入相关的包 import numpy as np import pandas as pd from pandas import Series,DataFrame Serious的运算 创建两个S ...
最新文章
- 参数整定临界比例度实验_控制算法手记自动整定方法初步
- Spark On K8S(Standalone模式部署)
- python编程与下位机通讯_ros 与下位机通信
- Redis 多机多节点集群搭建方案(5.0版本)
- java并发之CopyOnWirteArrayList
- Python基础——import(导入模块)
- 使用javaGUI编写检测是否有网
- Mac 上设置文件共享教程
- 4.名词性从句的起源与本质
- 晶圆划片如何提高切割品质?陆芯半导体告诉你
- 史上最全的Nokia3250参数
- python生成动态二维码
- 付费的「小密圈」值不值得我们加入呢?
- 技术出身能做好管理吗?——能!
- 基于用户协同过滤算法的电影打分与推荐
- linux mysql scripts_linux安装mysql时执行scripts/mysql_install_db报错如何解决?
- IT研发技能表v3.1
- python graphx_如何使用Python/pyspark运行graphx?
- QSS样式表之PS黑色风格+白色风格+淡蓝色风格(开源)
- 免费的文档翻译软件有什么?这些软件值得收藏
热门文章
- 【BZOJ4008】亚瑟王,概率DP
- nmmqq.php?/lspc.html,html中的图片直接使用base64编码后的字符串代替详解
- bzoj1066 [SCOI2007]蜥蜴 网络流复制点模型
- 2017.9.12 连通数 失败总结
- 【英语学习】【Level 07】U04 Rest and Relaxation L6 Your home away from home
- 个人知识整理(javascript篇初识)
- MySQL令人咋舌的隐式转换
- java filter 回调_Java 异步回调机制实例分析
- SPH(光滑粒子流体动力学)流体模拟实现二:SPH算法(1)-数学原理
- linux程序只监听了ipv6端口,c-在Linux上侦听IPv6多播