场景:dataframe之间的链接,以及list之间的组合。

参考:

# -*- coding: utf-8 -*-
'''
Created on 2017年9月30日@author: Administrator
'''
import pandas as pd
import itertools
from itertools import product#merge
df1=pd.DataFrame({'name':['z','q','s','l'],'subid':['1','2','',''],'cid':['c1','','c2','c3']})
print (df1)
df2=pd.DataFrame({'name':['z','q','s','s','g'],'cid':['c1','c2','c2','c3','c1'],'code':['1','2','3','3','2']})
print (df2)
#内连接
df_inner=pd.merge(df1,df2,on=['name','cid'],how='inner')
print (df_inner)
#左连接
df_left=pd.merge(df1,df2,on=['name','cid'],how='left')
print (df_left)
#右连接
df_right=pd.merge(df1,df2,on=['name','cid'],how='right')
print (df_right)
#全外连接
df_outer=pd.merge(df1,df2,on=['name','cid'],how='outer')
print (df_outer)#join
df1=pd.DataFrame({'name':['z','q','s','l']})
print (df1)
df2=pd.DataFrame({'cid':['c1','c2','c3']})
print (df2)
df_join=df1.join(df2)
print (df_join)#元素两两组合-笛卡尔乘积list1=['z','q','s','l']
list2=['c1','c2','c3']
list3 = [(x,y) for x in list1 for y in list2]
print (list3)
for x in product(list1, list2):print (x)
for x in product(list1, repeat=4):print (x)
nums = itertools.permutations(list2)#自身组合
for x in  nums:print(x)

【数据平台】python数据集连接和组合相关推荐

  1. 银行营销数据的Python数据分析--连接SQLserver

    一共有4万多条数据,来自著名的machine learning网站UCI,数据集名称是bank marketing,应该很好搜到 数据是这样的4个文件,分别是个人信息.营销信息.社会经济情况和最终结果 ...

  2. “广智云”工业大数据平台正式对外发布

    中国工程院院士谭建荣在高峰论坛上作主旨演讲(记者 赵浛锐 摄) 东莞时间网讯 昨日,第三届广东国际机器人及智能装备博览会的配套活动之一"东莞市智能制造暨工业大数据高峰论坛"召开.中 ...

  3. 一篇运维老司机的大数据平台监控宝典(1)-联通大数据集群平台监控体系进程详解

    一篇运维老司机的大数据平台监控宝典(1)-联通大数据集群平台监控体系进程详解 "如果你是一个经验丰富的运维开发人员,那么你一定知道ganglia.nagios.zabbix.elastics ...

  4. 利用python整理凯斯西储大学(CWRU)轴承数据,制作数据集

    利用python整理凯斯西储大学(CWRU)轴承数据,制作数据集 1 前言 2 制作数据集 2.1 下载数据,初步处理 2.2 上代码 1 前言 大多数文献用CWRU数据制作数据集的思路是差不多的,这 ...

  5. 爬取电商平台数据,python爬取某维商品数据

    本次内容: 爬取电商平台数据,python爬取某维商品数据 课程亮点 动态数据抓包演示 json数据解析 requests模块的使用 保存csv 环境介绍 python 3.8 [最好用和老师一样的版 ...

  6. 连接端口 配置hive_Hadoop大数据平台数据仓库Hive管理操作

    #大数据# #hadoop# #Hive# #数据仓库# #大数据平台# HWI是Hive Web Interface的简称,在Hive的安装包中默认不提供,需要下载源码编译后运行. 1.1 Hive ...

  7. python pandas series加速原理_python pandas中对Series数据进行轴向连接的实例

    有时候我们想要的数据合并结果是数据的轴向连接,在pandas中这可以通过concat来实现.操作的对象通常是Series. Ipython中的交互代码如下: In [17]: from pandas ...

  8. Python合并数据、多表连接查询

    Python合并数据.多表连接查询 - 腾讯云开发者社区-腾讯云我们可以通过DataFrame或Series类型的concat方法,来进行连接操作,连接时,会根据索引进行对齐.https://clou ...

  9. python大数据平台_基于腾讯位置大数据平台的全球移动定位数据Python爬取与清洗...

    前不久投稿了一篇论文是以腾讯位置大数据为基础进行人口空间化研究的,但是还未见刊,见刊后会给大家分享下具体的研究方法. 首先打开腾讯位置大数据星云图链接:https://xingyun.map.qq.c ...

最新文章

  1. 如何在Linux下使用rsync
  2. 租用的服务器CPU使用率高的原因分析与解决办法
  3. python array_python数组array.array(转帖)
  4. 三瞬属性matlab,matlab:out of memory 1
  5. 微信小程序来了,你准备好了吗?
  6. 关于Apt注解实践与总结【包含20篇博客】
  7. 使用CleanMyMac软件进行文件清理
  8. zen-Coding
  9. 使用 Sublime开发 Jade
  10. 头脑极度开放:前额皮层大战杏仁核
  11. 液晶手写板原理拆解_天猫babycare儿童液晶手写板详情页拆解
  12. wps右键失效_鼠标点击右键没有反应怎么办
  13. 虚拟地址与虚拟内存的理解
  14. 同步练习(Java SE(十二))
  15. Thymeleaf th:each遍历,th:if、th:switch 条件判断,input,select,radio 回显赋值
  16. 微信营销有哪些精准吸粉的方法?
  17. 二进制文件在linux如何表示,如何通过静态分析找出二进制文件是否在Linux上使用某些系统调用?...
  18. TreeMap实现原理 红黑树
  19. pandas、pyecharts绘制基金走势图-01
  20. 优秀UI设计作品需要具备的六要素,不容忽视!

热门文章

  1. keil obj 文件 结构_【Python】数据分析前的入门教程 Python For Everybody P2:数据结构...
  2. 如何在柱状图中点连线_练瑜伽,如何放松僵硬紧张的髂腰肌?
  3. aapt.exe已停止工作 r.java_【转】android错误 aapt.exe已停止工作的解决方法
  4. 搭建mongodb分片
  5. POJ2891 Strange Way to Express Integers【扩展中国剩余定理】
  6. setInterval()方法只执行一次的解决方法
  7. java十分钟速懂知识点——引用
  8. “放到桌面”的Servlet实现
  9. 将json的时间格式转换成正常的时间格式
  10. “Java引领技术人生”专题讲座北京、上海站圆满举行