文章目录

  • 1.merge
  • 2.join 基于索引
  • 3.concat 堆叠(union)
>>>import pandas as pd
>>>position=pd.read_csv('DataAnalyst.csv',encoding='gbk')
>>>company=pd.read_csv('company_sql.csv',encoding='gbk')
>>>company.head()
companyId companyFullName companyLabelList companyShortName companySize businessZones
0 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
1 23177 上海点荣金融信息服务有限责任公司 ['节日礼物', '带薪年假', '岗位晋升', '扁平管理'] 点融网 500-2000人 ['五里桥', '打浦桥', '制造局路']
2 57561 上海晶樵网络信息技术有限公司 ['技能培训', '绩效奖金', '岗位晋升', '管理规范'] SPD 50-150人 ['打浦桥']
3 7502 杭州数云信息技术有限公司上海分公司 ['绩效奖金', '股票期权', '五险一金', '通讯津贴'] 数云 150-500人 ['龙华', '上海体育场', '万体馆']
4 130876 上海银基富力信息技术有限公司 ['年底双薪', '通讯津贴', '定期体检', '绩效奖金'] 银基富力 15-50人 ['上海影城', '新华路', '虹桥']
>>>position.head()
city companyFullName companyId companyLabelList companyShortName companySize businessZones firstType secondType education industryField positionId positionAdvantage positionName positionLables bottom top avg workYear
0 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 数据开发 硕士 移动互联网 2537336 知名平台 数据分析师 ['分析师', '数据分析', '数据挖掘', '数据'] 7 9 8.0 应届毕业生
1 上海 上海点荣金融信息服务有限责任公司 23177 ['节日礼物', '带薪年假', '岗位晋升', '扁平管理'] 点融网 500-2000人 ['五里桥', '打浦桥', '制造局路'] 技术 数据开发 本科 金融 2427485 挑战机会,团队好,与大牛合作,工作环境好 数据分析师-CR2017-SH2909 ['分析师', '数据分析', '数据挖掘', '数据'] 10 15 12.5 应届毕业生
2 上海 上海晶樵网络信息技术有限公司 57561 ['技能培训', '绩效奖金', '岗位晋升', '管理规范'] SPD 50-150人 ['打浦桥'] 设计 数据分析 本科 移动互联网 2511252 时间自由,领导nic 数据分析师 ['分析师', '数据分析', '数据'] 4 6 5.0 应届毕业生
3 上海 杭州数云信息技术有限公司上海分公司 7502 ['绩效奖金', '股票期权', '五险一金', '通讯津贴'] 数云 150-500人 ['龙华', '上海体育场', '万体馆'] 市场与销售 数据分析 本科 企业服务,数据服务 2427530 五险一金 绩效奖金 带薪年假 节日福利 大数据业务分析师【数云校招】 ['商业', '分析师', '大数据', '数据'] 6 8 7.0 应届毕业生
4 上海 上海银基富力信息技术有限公司 130876 ['年底双薪', '通讯津贴', '定期体检', '绩效奖金'] 银基富力 15-50人 ['上海影城', '新华路', '虹桥'] 技术 软件开发 本科 其他 2245819 在大牛下指导 BI开发/数据分析师 ['分析师', '数据分析', '数据', 'BI'] 2 3 2.5 应届毕业生

1.merge

#用法1:dataframe下的merge#
#on针对两个表的连接字段相同
>>>position.merge(right=company,how='inner',on='companyId')
city companyFullName_x companyId companyLabelList_x companyShortName_x companySize_x businessZones_x firstType secondType education ... positionLables bottom top avg workYear companyFullName_y companyLabelList_y companyShortName_y companySize_y businessZones_y
0 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 数据开发 硕士 ... ['分析师', '数据分析', '数据挖掘', '数据'] 7 9 8.0 应届毕业生 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
1 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 后端开发 本科 ... ['数据分析', '数据'] 20 30 25.0 3-5年 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
2 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 后端开发 本科 ... ['大数据', '数据库', '数据'] 20 40 30.0 5-10年 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
3 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 数据开发 本科 ... ['数据分析', '数据'] 15 25 20.0 5-10年 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
6818 天津 天津美源星商贸有限公司 112379 ['年底双薪', '绩效奖金', '年终分红', '午餐补助'] 天津美源星 150-500人 NaN 职能 行政 不限 ... ['行政', '数据'] 3 4 3.5 不限 天津美源星商贸有限公司 ['年底双薪', '绩效奖金', '年终分红', '午餐补助'] 天津美源星 150-500人 NaN
6819 天津 北京瑞达恒建筑咨询股份有限公司 32877 ['技能培训', '年底双薪', '带薪年假', '绩效奖金'] 瑞达恒RCC 500-2000人 ['尖山'] 市场与销售 数据分析 大专 ... ['商业', '数据'] 3 5 4.0 不限 北京瑞达恒建筑咨询股份有限公司 ['技能培训', '年底双薪', '带薪年假', '绩效奖金'] 瑞达恒RCC 500-2000人 ['尖山']
6820 天津 天津小猫网络科技有限公司 52887 ['技能培训', '股票期权', '绩效奖金', '扁平管理'] 天津小猫 15-50人 ['和平路', '火车站', '后广场'] 技术 高端技术职位 本科 ... ['职业培训', '教育', '培训', '大数据', '讲师', '合伙人', '数据',... 8 15 11.5 不限 天津小猫网络科技有限公司 ['技能培训', '股票期权', '绩效奖金', '扁平管理'] 天津小猫 15-50人 ['和平路', '火车站', '后广场']
6821 北京 普信资产管理有限公司 59239 ['节日礼物', '技能培训', '绩效奖金', '岗位晋升'] 龙宝斋财富 2000人以上 ['京广桥'] 开发/测试/运维类 软件开发 本科 ... ['专家', '高级', '软件开发'] 15 30 22.5 3-5年 普信资产管理有限公司 ['节日礼物', '技能培训', '绩效奖金', '岗位晋升'] 龙宝斋财富 2000人以上 ['京广桥']
6822 北京 北京富通基业投资有限公司 156832 ['节日礼物', '美女多', '帅哥多', '技能培训'] 北京富通基业投资有限公司 50-150人 ['西二旗'] 市场/商务/销售类 销售 不限 ... ['顾问', '销售', '分析师'] 4 6 5.0 不限 北京富通基业投资有限公司 ['节日礼物', '美女多', '帅哥多', '技能培训'] 北京富通基业投资有限公司 50-150人 ['西二旗']

6823 rows × 24 columns

#将company表的companyId改成id#
>>>col =list(company.columns)
>>>col[0]='yuiyi'
#将修改好的列表赋值给表字段
>>>company.columns=col
'yuiyi'
>>>company.head()
yuiyi companyFullName companyLabelList companyShortName companySize businessZones
0 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
1 23177 上海点荣金融信息服务有限责任公司 ['节日礼物', '带薪年假', '岗位晋升', '扁平管理'] 点融网 500-2000人 ['五里桥', '打浦桥', '制造局路']
2 57561 上海晶樵网络信息技术有限公司 ['技能培训', '绩效奖金', '岗位晋升', '管理规范'] SPD 50-150人 ['打浦桥']
3 7502 杭州数云信息技术有限公司上海分公司 ['绩效奖金', '股票期权', '五险一金', '通讯津贴'] 数云 150-500人 ['龙华', '上海体育场', '万体馆']
4 130876 上海银基富力信息技术有限公司 ['年底双薪', '通讯津贴', '定期体检', '绩效奖金'] 银基富力 15-50人 ['上海影城', '新华路', '虹桥']
#两张表的连接字段名称已经不一致了
#需要用到left_on 和right_on分别指代
>>>position.merge(right=company,how='inner',left_on='companyId',right_on='yuiyi')
city companyFullName_x companyId companyLabelList_x companyShortName_x companySize_x businessZones_x firstType secondType education ... bottom top avg workYear yuiyi companyFullName_y companyLabelList_y companyShortName_y companySize_y businessZones_y
0 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 数据开发 硕士 ... 7 9 8.0 应届毕业生 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
1 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 后端开发 本科 ... 20 30 25.0 3-5年 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
2 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 后端开发 本科 ... 20 40 30.0 5-10年 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
3 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 数据开发 本科 ... 15 25 20.0 5-10年 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
4 武汉 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 NaN 技术 管理岗 本科 ... 15 25 20.0 3-5年 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
#用法2:pandas下面的merge#
pd.merge(position,company,left_on='companyId',right_on='yuiyi')
city companyFullName_x companyId companyLabelList_x companyShortName_x companySize_x businessZones_x firstType secondType education ... bottom top avg workYear yuiyi companyFullName_y companyLabelList_y companyShortName_y companySize_y businessZones_y
0 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 数据开发 硕士 ... 7 9 8.0 应届毕业生 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
1 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 后端开发 本科 ... 20 30 25.0 3-5年 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
2 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 后端开发 本科 ... 20 40 30.0 5-10年 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
3 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 数据开发 本科 ... 15 25 20.0 5-10年 8581 纽海信息技术(上海)有限公司 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江']
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
6819 天津 北京瑞达恒建筑咨询股份有限公司 32877 ['技能培训', '年底双薪', '带薪年假', '绩效奖金'] 瑞达恒RCC 500-2000人 ['尖山'] 市场与销售 数据分析 大专 ... 3 5 4.0 不限 32877 北京瑞达恒建筑咨询股份有限公司 ['技能培训', '年底双薪', '带薪年假', '绩效奖金'] 瑞达恒RCC 500-2000人 ['尖山']
6820 天津 天津小猫网络科技有限公司 52887 ['技能培训', '股票期权', '绩效奖金', '扁平管理'] 天津小猫 15-50人 ['和平路', '火车站', '后广场'] 技术 高端技术职位 本科 ... 8 15 11.5 不限 52887 天津小猫网络科技有限公司 ['技能培训', '股票期权', '绩效奖金', '扁平管理'] 天津小猫 15-50人 ['和平路', '火车站', '后广场']
6821 北京 普信资产管理有限公司 59239 ['节日礼物', '技能培训', '绩效奖金', '岗位晋升'] 龙宝斋财富 2000人以上 ['京广桥'] 开发/测试/运维类 软件开发 本科 ... 15 30 22.5 3-5年 59239 普信资产管理有限公司 ['节日礼物', '技能培训', '绩效奖金', '岗位晋升'] 龙宝斋财富 2000人以上 ['京广桥']
6822 北京 北京富通基业投资有限公司 156832 ['节日礼物', '美女多', '帅哥多', '技能培训'] 北京富通基业投资有限公司 50-150人 ['西二旗'] 市场/商务/销售类 销售 不限 ... 4 6 5.0 不限 156832 北京富通基业投资有限公司 ['节日礼物', '美女多', '帅哥多', '技能培训'] 北京富通基业投资有限公司 50-150人 ['西二旗']

6823 rows × 25 columns

2.join 基于索引


df1 =  pd.DataFrame({'A' :list('abcd'),'B' :list('efgh')}
)
>>>df1
A B
0 a e
1 b f
2 c g
3 d h
df2=pd.DataFrame({'C':list('abcd'),'D':list('efgh')}
)
>>>df2
C D
0 a e
1 b f
2 c g
3 d h
#基于索引拼接
>>>df1.join(df2)
A B C D
0 a e a e
1 b f b f
2 c g c g
3 d h d h

3.concat 堆叠(union)

#上下堆叠#
>>>pd.concat([df1,df2])
A B C D
0 a e NaN NaN
1 b f NaN NaN
2 c g NaN NaN
3 d h NaN NaN
0 NaN NaN a e
1 NaN NaN b f
2 NaN NaN c g
3 NaN NaN d h
#左右堆叠
>>>pd.concat([df1,df2],axis=1)
A B C D
0 a e a e
1 b f b f
2 c g c g
3 d h d h

【Python数据科学】多表关联 merge、join、concat相关推荐

  1. 的确好用!Python数据科学速查表中文版强势来袭!

    1速查速记,不二之选! DataCamp 推出的 Python 数据科学速查表(中文版),一共 11 张表,包括:Python 基础.导入数据.Jupyter Notebook.Numpy 基础.Pa ...

  2. 14 张Python数据科学速查表

    大家好,我是俊红. 今天给大家隆重推荐一个Python数据分析领域的大佬:小一,他也是公众号[小一的学习笔记]的号主! 小一是我的好友,从事数据分析行业近5年,擅长使用Python进行爬虫.数据处理和 ...

  3. python数据科学速查表_Python数据科学速查表:中级

    python数据科学速查表 The printable version of this cheat sheet 该备忘单的可打印版本 The tough thing about learning da ...

  4. python计算各类型电影的评分_【Python数据科学实战项目】之 基于MovieLens的影评趋势分析|详解...

    原标题:[Python数据科学实战项目]之 基于MovieLens的影评趋势分析|详解 注:图片源于https://movielens.org/ 1. 项目任务 1.1 数据来源 本项目使用Group ...

  5. 基于点击量的趋势分析python_【Python数据科学实战项目】之 基于MovieLens的影评趋势分析详解...

    原标题:[Python数据科学实战项目]之 基于MovieLens的影评趋势分析详解 本文转自: 数据科学DataScience 注:图片源于https://movielens.org/ 1. 项目任 ...

  6. python数据科学系列:pandas入门详细教程

    导读 前2篇分别系统性介绍了numpy和matplotlib的入门基本知识,今天本文自然是要对pandas进行入门详细介绍,通过本文你将系统性了解pandas为何会有数据分析界"瑞士军刀&q ...

  7. python数据科学-单变量数据分析

    总第85篇 01|背景: 我们在做机器学习之前,需要自己先对数据进行深入的了解(这些数据是什么类型,总共有多少数据,有没有缺失值,均值是多少之类的),只有自己对数据足够了解了,才能够更好地利用机器学习 ...

  8. python数据科学课后答案_Python数据科学-技术详解与商业实践-第五讲作业

    作者:Ben,著有<Python数据科学:技术详解与商业实践>.<用商业案例学R语言数据挖掘>.<胸有成竹-数据分析的SAS EG进阶>作者.2005年进入数据科学 ...

  9. Python 数据科学库入门

    Python 数据科学库入门 1.Numpy 1.1Numpy 简介 Numpy(Numerical Python) Numpy:提供了一个在 Python 中做科学计算的基础库,重在数值计算,主要用 ...

  10. python数据科学-多变量数据分析

    总第87篇 01|写在前面: 在前面我们研究了单列(变量)数据情况,现实中的案例大多都是多列(变量)的,即影响一件事情的因素有多个,我们除了要看单列数据以外还需要看看这不同列之间是否存在某些联系.常见 ...

最新文章

  1. TP 框架实现支付宝接口功能
  2. python 递归结束条件_python递归(如果条件满足,为什么程序不退出一次?)
  3. 关于在VS 2013 Reshaper 中不能使用Alt+Enter 的解决
  4. P1121 环状最大两段子段和
  5. python文本时间提取
  6. mybatis之trim prefix= suffix= suffixOverrides= prefixOverrides=/trim
  7. HDU1285 确定名次 拓扑排序
  8. windows下的结束标志
  9. 【CC精品教程】ContextCapture 4.4.12(CC,Smart 3D)简体中文版安装教程(附安装包下载)
  10. git冲突解决办法合集
  11. java中堆和栈的区别_java中堆和栈的区别
  12. ⼤⼚H5 开发概述-H5 开发及其前世今⽣
  13. java首字母判断星期几_Java 获取汉字串首字母并大写和获取汉字的全拼(英文字符不变) 判断字符串是否为字母...
  14. CentOS7下安装使用HBase
  15. beta分布的直观理解
  16. SolarWinds发布2022 IT趋势报告:混合IT增加网络复杂性,技术人表示缺乏信心
  17. androidUI布局仿猫扑界面
  18. 人像调色,教大家调素系风格调色教程
  19. UG NX二次开发(C#)-建模-图层操作
  20. 【人工智能】机器学习中的决策树

热门文章

  1. java笔试题-六一儿童节
  2. 百度热力图颜色说明_最新黑科技!看完东莞的城市热力图,你就知道该在哪里买房了!...
  3. lasso回归python代码_LASSO回归代码实现 坚韧不拔|静水流深|读书|写作|博雅|数据分析|Python|商业|独立·独特·自立门户 kebook...
  4. python怎么循环合并数组_python数组循环合并python执行系统命令四种方法比较
  5. 对话深喉:中小App如何突围?(开发者必看)
  6. 【Visual C++】游戏开发五十四 浅墨DirectX教程二十一 视觉的诡计:公告板(Billboard)技术
  7. 5.MySQL高级语句,你给我学!
  8. java normalize_node.js中的path.normalize方法使用说明
  9. 如何用C语言封装 C++的类
  10. 计算机RAM ,ROM,NOR FLASH ,NAND FLASH和手机RAM,ROM大家庭血缘关系图