python pandas 合并数据
问题是这样的,我有一个数据表集合,包括很多省份的年份数据。如下图:
每个表格数据表内部是这种:
比如上海:
再比如 云南
现在想要把31个省份合并到一个大表,
就是如下。
可以使用下面的命令:
def get_all_cross():df = pd.DataFrame({"year":list(range(2013, 2022)),"prov":"all"})for i in range(len(cross_list)):df_temp = pd.read_excel(os.path.join(crosstab_data_dir, cross_list[i]))df_temp.columns = [ 'year', '{}'.format(cross_list_prov_name[i])]df = pd.merge(right=df, left=df_temp, how='outer', sort='year')print("{} prov merged ".format(cross_list_prov_name[i]))print(df)return df
其中,cross_list_prov_name是xlsx文件的名字,
这里我现定义了一个空表,这个表里面必须有两列,year,和prov,这样在for循环里,把其他的表加进来。
如果没有两个空列,加不进来,结果达到想要目的。但是还是会有最后一列空的。就是这样。
我也不知有没有更好的办法,反正最后合并成新表了 之后,在删去最后一列就算了。
df_all_cross = get_all_cross()
这里主要是用了merge,how关键词需要传入“outer",不然只会合并出最少年份的数据为主的表。
python pandas 合并数据相关推荐
- python pandas合并多个excel_python pandas合并多个excel(xls和xlsx)文件(弹窗选择文件夹和保存文件)...
# python pandas合并多个excel(xls和xlsx)文件(弹窗选择文件夹和保存文件) import tkinter as tk from tkinter import filedial ...
- pandas 合并数据
pandas合并数据使用append.比如我要合并一个文件夹里面所有的pic类型的数据,那么先使用os模块,把所有文件名列出, 然后依次读入成dataframe, 读入过程中,一次append, 如果 ...
- pandas 不要编号 加一行_文科生带你学Python|Pandas读取数据
16 2020-08 文科生带你学Python|Pandas读取数据 距离上一次更新时间有点久,原因么,被大佬的代码打击到了,于是回去自闭充了一波电-- LEARN MORE 图片来自网络,如侵删 向 ...
- python pandas合并单元格_利用Python pandas对Excel进行合并的方法示例
前言 在网上找了很多Python处理Excel的方法和代码,都不是很尽人意,所以自己综合网上各位大佬的方法,自己进行了优化,具体的代码如下. 博主也是新手一枚,代码肯定有很多需要优化的地方,欢迎各位大 ...
- python pandas DataFrame 数据替换
python pandas DataFrame 替换 import pandas as pd import numpy as np df1 = pd.DataFrame({'日期': ['2021-7 ...
- python pandas 把数据保存成csv文件,以及读取csv文件获取指定行、指定列数据
文章目录: 1 数据说明 2 把数据集文件信息使用python pandas保存成csv文件 3 使用python pandas 读取csv的每行.每列数据 1 数据说明 1.在test_data目录 ...
- Python Pandas 列数据筛选方法汇总
Pandas 列数据筛选方法汇总 数据准备: 一.筛选得到指定的列 1.1 根据 label 选择特定的几列 1.2 选择单列的两种方式 1.3 通过正则表达式选择列 二.同时对 行 和 列 进行筛选 ...
- python pandas合并单元格_python pandas拆分单元格
python pandas拆分单元格mp.weixin.qq.com 拆分单元格是excel中经常遇到的内容之一.那么在pandas中如何实现呢? 例如有如下数据: >>> imp ...
- 通过Python Pandas分析数据上涨下跌趋势的方法:求离散数据的差分、导数
在实际工作中,我们经常需要分析一组数据的历史走势/趋势情况,比如要从产品数据库中筛选出销量处于上升趋势的产品,或者从股票历史数据库中筛选出一直处于上涨的股票. 那么可以通过分析计算该组数据的差分来模拟 ...
最新文章
- 自己做站点(二) 20块钱搞定一个企业站:域名amp;空间申请
- java基础学习-(1)面向对象
- 珠江三角洲 芯片恩仇录
- 【spring源码分析】spring中类型转换器详解
- 【算法设计与分析】专栏目录
- 获取 Adobe Creative Cloud 2023 创意应用软件,解锁无限创造力
- java long 空判断_Long类型null判断带值判断,null必须写在最前面
- “33岁,阿里程序员,税后年薪170万,我征婚有要求,有错吗?”
- Doris开启Stream Load记录
- 预测模型如何改进自动化决策
- macbook清理磁盘空间
- Scala进阶_函数式编程(过滤丶排序丶分组丶聚合)
- 常用存储器(SRAM、DRAM、NVRAM、PSRAM)简单介绍
- iPics2Go: iPhone变身扫描仪
- NUMA为何成为云计算的关键技术
- error C2143/C2501/C2059/C2238
- linux oracle ins 30131,Oracle安装报错:[INS-30131]Oracle Database Configuration Assistant
- jabcob 使用API
- 天正安装autocad启动失败_正常安装autocad2013及2014后启动程序显示“应用程序无法正常启动(0xc000007b)错误的解决方法”...
- 【docker】docker run的--rm选项详解
热门文章
- 新安江遗传算法c语言,基于遗传算法的新安江模型参数优化率定(四)
- 【Matlab 控制】求左右特征向量
- 11.1 问题描述及流程-机器学习笔记-斯坦福吴恩达教授
- Beyond Compare 3 许可证密钥被撤销
- 【DIY】震精!他居然用esp8266做出掌上游戏机......恐龙跑酷游戏还能这样玩!请广泛转发!...
- linux 进程防火墙连接管理,Linux系统管理初步(五)系统防火墙控制程序firewalld...
- FPGA篇(五)Capture导出FPGA引脚分配和端口定义
- 从零开始的AI·机器学习の基本概念
- 可穿戴计算之父:成都能成为可穿戴技术未来中心
- Drupal7主题初步设置篇-Ubuntu 14.04 LTS