背景

python使用pandas库或其他工具处理excel文件有一个很尴尬的问题,就是保存成的excel文件几乎没有一点排版,比如这样的:

每一列都是一样宽,有些列内容太长会直接溢出单元格,很不美观。少量的表格还可以耐心的手动调整列宽,处理的表格多了就显得很麻烦。所以我想了一种办法解决这个问题。

思路

这个问题的关键在于获得每一列应有的列宽,并调整它。通常只需要获得每一列内容的最大长度就可以达到目标。这里的长度不应该是字符串的长度,而是一串字符在excel表格中占的长度。经过观察可以发现,一个汉字的“长度”约为2,一个字母或数字的长度为1。由于大部分内容都是由汉字字母数字构成的,所以知道这点就足够完成我的程序了,这里使用了ord函数获得字符的ASCII值简单地判断一下是不是汉字。
核心代码:

for elem in str_list:elem_split = list(elem)length = 0for c in elem_split:if ord(c) <= 256:length += 1else:length += 2len_list.append(length)

完整实现

当然仅仅调整列宽还是不够的,我还希望可以实现当字符串过长时实现自动换行、合并单元格、涂色等功能,所以最终我将其封装成了一个类,根据不同的需求可实现各种功能。
包括: 保存文件时列宽自适应、添加sheet而不是覆盖原xlsx文件、合并相同内容的单元格等

  • 2020-04-18代码更新
# -*- coding:utf8 -*-
from openpyxl.styles import Alignment
from openpyxl.styles import PatternFill
from openpyxl.styles import Font
from openpyxl import Workbook, load_workbook
from os import remove, pathclass XlsxSaver:"""一个将DataFrame转换成格式化excel的工具"""def __init__(self, df_in, filename='a.xlsx', sheet_name='Sheet1'):"""df_in : 从一个DataFrame对象获取表格内容filename : 文件名sheet_name : 表名"""self.filename = filename  # 保存的xlsx文件的名字self.user_def = []  # 储存由用户自定义的列的列名,这些列不再参与自动计算列宽if path.exists(filename):# 如果文件存在,就直接打开,添加Sheetself.wb = load_workbook(filename)self.sheet = self.wb.create_sheet(sheet_name)else:# 如果文件不存在,就创建表格self.wb = Workbook()self.sheet = self.wb.activeself.sheet.title = sheet_name# 将df的内容复制给sheetself.df = df_in.copy()self.sheet.append(list(self.df.columns))for row in range(0, len(list(self.df.index))):for col in range(0, len(list(self.df.columns))):self.sheet.cell(row+2, col+1).value = self.df.iloc[row, col]  # 注意:sheet行列从1开始计数def remove_file(self):remove(self.filename)def set_sheet_name(self, sheet_name):self.sheet.title = sheet_namedef set_filename(self, filename):self.filename = filenamedef get_maxlength(self, series_in, col):"""获取一个类型为object的Series中的最大占位长度,用于确定导出的xlsx文件的列宽col : 表头,也参与比较,解决有时候表头过长的问题"""series = series_in.fillna('-')  # 填充空值,防止出现nanstr_list = list(series)len_list = []for elem in str_list + [col]:elem_split = list(elem)length = 0for c in elem_split:if ord(c) <= 256:length += 1else:length += 2len_list.append(length)return max(len_list)def __auto_width(self):cols_list = list(self.df.columns)  # 获取列名for i in range(0, len(cols_list)):col = cols_list[i]if col in self.user_def:continueself.sheet.cell(1, i+1).font = Font(bold=True)  # 加粗表头letter = chr(i+65)  # 由ASCII值获得对应的列字母max_len = self.get_maxlength(self.df[col].astype(str), col)if max_len <= 12:self.sheet.column_dimensions[letter].width = 12elif max_len <= 50:self.sheet.column_dimensions[letter].width = max_len + 2else:self.sheet.column_dimensions[letter].width = 50for cell in self.sheet[letter]:cell.alignment = Alignment(wrap_text=True)def set_width(self, col_name, width):# 提供调整列宽的接口index = list(self.df.columns).index(col_name)letter = chr(index+65)self.sheet.column_dimensions[letter].width = widthself.user_def.append(col_name)def set_color(self, col_name, color, rule):# 提供设置颜色的接口,rule:规则函数index = list(self.df.columns).index(col_name)letter = chr(index+65)for cell in self.sheet[letter]:if rule(cell.value):cell.fill = PatternFill(fill_type="solid", start_color=color, end_color=color)def set_center_alignment(self, col_name):index = list(self.df.columns).index(col_name)letter = chr(index+65)for cell in self.sheet[letter]:cell.alignment = Alignment(wrap_text=True, horizontal='center')def save(self):# 自动调整列宽,并保存self.__auto_width()self.wb.save(self.filename)def set_merge(self, col_name):self.user_def.append(col_name)  # 设置为自定义列# 设置一列合并单元格index = list(self.df.columns).index(col_name)letter = chr(index+65)i = 1while True:if i >= self.sheet.max_row:# 结束条件:单元格到底breakcell = self.sheet[letter+str(i)]j = i+1  # 第一步指向下一个单元格while True:# 这个过程对j进行试探,最终j指向的单元格是与i连续相同的最后一个cell_next = self.sheet[letter+str(j)]if cell_next.value != cell.value:j -= 1breakelse:j += 1if j > self.sheet.max_row:j -= 1breakif j-i >= 1 and cell.value != '' and cell.value:# 如果有连续两格以上的单元格内容相同,进行融合msg = '%s%d:%s%d'%(letter,i,letter,j)self.sheet.merge_cells(msg)# 控制一下格式self.sheet[letter+str(i)].alignment = Alignment(horizontal='center',vertical='top',wrap_text=True)i = j+1  # 继续指向下个单元格

使用示例

df = pd.read_sql(SQL, conn)  # 从数据库获取一张表
xlsx = XlsxSaver(df, 'output.xlsx', 'sheet1')  # 初始化一个对象, 设定保存后的文件名和表名
xlsx.set_width('col1', 30)  # 手动指定某列列宽
xlsx.set_merge('col2')  # 设定col2列自动合并相邻相同的单元格
xlsx.save()  # 储存, 此时除了col2列被手动指定了列宽,其他列都执行自适应的列宽

注: 如果对格式没有特别的要求的话没必要这么大费周章了,可以使用以下函数

def save_as_excel(df,xlsx_name='a.xlsx',sheet_name='sheet1',startrow=0,startcol=0):"""功能是保存一个df对象为excel文件(xlsx)df:要保存的dataFrame对象xlsx_name:要保存的名字,注意加上后缀sheet_name:要保存的表的名字"""writer=pd.ExcelWriter(xlsx_name)df.to_excel(writer,sheet_name = sheet_name,startrow=startrow,startcol=startcol,index=False)writer.save()#需要加上这一行,否则无法生成文件

python保存excel文件列宽自适应解决方案相关推荐

  1. Python pandas 保存Excel自动调整列宽的方法及示例代码

    本文主要介绍Python中,使用pandas.ExcelWriter保存Excel文件数据时,自动判断调整列的宽度方法,以及相关的示例代码. 原文地址:Python pandas 保存Excel自动调 ...

  2. python保存Excel文件sheet_name是中文时出错:UnicodeDecodeError

    python保存Excel文件sheet_name是中文时出错:UnicodeDecodeError 当sheet_name为中文时报错 错误代码: df.to_excel(writer,encodi ...

  3. Hutool工具类ExcelWriter导出excel列宽自适应问题解决

    前言: 因为项目中需要使用到ExcelWriter导出excel的列宽自适应,下面为解决该问题的经过,希望可以对遇到同样问题的开发者有所帮助. 一.通过查询Hutool官方的api文档发现autoSi ...

  4. excel表格行宽列高怎么设置_解决方案:Excel自动调整列宽和行宽什么是快捷键? [Excel设置行高度自适应]...

    如何在Excel工作表中设置自动调整行高? 选择要设置的单元格,然后单击"开始" ----"单元格" ----"格式" ----" ...

  5. Python操作Excel文件:插入一列数据

    问题描述:已有Excel文件,其中包含5列数据,要求在第3列前插入一列数据,保存为新文件. 参考代码: 运行结果: --------董付国老师Python系列教材-------- 1)<Pyth ...

  6. python对excel表统计视频教程_Python实现对excel文件列表值进行统计的方法

    本文实例讲述了Python实现对excel文件列表值进行统计的方法.分享给大家供大家参考.具体如下: #!/usr/bin/env python #coding=gbk #此PY用来统计一个execl ...

  7. 用python编excel统计表_Python实现对excel文件列表值进行统计的方法

    本文实例讲述了Python实现对excel文件列表值进行统计的方法.分享给大家供大家参考.具体如下: #!/usr/bin/env python #coding=gbk #此PY用来统计一个execl ...

  8. python如何保存excel文件

    你可以使用 Python 的第三方库来保存 Excel 文件.比较常用的有 openpyxl 和 pandas. 使用 openpyxl 库,你可以这样保存 Excel 文件: from openpy ...

  9. python创建Excel文件及写入保存数据

    python创建Excel文件及写入保存数据 创建Excel文件及写入保存数据 文章目录 python创建Excel文件及写入保存数据 一. 创建并保存Excel文档 二.工作表的创建 三.完整代码 ...

  10. 怎么用python处理excel文件-用python处理excel文件有多轻松?工作从未如此简单

    最近需要频繁读写 excel 文件,想通过程序对 excel 文件进行自动化处理,发现使用 python 的 openpyxl 库进行 excel 文件读写实在太方便了,结构清晰,操作简单.本文对 o ...

最新文章

  1. 如何有效的使用C#读取文件
  2. 用SERVLET进行用户名和密码验证
  3. 防治交换机窃听技术_等保2.0建设基本要求(技术部分)解读(下)
  4. mysql 视图_mysql视图
  5. 250鲁大师跑分_我装了一台鲁大师 230W 分的神机,3A 游戏平台装机作业
  6. boost:验证Boost概念检查的class_requires 库应该在预期的时间内捕获错误
  7. Android Wear 唤醒热词会比“你好,安卓”好吗?
  8. Chrome开发者工具对Vue应用的支持
  9. 重温设计模式之 Factory
  10. Android—SDCard数据存取Environment简介
  11. 命令行重启Oracle数据库
  12. Programming Protocol-independent Packet Processors (P4)
  13. itextSharp 附pdf文件解析
  14. Typora下载加速
  15. c++ SIMD AVX2比较 例子
  16. Atitit mvc之道 attilax著 1. Atitti mvc的几大概念 2 1.1. Dispatcher Controller 2 1.2. 声明式渲染 2 1.3. 条件与循环
  17. R绘图笔记 | 生存曲线的绘制
  18. 开发一个APP系统软件需要多少钱及需要多长开发周期
  19. matlab 曲线填充 透明度
  20. Gamma、Linear、sRGB 和Unity Color Space,你真懂了吗?

热门文章

  1. CentOS 6.6安装命令行 Web 浏览器 links
  2. 论文查重算法 python_个人项目之论文查重
  3. 黑鲨装机大师计算机产品密钥,黑鲨装机大师U盘重装win10系统详细教程
  4. ionic基本命令行
  5. win搭建7java环境_WIN7java环境变量搭建方法
  6. 如何改变证件照大小?三步搞定
  7. 想学一门计算机技术 Java和Python哪个前景好
  8. HDU 6599 Palindromic_Automaton
  9. 十大简单易用的免费在线HTML编辑器
  10. poi导出excel时设置单元格为数字类型(解决:导出Excel时为文本类型选中一整列不能求和问题)