使用Python对excel中的数据进行处理
一、读取excel中的数据
首先引入pandas库,没有的话使用控制台安装 —— pip install pandas 。
import pandas as pd #引入pandas库,别名为pd#read_excel用于读取excel中的数据,这里只列举常用的两个参数(文件所在路径,忽略头字段)
data = pd.read_excel('excel路径', header = 0)
print(data) #可以打印看看自己读取的数据
read_excel的具体参数,可根据实际需要选择。
二、转换和处理数据
如果想对excel中读取的数据进行处理,最好把它转换成list,输出的时候使用dataFrame。
#输入之后转换一维数组
data = datas.values #只读取excel中的值,不读取序号
data = list(np.concatenate(data.reshape((-1, 1), order="F"))) #转换
print(list) #查看数组#其他处理代码……#输出的时候,定义一个空的dataFrame,把数据添加到dataFrame中
df = pd.DataFrame() #定义空的dataFrame
#通过循环将数据添加到df
for i in data:df = df.append([i]) #把数据添加到末尾
三、将数据输出到excel
输出同样只要一行简单代码,使用dataFrame格式将数据输出到表格。
#to_excel用于输出excel中的数据,这里同样只列举两个常用参数(文件输出路径,忽略头字段)
df.to_excel('输出路径', index = False)
to_excel的具体参数,可根据实际需要选择。
四、使用pyhon处理excel数据的简单示例(含详细注释)
示例中的excel只有一列数据,主要作用处理是读取excel中的数据将之提取为纯中文字符串——使用正则表达式匹配。
大家可以根据自己的实际需要对数据进行转换和处理。
import pandas as pd
import numpy as np
import re #正则datas = pd.read_excel('old.xlsx', header = 0) #从excel中读取数据(这里使用的是相对路径)data = datas.values #只读取excel中的值,不读取序号resource = list(np.concatenate(data.reshape((-1, 1), order="F"))) #将读取的数据转换为list# print(resource) #打印list#提取中文字符串函数
def chinese(s):# res = re.findall('[^0-9]', s) #使用正则表达式匹配非数字的字符res = re.findall('[\u4e00-\u9fa5]', s) #使用正则表达式匹配中文字符return ''.join(res) #将字符拼接成字符串df = pd.DataFrame() #定义空的dataFrame#依次读取list中的数据,将之处理为纯中文字符串
for i in resource:i = str(i) #excel中的部分数据为非字符串,这里全部转换为字符串ch = chinese(i) #提取中文字符串df = df.append([ch]) #将数据添加到dfdf.to_excel('new.xlsx', index = False) #将处理后的数据输出到excel表格
使用Python对excel中的数据进行处理相关推荐
- 使用Python将Excel中的数据导入到MySQL
使用Python将Excel中的数据导入到MySQL 工具 Python 2.7 xlrd MySQLdb 安装 Python 对于不同的系统安装方式不同,Windows平台有exe安装包,Ubunt ...
- 使用python读取excel中的数据,并绘制折线图
使用python读取excel中的数据,并绘制折线图 做实验的时候采集到一些数据,从文本拷贝到excel,然后从十六进制转换成十进制.图表是分析数据的有利工具,使用python绘制出的图表简明美观.所 ...
- Python 保留excel中原有数据,添加新的sheet页
1.目的: 保留excel中原有数据,并将数据追加到新的sheet页中 2.解决思路 第一种: 首先获取原有数据 其次处理得到需要插入的数据 最后将新的到的数据,追加到原数据中 第二种: 打开exce ...
- Python读取Excel中的数据
1.用xlrd包读取excel数据 import xlrddef read_excel():# 打开文件,xlrd.open_workbook(),函数中参数为文件路径,分为相对路径和绝对路径work ...
- python处理微信消息导入excel_使用python读取excel中的数据,并重新写入到新的excel中...
使用Python3运行 起初是读取excel中的数据,进行相关的计算将结果追加在后面,没有找到合适的办法,就只能采用这种读取数据,进行相关操作,重新写入的方法 1. 主要流程 (1)使用xlrd打开x ...
- python统计excel中重复数据_Python中用pandas对标Excel自带功能——去除重复项
经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死.后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器-- pandas 前言 有时候数据中出 ...
- 用python把excel中的数据变成字典(复制代码即可用)
在同一个文件夹里面 创建一个python文件,如dalao.py 一个excel文件,名字如textone.xlsx 在下面代码中: book = load_workbook('textone.xls ...
- python从excel中读取数据并填写网页表格
话不多说,先直接上代码 import time from selenium import webdriver from selenium.webdriver.common.keys import Ke ...
- python统计excel中重复数据_EXCEL公式解读:统计不重复个数
作者:祝洪忠 转自:Excel之家ExcelHome 小伙伴们好啊,今天咱们一起学习一下COUNTIF函数的高级应用,来看看如何使用这个函数完成不重复个数的统计. 模式化的公式为: =SUMPRODU ...
最新文章
- wangEditor编辑器中解析html图文信息问题(三)
- 软件设计师考试上午真题 考前速记
- SOCKADDR_IN
- sendmessage和postmessage的区别
- JavaEE概念简介
- 【Python CheckiO 题解】Feed Pigeons
- oracle 00371,PLS-00371: 'WEB_LOGIN_CHECK_PK.CURSORTYPE' 最多允许有一个声明
- 【VB.NET】实验 控件综合运用——“五一”商城大促の模拟
- 有关linux用户和用户组管理的知识详解
- 如果你不喜欢Windows 11开始菜单,还可以用注册表换回Windows 10样式
- 帝国cms如何安装php模板,2020帝国cms模板安装教程详细介绍
- mysql 镜像备份_手动构建percona-xtrabackup Docker镜像,并实现mysql数据备份
- UE4之UMG用户界面
- 功能测试分析和测试用例编写模板
- 气象数据分析之EOF分析以及python的实现
- 【更新】VMware虚拟机黑群晖7.1.1 RC(懒人包)
- ^^^ 存货盘盈盘亏的账务处理 Accounting for Inventory Profit and Inventory Loss with Goods Stock...
- excel 批量生成条码
- TDengine时序数据库FAQ系列1:JDBCDriver找不到动态链接库(no taos in java.library.path)
- css和js带参数v或version