如何处理CSV中肉眼不可见的制表符
问题讲解:
处理web端下载csv文件时,经常会遇到肉眼不可见的制表符。导致G1+H1=#VALUE!,或者无法使用vlookup的情况。下面列举几种常用解决方法(涉及到Excel、PowerQuery、Python)。
Excel
1.使用分列
在对应列拆入一列,然后使用分列功能,再删除空白列。
2.使用clean函数
a.使用clean函数,按照数据量填充
b.复制clean函数的数据范围,粘贴为值
PowerQuery
把表格数据导入到PowerQuery
具体参考:在PowerQuery中实现列的拆分-百度经验 (baidu.com)
Python
只需修改path的文件链接,执行代码后,新的处理后的文件会出现在文件夹中。
【注:】删除最后一行的代码如果没有需求,可以删掉。
# 导入模块
import pandas as pd
import re
import os
# 打开文件夹
path = r'C:\Users\Kenneth\Desktop\退货数据'
to_path = os.listdir(path)
for file in to_path:# 打开文件text = pd.read_csv(path+'\\'+file,encoding="gbk")print(text)# 替换制表符text1 = text.replace("\s|\t|\n",'',regex=True)# 删除最后一行text1.drop([len(text1)-1],inplace=True)# 数据导出# os.path.splistext()[0]读取文件前缀text1.to_csv(path+'\\'+ os.path.splitext(file)[0]+'(1)'+os.path.splitext(file)[1],encoding="gbk",index=False)print(text1)
如何处理CSV中肉眼不可见的制表符相关推荐
- python处理csv文件缺失值_Python:如何处理CSV中的缺失值?
我有一个给定的CSV示例,如下所示: ID,ID_TYPE,OB_DATE,VERSION_NUM,MET_DOMAIN_NAME,OB_END_CTIME,OB_DAY_CNT,SRC_ID,REC ...
- python处理csv文件里的空值_如何处理csv中的空值
展开全部 数据库里面的"空2113值"有两种:空字符(""5261).空值(NULL). 两种存储方式在4102数据库中1653都很常见,实际中根据业务或者个人 ...
- 从重采样到数据合成:如何处理机器学习中的不平衡分类问题?
从重采样到数据合成:如何处理机器学习中的不平衡分类问题? 2017-03-19 13:17 来源:机器之心 技术 原标题:从重采样到数据合成:如何处理机器学习中的不平衡分类问题? 选自Analytic ...
- 从重采样到数据合成:如何处理机器学习中的不平衡分类问题? 转载 2017年08月01日 17:09:03 标签: 机器学习 / 数据 719 转自:http://www.sohu.com/a/12
从重采样到数据合成:如何处理机器学习中的不平衡分类问题? 转载 2017年08月01日 17:09:03 标签: 机器学习 / 数据 719 转自:http://www.sohu.com/a/1293 ...
- csv 中显示逗号和双引号
保存csv文件的时候,我们通过逗号进行分隔,如果使用excel进行打开的话,在展现上可能会有一些问题,这里使用的是office 2007,如果是一个较长数字或者为一串数字字符串,这里包括以0开始的字符 ...
- linux用分割的csv文件读取,在Linux中将制表符分隔的文件转换为CSV的最快方法
在Linux中将制表符分隔的文件转换为CSV的最快方法 我有一个制表符分隔的文件,其中包含超过2亿行. 在Linux中将其转换为CSV文件的最快方法是什么? 该文件的确包含多行标题信息,我需要将其删除 ...
- python中意外缩进是什么意思_语法错误 - 如何处理python中的“意外缩进”?
语法错误 - 如何处理python中的"意外缩进"? 如何纠正python中的"意外缩进"错误? 15个解决方案 116 votes Python在行的开头使用 ...
- python中的换行符是哪个键_对Python字符串中的换行符和制表符介绍
对Python字符串中的换行符和制表符介绍 有关换行的问题 首先提一个问题,如下. python程序代码如下: print("I'm Bob. What's your name?" ...
- python pandas库读取excel/csv中指定行或列数据详解
通过阅读表格,可以发现Pandas中提供了非常丰富的数据读写方法,下面这篇文章主要给大家介绍了关于python利用pandas库读取excel/csv中指定行或列数据的相关资料,需要的朋友可以参考下 ...
最新文章
- Java的多态(详尽版)
- samba服务器配置
- server之后安装ssms失败 安装sql_关于SQL安装失败的解决方法
- python日历函数_python 怎么定义一个函数,输出日历
- Extension project: 404 Not Found for resources/cus/crm/notes/ext/Component-dbg.js
- 寄存器、存储器、内存的区别
- linux服务器运维操作命令,Linux服务器运维常用命令列表
- iOS黑魔法-Method Swizzling
- php_2017手册,PHP中文手册下载-PHP中文手册官方2017(带用户注释)chm版-东坡下载
- 动态物体检测(python)
- 2020如何成功注册google
- 慎用驱动精灵,华硕被坑爹了一个月。笔记本关机蓝屏0x000000C5参考解决方案。
- strut2的学习笔记
- Apple Swift学习资料汇总
- 微信小程序设置页面背景颜色
- mysql查询同名同姓重名人数,查询与自己同名的人,如何查找重名人数
- MFC几种给对话框添加背景图的方法
- ::设计·创意·插画::相关网站巨集!
- [DataAnalysis]数据分析和大数据入门推荐书单
- 王老吉做奶茶 是要火还是要凉?