读取csv文件并将其转化为tsv文件
csv:逗号分隔符文件
tsv:制表分隔符文件
二者本质上都属于类文本文件,一般用excel和文本编辑器均可打开。
如果是在程序中读取,并进行相互转化,可以用pandas这个python库。
直接转换的代码:
import pandas as pdif __name__ == '__main__':# 此处是读取中文数据,如果是英文数据,编码可能是'ISO 8859-1'pd_all = pd.read_csv("./Test_Data.csv", sep=',', encoding='utf-8') # 保存为tsv文件,当然也可以保存为csv文件,二者区别在于sep为'\t'还是','pd_all.to_csv("./Test_Data.tsv", index=False, sep='\t', encoding='utf-8')
需要打乱数据的代码:
import pandas as pd
from sklearn.utils import shuffle # 用于数据的随机排列,也可不用if __name__ == '__main__':# 此处是读取中文数据,如果是英文数据,编码可能是'ISO 8859-1'pd_all = pd.read_csv("./Test_Data.csv", sep=',', encoding='utf-8') # 打乱数据 pd_all = shuffle(pd_all)# 保存为tsv文件,当然也可以保存为csv文件,二者区别在于sep为'\t'还是','pd_all.to_csv("./Test_Data.tsv", index=False, sep='\t', encoding='utf-8')
读取csv文件并将其转化为tsv文件相关推荐
- 如何读取csv文件并将其转化为tsv文件
csv:逗号分隔符文件 tsv:制表分隔符文件 二者本质上都属于类文本文件,一般用excel和文本编辑器均可打开. 如果是在程序中读取,并进行相互转化,可以用pandas这个python库. 以下给出 ...
- 多种音频文件(.wav, .mp3, .ogg)转化为wav文件,支持分、秒级别切分
多种音频文件(.wav, .mp3, .ogg)转化为wav文件,支持分.秒级别切分 需求:调用python脚本,输入源文件路径.目标路径.切割的时长.切割时长的时间单位,能够将对应路径的源音频文件按 ...
- Python如何运行.ipynb文件并将其转化为.py文件
2019独角兽企业重金招聘Python工程师标准>>> Python如何运行.ipynb文件: 先安装jupyter和notebook: pip install jupyter no ...
- 将.ai文件矢量图转化为.xml文件并在Android项目中使用
写在前面的话 笔者最近在做一个安卓的小项目,在开发的过程中,发现经常需要使用图标类的矢量图.下面我将详细叙述如何将从网络上下载的ai文件内的图标转化为xml文件并在Android项目中使用该图标. 使 ...
- Golang 操作TSV文件实战教程
本文介绍TSV文件类型及其应用,同时介绍Golang语句读取TSV文件并转为struct的实现过程. 认识TSV文件 也许你之前不了解TSV文件,无需担心,它很简单.很常用.TSV(tab-separ ...
- tsv文件导oracle窜列,TSV文件扩展名 - 什么是.tsv以及如何打开? - ReviverSoft
你在这里因为你有,有一个文件扩展名结尾的文件 .tsv. 文件与文件扩展名 .tsv 只能通过特定的应用程序推出.这有可能是 .tsv 文件是数据文件,而不是文件或媒体,这意味着他们并不是在所有观 ...
- Springboot读取.csv文件并转化为JSON对象
有时候我们需要读取.csv文件并将其中的数据处理成json对象以便后续处理,在这里整理了简单的处理流程. 1. 代码实现 1)引入依赖 <dependency><groupId> ...
- python csv读取-Python读取csv文件(详解版,看了无师自通)
前面程序展示的数据都是直接通过程序给出的,但实际应用可能需要展示不同来源(比如文件.网络).不同格式(比如 csv.JSON)的数据,这些数据可能有部分是损坏的,因此程序需要对这些数据进行处理. cs ...
- python批量读取csv文件-使用Python读写csv文件的三种方法
行之间无空行十分重要,如果有空行或者数据集中行末有空格,读取数据时一般会出错,引发[list index out of range]错误.PS:已经被这个错误坑过很多次! 使用python I/O写入 ...
最新文章
- mysql 1280_mysql基础
- bzoj 1468 Tree(点分治模板)
- Servlet一次乱码排查后的总结
- Vue+Leaflet-side-by-side插件实现拉帘对比效果
- 【Leetcode】岛屿问题(数量,周长,面积)
- CobarClient源码分析
- eBay再度问路中国
- git提交过滤package.json_eclipse配置git环境以及使用git提交本地仓和远程仓
- 如何在centos中找到安装mysql_centos上如何安装mysql
- 致谢!华为全联接2020精彩回顾
- 区块链安全 - DAO攻击事件解析
- js能订阅mq吗_ActiveMQ+MQTT实现客户端订阅推送模式(一)订阅者
- 【最小割】HDU 4971 A simple brute force problem.
- 运行Android Studio自带模拟器报:Guest isn't online after 7 second...
- html5 mature,Deep Dive into “HTML5”
- ArcGIS+Fragstats软件进行景观格局指数分析(附练习数据下载)
- 双足机器人Maltab腿部建模,正运动学分析
- 医疗CT断层图像DICOM标准和工业CT断层图像DICONDE标准
- (转)通过修改键盘映射替代损坏按键
- 每日分享,一个不错的数据分析实战案例【数据分析可视化】MySQL+Python
热门文章
- Android攻城狮重新认识Toast
- linux缺页异常,操作系统缺页异常
- 做单:第3章 骂人的客户
- Kubernetes (K8s) 安装部署过程(七)之部署node节点
- 一加6android p上手,一加6秒速跟进安卓P 教你尝鲜速成开发者
- 《影响力》(你为什么会说“是”?)读书
- 毕业季好难抉择丨考研还是工作我该选哪一个?!
- 计算机的rom与硬盘区别,RAM和ROM亲们傻傻分不清?
- Keil5 编译时显示..\OBJ\TPAD.axf: error: L6002U: Could not open file ..\obj\main.o: No such file or direct
- 图像语义分割python_图像语义分割 —利用Deeplab v3+训练VOC2012数据集