如何读取csv文件并将其转化为tsv文件
csv:逗号分隔符文件
tsv:制表分隔符文件
二者本质上都属于类文本文件,一般用excel和文本编辑器均可打开。
如果是在程序中读取,并进行相互转化,可以用pandas这个python库。
以下给出一个代码示例:
csv-tsv.py
import pandas as pd
from sklearn.utils import shuffle # 用于数据的随机排列,也可不用if __name__ == '__main__':# 此处是读取中文数据,如果是英文数据,编码可能是'ISO 8859-1'pd_all = pd.read_csv("./Test_Data.csv", sep=',', encoding='utf-8') # 打乱数据 pd_all = shuffle(pd_all)# 保存为tsv文件,当然也可以保存为csv文件,二者区别在于sep为'\t'还是','pd_all.to_csv("./Test_Data.tsv", index=False, sep='\t', encoding='utf-8')
最后建议大家多了解一下pandas这个数据清洗的python库,很好用,能省不少事,我也是最近才用到的。
如何读取csv文件并将其转化为tsv文件相关推荐
- 读取csv文件并将其转化为tsv文件
csv:逗号分隔符文件 tsv:制表分隔符文件 二者本质上都属于类文本文件,一般用excel和文本编辑器均可打开. 如果是在程序中读取,并进行相互转化,可以用pandas这个python库. 直接转换 ...
- 多种音频文件(.wav, .mp3, .ogg)转化为wav文件,支持分、秒级别切分
多种音频文件(.wav, .mp3, .ogg)转化为wav文件,支持分.秒级别切分 需求:调用python脚本,输入源文件路径.目标路径.切割的时长.切割时长的时间单位,能够将对应路径的源音频文件按 ...
- Python如何运行.ipynb文件并将其转化为.py文件
2019独角兽企业重金招聘Python工程师标准>>> Python如何运行.ipynb文件: 先安装jupyter和notebook: pip install jupyter no ...
- Golang 操作TSV文件实战教程
本文介绍TSV文件类型及其应用,同时介绍Golang语句读取TSV文件并转为struct的实现过程. 认识TSV文件 也许你之前不了解TSV文件,无需担心,它很简单.很常用.TSV(tab-separ ...
- tsv文件导oracle窜列,TSV文件扩展名 - 什么是.tsv以及如何打开? - ReviverSoft
你在这里因为你有,有一个文件扩展名结尾的文件 .tsv. 文件与文件扩展名 .tsv 只能通过特定的应用程序推出.这有可能是 .tsv 文件是数据文件,而不是文件或媒体,这意味着他们并不是在所有观 ...
- 将.ai文件矢量图转化为.xml文件并在Android项目中使用
写在前面的话 笔者最近在做一个安卓的小项目,在开发的过程中,发现经常需要使用图标类的矢量图.下面我将详细叙述如何将从网络上下载的ai文件内的图标转化为xml文件并在Android项目中使用该图标. 使 ...
- 【OpenCV】读取csv文件
csv简介 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).纯文本意味着该文件是一个 ...
- 读取CSV文件内容,将其转换成JSON字符串输出
CsvToJsonUtil 工具类作用:读取CSV文件内容,将其转换成JSON字符串输出 转换工具类代码如下: package com.test.util;import java.io.*; impo ...
- 技术图文:C# VS. Python 读取CSV文件指南
背景 CSV 是一种以逗号进行特征分隔的文本文件类型,在数据库或电子表格中是一种非常常见的导入导出格式.本篇图文就以泰坦尼克号船员获救预测( Kaggle)中使用的数据集为例来说明 C#.Python ...
最新文章
- etcd 笔记(03)— etcd 客户端使用(键值的增、删、改、查)、watch监测键、lease使用(创建租约、撤销租约、刷新租期、查询租期)
- 透彻理解高斯核函数背后的哲学思想与数学思想
- 玩转Mixly – 6、Arduino AVR编程 之 文本
- 【CV】目标检测入门和实现思路!
- 【PAT - 甲级1095】Cars on Campus (30分)(模拟)
- Spring3 MVC 深入研究
- Tornado 上传文件及存储
- 卷积神经网络中的全连接层
- 让mysql timeStamp类型支持默认值0000-00-00 00:00:00
- Excel图表如何更改坐标轴最大值
- 计算机系统分析师高级试题及答案,2013年计算机软考系统分析师试题及答案1
- mysql的英文字母_MYSQL中查询怎么判断一个字段包含英文?
- 威漫哨兵机器人_曾经秒杀X战警的哨兵机器人,在漫威漫画原著里更让人头疼!...
- 第一章	HTML基础
- RC电路一阶线性微分方程
- 使用Vue获取外网ip地址
- 信息搜集之CDN知识
- 求生之路怎么显示服务器ip,怎么在求生之路后台查看本机局域网IP
- FLASK开启调试模式,使程序修改即时生效
- 大亚湾国土资源数据库异地容灾备份采购项目
热门文章
- 邮箱激活功能,前台用户注册后需要登录邮箱激活账号才能够登录的,请简述激活过程,重点是安全性
- [附源码]Java计算机毕业设计SSM高铁乘坐舒适性在线调查及评价系统
- 嵌入式学习(二)之SoC芯片的开发流程
- 中央电大 c语言程序设计a 试题,中央电大开放本科计算机科学与技术专业C语言程序设计(A)试题_1007...
- android模拟器无法上局域网,模拟器无法上网解决方法
- 网友发帖问阿里P7和协和主治医师谁更成功,BAT员工纷纷嘲笑.
- 把代码做成笔记——Jupyter Notebook
- OPENCV入门教程十一:dilate图像膨胀
- INV TXN MANAGER PUB PROCESS TRANSACTIONS
- ETC卡 PSAM卡消费流程(转载)