txt如何转成tsv文件
首先区别这三个:
- csv文件,每一行中不同的数据用逗号分开, 不包含空格。
- tsv文件,分隔符号是‘\t’ 而不是csv中的逗号。
我是用的笨方法,先转成csv文件,再转成tsv。有其他更好用的方法可以交流
// txt to csv
import csv
csvFile = open("dev2.csv",'w',newline='',encoding='utf-8') // 我的数据是中文数据集,所以用utf-8
writer = csv.writer(csvFile)
csvRow = []f = open("dev.txt",'r',encoding='utf8')
for line in f:csvRow = line.split()writer.writerow(csvRow)
f.close()
csvFile.close()# 由于在txt中也包含了空格,所以得到的csv文件是根据空格划分的。
# 我的数据集的格式分成了两部分: (一个中文短句:string, 一个标签:int),但是短句中包括了空格,所以这样变换会分成三个或者更多个部分。# 所以改进代码,将list中的前[:-1]个合并成一个部分。
# 改进后代码如下:
import csv
csvFile = open("dev2.csv",'w',newline='',encoding='utf-8')
writer = csv.writer(csvFile)
csvRow = []f = open("dev.txt",'r',encoding='utf8')
for line in f:csvRow = line.split()temp_label = csvRow.pop() # 得到最后一个元素csvRow = ["".join(csvRow),temp_label] # join合并元素print(csvRow)writer.writerow(csvRow)
f.close()
csvFile.close()# # 转成tsv文件
with open('dev2.csv',encoding='utf-8') as f:data = f.read().replace(',', '\t')
with open('dev.tsv','w',encoding='utf-8') as f:f.write(data)
f.close()
txt如何转成tsv文件相关推荐
- tsv文件与csv文件的区别以及如何转换
文章目录 一 csv和tsv文件 二 相互转换 1 读取tsv文件,并将其改写成csv文件 2 读取csv文件,并将其改写成tsv文件 一 csv和tsv文件 1 csv文件:逗号分隔符文件,可以使用 ...
- 读取csv和tsv文件以及两者的相互转换
目录 一.csv和tsv的区别 二.tsv文件和csv文件的相互转换 1.读取tsv文件,并将其改写成csv文件 2.读取csv文件,并将其改写成tsv文件 ⭐补充理解: 一.csv和tsv的区别 ( ...
- python将txt转换为csv_Python Pandas 三行代码将 txt 文件转换成 csv 文件
今天需要处理几个比较大的 txt 文件,每个文件都在 2GB 以上,直接用 Excel 将其转换成 csv 文件显然是不太可行的,于是用 Python 中的数据处理神器 Pandas,三行代码就能搞定 ...
- 利用MATLAB将图片转换成coe文件、TXT文件、mif文件、bin文件
利用MATLAB将图片转换成coe文件.TXT文件.mif文件 利用MATLAB将图片转换成coe文件 利用MATLAB将图片转换成txt文件 利用MATLAB将图片转换成mif文件 利用MATLAB ...
- 将多个txt文本文件合并成一个txt文件
将多个txt文本文件合并成一个txt文件 方法一:批处理文件 有文档1.txt.2.txt 新建一个文档:合并文档.txt,在该合并文档中输入 copy/b 1.txt+2.txt 3.txt 将合并 ...
- win10怎么将txt转换为html,win10怎么把txt格式改成bat_win10系统txt文件改成bat操作方法-win7之家...
在win10系统中,有着我们所熟悉的一些文件格式,当然同意存在着一些用户很少见到也不知道作用的文件,同时这些文件大多数也是可以进行转换,近日有些用户就想要将txt格式改成bat,那么win10怎么把t ...
- 实现一个小程序,把txt文件里面的十六进制数据读取出来,转成bin文件
txt文件里面装的是十六进制的数据,而bin文件是二进制,因此我们要把十六进制转为二进制.实现思路就是,以可读的方式打开txt文件,然后以读写打开或建立一个二进制是wb+,打开后,不断的用fgetc读 ...
- 1.txt文件转换成csv文件
######txt文件转换成csv文件import numpy as np # linear algebra import pandas as pd # data processing, CSV fi ...
- R语言数据导出(数据保存、导出、持久化到本地指定目录文件)、保存为txt、csv、tsv、xls、xlsx、dta、sas、sps格式文件
R语言数据导出(数据保存.导出.持久化到本地指定目录文件).保存为txt.csv.tsv.xls.xlsx.dta.sas.sps格式文件 目录
最新文章
- 剑指offer(49)把字符串转换成整数。
- @EnableTransactionManagement原理
- 镗孔指令g76格式_数控车床螺纹切削指令G32,用途广泛,可分度车削多头螺纹
- sklearn 线性回归_使用sklearn库做线性回归拟合
- [react] 说出几点你认为的React实践
- React Native开发指南-在原生和React Native间通信
- php解析.krc,krc歌词文件解析
- 华为网络计算机ct2000,2019-02-22 华为U2000 ESN查询及License加载
- android webview 视频黑屏,【原创】webview加载flash视频黑屏的解决方法(一把鼻涕一把泪,所谓经验的重要性)...
- Any CPU X86 X64区别
- 不小心把文件夹管理员权限删除的回复方法
- 派森诺细菌完成图标准分析轻松发文
- App Store 审核指南 2017-12-11
- psa加密_PSA:请注意这种新的Google翻译网络钓鱼攻击
- 转:SQL server中转换大小写快捷键
- Win10配置Java开发环境
- 飞思卡尔Kinetis 60(K60)时钟系统分析
- 广州软件学院C语言——实验3 最简单C程序设计1
- 博科brocade SAN光纤交换机端口激活过程(新版)
- ANSI/ESD S541-2019 用于保护静电放电敏感物品 - 包装材料,中文,英文发布
热门文章
- mysql中resultmap_MyBatis学习 之 二、SQL语句映射文件(1)resultMap
- 最新织梦仿冷轩资源网模板(善恶资源网、新版小刀娱乐网模板)
- emlog程序仿小刀娱乐网模板最终版本
- SCI英文文献模板/查看SCI论文分区/tex模板的使用
- crm客户关系管理系统(vue+maven多模块+SSM)
- 对产品运营策划与运营策划的要求
- 如何利用企业微信促成交易?
- LES生产物流执行系统,实施精益生产五大托词
- 蚪侠镜像站群-V25版[泛域名+泛目录+泛内页]-1对1镜像-泛镜像-[代码+汉字]干扰-字体繁简切换-蜘蛛欺骗-主动推送-全局锚文本锁定-秒仿[PC+移动]端站点
- FCoE常见问题解答