首先区别这三个:

  • csv文件,每一行中不同的数据用逗号分开, 不包含空格。
  • tsv文件,分隔符号是‘\t’ 而不是csv中的逗号。

我是用的笨方法,先转成csv文件,再转成tsv。有其他更好用的方法可以交流

// txt to csv
import csv
csvFile = open("dev2.csv",'w',newline='',encoding='utf-8') // 我的数据是中文数据集,所以用utf-8
writer = csv.writer(csvFile)
csvRow = []f = open("dev.txt",'r',encoding='utf8')
for line in f:csvRow = line.split()writer.writerow(csvRow)
f.close()
csvFile.close()# 由于在txt中也包含了空格,所以得到的csv文件是根据空格划分的。
# 我的数据集的格式分成了两部分: (一个中文短句:string, 一个标签:int),但是短句中包括了空格,所以这样变换会分成三个或者更多个部分。# 所以改进代码,将list中的前[:-1]个合并成一个部分。
# 改进后代码如下:
import csv
csvFile = open("dev2.csv",'w',newline='',encoding='utf-8')
writer = csv.writer(csvFile)
csvRow = []f = open("dev.txt",'r',encoding='utf8')
for line in f:csvRow = line.split()temp_label = csvRow.pop()  # 得到最后一个元素csvRow = ["".join(csvRow),temp_label]  # join合并元素print(csvRow)writer.writerow(csvRow)
f.close()
csvFile.close()# # 转成tsv文件
with open('dev2.csv',encoding='utf-8') as f:data = f.read().replace(',', '\t')
with open('dev.tsv','w',encoding='utf-8') as f:f.write(data)
f.close()

txt如何转成tsv文件相关推荐

  1. tsv文件与csv文件的区别以及如何转换

    文章目录 一 csv和tsv文件 二 相互转换 1 读取tsv文件,并将其改写成csv文件 2 读取csv文件,并将其改写成tsv文件 一 csv和tsv文件 1 csv文件:逗号分隔符文件,可以使用 ...

  2. 读取csv和tsv文件以及两者的相互转换

    目录 一.csv和tsv的区别 二.tsv文件和csv文件的相互转换 1.读取tsv文件,并将其改写成csv文件 2.读取csv文件,并将其改写成tsv文件 ⭐补充理解: 一.csv和tsv的区别 ( ...

  3. python将txt转换为csv_Python Pandas 三行代码将 txt 文件转换成 csv 文件

    今天需要处理几个比较大的 txt 文件,每个文件都在 2GB 以上,直接用 Excel 将其转换成 csv 文件显然是不太可行的,于是用 Python 中的数据处理神器 Pandas,三行代码就能搞定 ...

  4. 利用MATLAB将图片转换成coe文件、TXT文件、mif文件、bin文件

    利用MATLAB将图片转换成coe文件.TXT文件.mif文件 利用MATLAB将图片转换成coe文件 利用MATLAB将图片转换成txt文件 利用MATLAB将图片转换成mif文件 利用MATLAB ...

  5. 将多个txt文本文件合并成一个txt文件

    将多个txt文本文件合并成一个txt文件 方法一:批处理文件 有文档1.txt.2.txt 新建一个文档:合并文档.txt,在该合并文档中输入 copy/b 1.txt+2.txt 3.txt 将合并 ...

  6. win10怎么将txt转换为html,win10怎么把txt格式改成bat_win10系统txt文件改成bat操作方法-win7之家...

    在win10系统中,有着我们所熟悉的一些文件格式,当然同意存在着一些用户很少见到也不知道作用的文件,同时这些文件大多数也是可以进行转换,近日有些用户就想要将txt格式改成bat,那么win10怎么把t ...

  7. 实现一个小程序,把txt文件里面的十六进制数据读取出来,转成bin文件

    txt文件里面装的是十六进制的数据,而bin文件是二进制,因此我们要把十六进制转为二进制.实现思路就是,以可读的方式打开txt文件,然后以读写打开或建立一个二进制是wb+,打开后,不断的用fgetc读 ...

  8. 1.txt文件转换成csv文件

    ######txt文件转换成csv文件import numpy as np # linear algebra import pandas as pd # data processing, CSV fi ...

  9. R语言数据导出(数据保存、导出、持久化到本地指定目录文件)、保存为txt、csv、tsv、xls、xlsx、dta、sas、sps格式文件

    R语言数据导出(数据保存.导出.持久化到本地指定目录文件).保存为txt.csv.tsv.xls.xlsx.dta.sas.sps格式文件 目录

最新文章

  1. 剑指offer(49)把字符串转换成整数。
  2. @EnableTransactionManagement原理
  3. 镗孔指令g76格式_数控车床螺纹切削指令G32,用途广泛,可分度车削多头螺纹
  4. sklearn 线性回归_使用sklearn库做线性回归拟合
  5. [react] 说出几点你认为的React实践
  6. React Native开发指南-在原生和React Native间通信
  7. php解析.krc,krc歌词文件解析
  8. 华为网络计算机ct2000,2019-02-22 华为U2000 ESN查询及License加载
  9. android webview 视频黑屏,【原创】webview加载flash视频黑屏的解决方法(一把鼻涕一把泪,所谓经验的重要性)...
  10. Any CPU X86 X64区别
  11. 不小心把文件夹管理员权限删除的回复方法
  12. 派森诺细菌完成图标准分析轻松发文
  13. App Store 审核指南 2017-12-11
  14. psa加密_PSA:请注意这种新的Google翻译网络钓鱼攻击
  15. 转:SQL server中转换大小写快捷键
  16. Win10配置Java开发环境
  17. 飞思卡尔Kinetis 60(K60)时钟系统分析
  18. 广州软件学院C语言——实验3 最简单C程序设计1
  19. 博科brocade SAN光纤交换机端口激活过程(新版)
  20. ANSI/ESD S541-2019 用于保护静电放电敏感物品 - 包装材料,中文,英文发布

热门文章

  1. mysql中resultmap_MyBatis学习 之 二、SQL语句映射文件(1)resultMap
  2. 最新织梦仿冷轩资源网模板(善恶资源网、新版小刀娱乐网模板)
  3. emlog程序仿小刀娱乐网模板最终版本
  4. SCI英文文献模板/查看SCI论文分区/tex模板的使用
  5. crm客户关系管理系统(vue+maven多模块+SSM)
  6. 对产品运营策划与运营策划的要求
  7. 如何利用企业微信促成交易?
  8. LES生产物流执行系统,实施精益生产五大托词
  9. 蚪侠镜像站群-V25版[泛域名+泛目录+泛内页]-1对1镜像-泛镜像-[代码+汉字]干扰-字体繁简切换-蜘蛛欺骗-主动推送-全局锚文本锁定-秒仿[PC+移动]端站点
  10. FCoE常见问题解答