这里使用的python3.6,pycharm2017profession(不知道其他版本是否适合)
接下来进入正题:

  1. 导入tsv、re、json库

首先,由于python3.6没有tsv库,所以使用命令行窗口,输入pip install tsv,安装tsv库,接着在pycharm中输入(re、json库同理如上)

import tsv
import re
import json

这样第一步的导入tsv、re、json库就成功了

  1. 对tsv数据进行处理
with open('hair_dryer.tsv','r',encoding='UTF-8') as fp: #这里的'hair_dryer.tsv'是你的tsv文件,记得跟这个文件放在同一文件夹哦!reader = tsv.TsvReader(fp) #对tsv进行读取list_Data = [] #建立一个列表,等下可以使用apppend()函数,对for循环中的数据进行承接for x in reader: #对每一行的数据进行处理 这个x是 map()类型data = list(x) #将map类型变成list类型need_data = data[-2] #这里的-2是列表的倒数第二个数据,你看你的需要,因为本文主要是提取数据中的文本,文本恰好位于倒数第二个deal_need_data = re.sub("<.+?>|[^a-zA-Z0-9' .,]","",need_data).strip() #去除标签内的内容,这里因为内容是英文的所以保留是英文、数字、和一些常用的符号list_Data.append(deal_need_data) #对数据进行承接,得到一个所需要的那一列数据的列表print(list_Data)
  1. 转化成json
with open('data.json','w',encoding='utf-8') as fp: #这里使用的是将数据转化成json,对文件进行命名‘data.json’,或者其他json.dump(list_Data,fp) #使用json.dump()函数,第一个参数是列表数据,第二个参数似乎是指针指向fp(即'data.json')

提取tsv数据并转化成json——致找不出怎么提取tsv文件中数据的五小时相关推荐

  1. python中数据读写_【循序渐进学Python——文件中数据的读写以及操作】

    [循序渐进学Python--文件中数据的读写以及操作] [循序渐进学Python--文件中数据的读写以及操作] [循序渐进学Python--文件中数据的读写以及操作] 相信大家都想过自己有一天,可以用 ...

  2. python文件读取输出-Python 读写文件中数据

    1 需求 在文件 h264.txt 中的数据如图1,读入该文件中的数据,然后将第1列的地址删除,然后将数据输出到h264_out.txt中: 图1 h264.txt 数据截图 图2 输出文件 h264 ...

  3. c++ 按行读取txt文件并赋值_python操作txt文件中数据教程[3]python读取文件夹中所有txt文件并将数据转为csv文件...

    觉得有用的话,请点击右下角 推荐给更多小伙伴 neoken_xuAsurada2015Evacloud 参考文献 python 操作 txt 文件中数据教程[1]-使用 python 读写 txt 文 ...

  4. linux 查看文件中数据类型,Linux下使用file命令确定文件中数据的类型-文件类型...

    青年是学习智慧的时期,中年是付诸实践的时期.--卢梭 在Linux系统中查看一个文件之前,要先确定该文件中数据的类型,之后再使用适当的命令或方法打开该文件. 与windows系统不同,在Linux系统 ...

  5. Python webdriver 读取本地csv文件中数据 提示:IOError: [Errno 2] No such file or directory

    创建本地文件  打开excel,创建数据,另存为 XXX.csv 编写代码并调式 #-*-coding:utf-8-*- import os import csv #导入csv包files = fil ...

  6. 请编写程序,读入CSV文件中数据,循环获得用户输入,直至用户直接输入“Q”退出。根据用户输入的星座名称,输出此星座的出生日期范围及对应字符形式。如果输入的名称有误,请输出“输入星座名称有误”

    星座,开始月日,结束月日,Unicode ‌水瓶座,120,218,9810 ‌双鱼座,219,320,9811 ‌白羊座,321,419,9800 ‌金牛座,420,520,9801 ‌双子座,52 ...

  7. 理论作业八cqupt,数列计算函数,字母计数, 文件中数据转列表2

    数列计算函数 因为第二个数n是两个数的和,所以减去n???好吧,我也没太搞明白 import sys m = input() n = input() if '.' in m or '.' in n:p ...

  8. xml文件拆分 python_用Python提取合并由集搜客爬取的多个xml文件中的数据 | 向死而生...

    为了爬点小数据同时试用了八爪鱼和集搜客.两者都有免费版本,但八爪鱼数据导出需要积分,集搜客可以不用积分.不过八爪鱼导出的数据有多种格式可选,而集搜客如果不用积分就只能得到一堆xml文件.本着能省则省的 ...

  9. mysql导入csv文件 第一行有问题_mysql 导入 csv文件中数据,只能导入第一行

    用workbench导入csv数据,只能导入数据的第一行,也就是标注每一列的列名的那一行. 但问题是,每次导入完成时,系统提示已经导入了500条记录(这个文件中的确有500条记录),可是刷新数据库后打 ...

最新文章

  1. 江苏省三级偏硬考核重点
  2. C++入门之常量与变量
  3. “Zhuang.Data”轻型数据库访问框架(一)开篇介绍
  4. 8255交通灯实验的微型计算机,微机原理课程设计——8255,8253交通灯模拟实验.doc...
  5. Design Patterns - Mediator Pattern
  6. 第一章 初识Mathematica
  7. scala hashmap_如何在Scala中将Hashmap转换为Map?
  8. 自动补足算法是什么_数据、算法岗的几点经验分享!
  9. EntityFramework Code First 添加唯一键
  10. vfp 修改本机时间_时间旅行调试
  11. 国开大学计算机应用基础形考答案模块了2,国开电大 计算机应用基础(本) 形考二答案...
  12. java day23【函数式接口】
  13. luajit日记-配置说明
  14. android学习资料免费下载
  15. c mysql开发工具_Windows平台下Mysql C程序设计
  16. 并发测试工具Jmeter安装与简单使用
  17. 阿里巴巴达摩院:自然语言处理技术有哪些进展和趋势?
  18. DELL笔记本UEFI+GPT安装window10与Ubuntu双系统
  19. pythonidle是什么_Python入门 | IDLE的介绍和使用方法
  20. 【- Flutter 桌面篇 -】 FlutterUnit win版闪亮登场

热门文章

  1. Memcahce和Redis比较
  2. poj 1005 I Think I Need a Houseboat
  3. thinking back no9
  4. 7.2Python入门(三)
  5. 视频采集以及播放的流程
  6. [转载]Zookeeper开源客户端框架Curator简介
  7. 组内Linq培训记录
  8. Jquery,Ready函数.
  9. 多线程扫描网络计算机
  10. C# Winfrom DataGridView DataSource绑定数据源后--解决排序问题