python txt文件的数据筛选
之前已经分享完python的数据类型和数据结构了,我认为掌握了这两方面内容其实已经具备使用python进行数据分析的能力了,但实际情况是你经常会发现你看了很多python的基础内容,而当你要使用时还是发现无从下手(哈哈,因为我一开始是这样),那是因为你缺少实战经验,实战才是学习掌握python的最快办法。所以要从零开始学习python,有目的的边查边写能够让你迅速掌握python。在整理写作过程中也发现了一个非常好的python学习资源,介绍的非常详细,链接如下:
Python - 100天从新手到大师
https://github.com/jackfrued/Python-100-Days
这个链接的内容较多,但没有太大的目的性,我今天的主要目的就是利用python进行数据筛选。情况是这样的,我目前有20个.txt文件(假设名为1.txt - 20.txt),各个文件内容如下:
我想筛选每个文件中p小于0.05,foldchange绝对值大于2的所有行,并分别输出(要是熟悉RNA-seq其实就是差异基因的筛选)
代码如下:
#!/usr/bin/env python3excel_name = []
for i in range(1,4):excel_name.append(str(i) + '.' + 'txt')
print(excel_name)for j in excel_name:fl = str(j[:-3]) + 'DEG.txt'DEG = open(fl, 'w')DEG.write('gene' + '\t' + 'sample_1' + '\t' + 'sample_2' + '\t' + 'value1' + '\t' + 'value2' + '\t' + 'foldchange' + '\t' + 'p' + '\t' + 'q' + '\n')with open (j) as a:next(a)for i in a:ii = i.strip().split('\t')if float(ii[6]) < float(0.05) and abs(float(ii[5])) >= int(1):DEG.write(str(ii[0]) + '\t' + str(ii[1]) + '\t' + str(ii[2]) + '\t' + str(ii[3]) + '\t' + str(ii[4]) + '\t' + str(ii[5]) + '\t' + str(ii[6]) + '\t' + str(ii[7]) + '\n')
print('done')
该脚本能帮你掌握的内容:
for-in 循环的使用 for j in excel_name:
range(),append(),write(),next(),strip(),split() 的使用
索引的使用 ii[6]
切片的使用 j[:-3]
文件的读取 with open (j) as a:与输出 DEG = open(fl, ‘w’)
if语句进行判断
运算符的使用
正则表达式 \t ,\n
若无经验,使用方法可参考 Python - 100天从新手到大师
此外注意:在python中有两个模块(pandas,numpy)可用于处理excel文件,处理文件更高效,该脚本主要是为了处理txt文件,无需调用模块
原文详细说明链接:https://mp.weixin.qq.com/s?__biz=MzUzNjA5MzA1Nw==&mid=2247483693&idx=1&sn=8b0759e2b86182aa64bf7e103950eac0&chksm=fafac9c3cd8d40d5fe7b131210485bdf2e33103f6eed73f85db680bab75e5ff499fd466aab25&token=665225232&lang=zh_CN#rd
python txt文件的数据筛选相关推荐
- python两个表格相同数据筛选_python如何统计所有文本文件的行数 如何用python实现两个文件重复数据筛选并统计...
如何用python统计文本中重复行的数目? python比较txt文档中每行文本之间重复词的个数不想面对他离开,逃避不是一个好方法,但却是唯一的办法. 每一行弄成一个集合,分享两个集合之间的交集,计算 ...
- c++ 按行读取txt文件并赋值_python操作txt文件中数据教程[3]python读取文件夹中所有txt文件并将数据转为csv文件...
觉得有用的话,请点击右下角 推荐给更多小伙伴 neoken_xuAsurada2015Evacloud 参考文献 python 操作 txt 文件中数据教程[1]-使用 python 读写 txt 文 ...
- python excel处理重复行并统计个数_excel两个表格数据核对python-如何用python实现两个文件重复数据筛选并统计...
怎么用python读取excel表格的数据 import pandas as pd excel1_data = pd.read_excel( 文件路径) excel2_data = pd.read_e ...
- python实现图书管理系统——通过excel文件或者TXT文件存放数据
用python实现图书管理系统--通过excel文件或者TXT文件存放数据 话不多说,先上图,看看运行起来的效果: 由上图可知,我实现的主要功能: 用户注册 用户登录 添加图书 查询图书 删除图书 修 ...
- python文件读取输出-Python 读写文件中数据
1 需求 在文件 h264.txt 中的数据如图1,读入该文件中的数据,然后将第1列的地址删除,然后将数据输出到h264_out.txt中: 图1 h264.txt 数据截图 图2 输出文件 h264 ...
- python txt文件处理软件,对python .txt文件读取及数据处理方法总结
1.处理包含数据的文件 最近利用python读取txt文件时遇到了一个小问题,就是在计算两个np.narray()类型的数组时,出现了以下错误: 作为一个python新手,遇到这个问题后花费了挺多时间 ...
- python读取txt文件写入-python txt文件的写入和读取
1.文件的打开 使用open () 函数 打开文件.他有两个参数,文件路径或文件名和文件的打开方式. "r" 只读模式,不能编辑和删除文件内容. "w" 写入模 ...
- python txt文件读写(追加、覆盖)
python txt文件读写(追加.覆盖) 读取文件每一行 # 读取文件每一行 with open(r"C:\Users\xiahuadong\Desktop\数字人代码\文件行数.txt& ...
- 从Oracle导出数据到TXT文件从TXT文件导入数据到Oracle
如果是txt文件的数据导入oracle中,数据量大的话用pl/sql会卡死,那么就要用到sqlload命令. 前两天在做一个不算任务的任务,用shell脚本将数据库中的数据导出到文件,在万能的百度上找 ...
最新文章
- 用WinInet开发Internet客户端应用指南
- angular1配合gulp和bower使用
- 函数声明与函数表达式
- nsfocus 十周年了 时间过得好快啊... 恭喜下...
- gwt api_使用RequestFactory API进行Spring GWT集成
- sdn框架的计算机网络管理,清华SDN实践--SDN 系统架构与数据中心应用
- 【计算机网络】计算机网络体系结构
- 阶段性总结_学习笔记
- Javascript隐式数据类型转换(==、+、Object)
- percona-toolkit 之 【pt-deadlock-logger】说明
- ArcGIS案例学习笔记_3_2_CAD数据导入建库
- 代码高亮与美化的工具
- 个人设计web前端大作业 基于html5制作美食菜谱网页设计作业代码
- 一万年很长,所以只争朝夕
- bpm导出成html,一种基于BPM系统的EXECL导入免开发生成静态HTML表单的方法与流程...
- JavaScript-- 基础知识面试题
- idea的项目模板的创建
- VSCode更新到1.42.1版本有问题(January 2020 (version 1.42))
- python版飞机大战及码源
- U盘无法格式化的几个解决方法
热门文章
- 京东面试详解(渣渣吐血整理版)
- 实现子弹自动向前运动 定时器 移动精灵 精灵释放
- 计算机大学生的代码作业帮做,现在越来越多的学生使用
- Linux的安装(一步一步教你安装Linux)
- 博朗x乐高全球限量型趣宝盒首发
- Java之OutOfMemoryError简单分析
- ajax localhsot,ajax请求nodejs后台,开启服务器后,localhost:3000/index.html页面既没有报错,也没有文字。。。...
- 移动开发唱衰,iOS开发者如何涅槃重生?
- CSS基础五(盒模型)
- NetCore3.1简单使用JWT