python计算目标文件夹中各文件的GC含量
由于需要批量迅速的计算大量散装文件的GC含量,学习他人已有的代码,稍做修改,将两个功能合起来。
代码:
from collections import OrderedDict
import os
path ='D:\\????'
#更换文夹路径,下一层是待计算文件
def get_filelist(dir):
Filelist = []
for home, dirs, files in os.walk(path):
for filename in files:
# 文件名列表,包含完整路径
Filelist.append(os.path.join(home, filename))
# # 文件名列表,只包含文件名
# Filelist.append( filename)
return Filelist
if __name__ =="__main__":
Filelist = get_filelist(dir)
print(len(Filelist))
for file in Filelist:
print(file)
ID_name = ''
temp_dict = OrderedDict()
with open(file,'r') as f:
for line in f:
if line.startswith('>'):
ID_name = line.strip()
temp_dict[ID_name] = '' #给temp_dicr[ID_name]一个空值,为了将ID存进字典里。
else:
temp_dict[ID_name] += line.strip() #这里也需要.strip()
for ID,seq in temp_dict.items():
GC_num = seq.count('G') + seq.count('C')
# if len(seq) == 0:
# continue
GC_ration = GC_num/len(seq)
print (ID + " ====> " +"%.8f"%GC_ration)
f.close()
代码来源:
GC含量计算:
https://www.cnblogs.com/nklzj/p/6275729.html#!comments
文件夹遍历:
https://blog.csdn.net/C_chuxin/article/details/83446602
python计算目标文件夹中各文件的GC含量相关推荐
- 计算机内用户文件夹中的文件,在位于计算机上所有用户的AppData文件夹中的文件中修改一行...
我想修改位于计算机上所有用户的AppData文件夹中的文件中的一行.在位于计算机上所有用户的AppData文件夹中的文件中修改一行 线在prefs.js文件来改变开始: user_pref(" ...
- python保存文件夹中的文件路径(绝对路径)
保存文件夹中的文件路径(绝对路径). # !/usr/bin/env python # -*- encoding: utf-8 -*-import osimg_path = '/home/jjuv/D ...
- Python 获取文件夹中的文件列表
获取文件夹中的文件列表 问题 你想获取文件系统中某个目录下的所有文件列表. 解决方案 使用 os.listdir() 函数来获取某个目录中的文件列表: import os names = os.lis ...
- Flume监听文件夹中的文件变化,并把文件下沉到hdfs
1.采集目录到HDFS 采集需求:某服务器的某特定目录下,会不断产生新的文件,每当有新文件出现,就需要把文件采集到HDFS中去 根据需求,首先定义以下3大要素 采集源,即source--监控文件目录 ...
- Flume监听文件夹中的文件变化_并把文件下沉到hdfs
摘要: 1.采集目录到HDFS 采集需求:某服务器的某特定目录下,会不断产生新的文件,每当有新文件出现,就需要把文件采集到HDFS中去 根据需求,首先定义以下3大要素 采集源,即source--监控文 ...
- mvfiles:一次性提取多个文件夹中的文件
作者:吴玉轩 (南开大学) Stata 连享会: 知乎 | 简书 | 码云 | CSDN Stata连享会 精品专题 || 精彩推文 2019暑期"实证研究方法与经典论文" ...
- 拷贝文件(包括文件夹中的文件夹)
''' 1.查看来源文件夹中的文件 2.通过遍历得到文件夹中的文件(文件名+扩展名) 3.拼接文件 (文件夹+文件名+扩展名) 4.判断来源文件中是 文件夹 还是 文件明.扩展名如果是文件夹则:.提前 ...
- VMware虚拟机文件夹中各文件作用详解
VMware虚拟机文件夹中各文件作用详解 虚拟机的文件管理由VMware Workstation来执行. 一个虚拟机一般以一系列文件的形式储存在宿主机中, 这些文件一般在由workstation为虚拟 ...
- 记录一下提取文件夹中所有文件名字
配置Opencv很有用 快速提取文件夹中所有文件的名称! - 简书 (jianshu.com)
- C++读取文件夹中所有文件的路径,包含子文件夹
C++读取文件夹中所有文件的路径,包含子文件夹 C++实现指定文件夹的路径,获取该路径下所有文件的路径,含子文件夹的文件,为了实现跨平台编译,最后会给出Window和Linux的完成程序: [1]下面 ...
最新文章
- 数人云CEO王璞:容器正成为软件交付的标准
- UA MATH565C 随机微分方程III Ito积分的构造
- android 时间计划软件,时间规划局专业版
- python 代理抓包_python requests代理设置,fiddler抓包
- 处理器后面的字母含义_工业铝型材名称的含义是什么
- PLSQL工具连接Oracle
- PWM整流器仿真。 在simulink中搭建了PWM整流器,采用电压电流双闭环控制,实现了网侧电压与电流同相位,单位功率因数运行
- 【个人笔记一】ART系统类的编译解析加载探究
- AutoCAD2007 打开缓慢解决方案
- onblur onchange
- 手把手教你实现基于eTS的分布式计算器
- 【NOIP2006】【Luogu1063】能量项链
- XP IIS之——问题总结
- C++ 实验3-2本月有几天?
- C#中Get和Set的用法
- ORA-12705:无法访问NLS数据文件或者指定的环境无效
- 用Unity进行网络游戏开发(一)
- telegraf介绍
- 分享:DFC开发平台的设计理念
- php下载视频文件怎么打开,后缀名为php的视频文件用什么播放器?