由于需要批量迅速的计算大量散装文件的GC含量,学习他人已有的代码,稍做修改,将两个功能合起来。

代码:

from collections import OrderedDict
import os

path ='D:\\????'
#更换文夹路径,下一层是待计算文件

def get_filelist(dir):
 
    Filelist = []
 
    for home, dirs, files in os.walk(path):
 
        for filename in files:
 
            # 文件名列表,包含完整路径
 
            Filelist.append(os.path.join(home, filename))
 
            # # 文件名列表,只包含文件名
 
            # Filelist.append( filename)
    return Filelist
 
if __name__ =="__main__":
 
    Filelist = get_filelist(dir)
    print(len(Filelist))

for file in Filelist:
        print(file)
        ID_name = ''
        temp_dict = OrderedDict()
        with open(file,'r') as f:
            
            for line in f:
                if line.startswith('>'):
                    ID_name = line.strip()
                    temp_dict[ID_name] = ''  #给temp_dicr[ID_name]一个空值,为了将ID存进字典里。
                    
                else:
                    temp_dict[ID_name] += line.strip() #这里也需要.strip()

for ID,seq in temp_dict.items():
            GC_num = seq.count('G') + seq.count('C')
#            if len(seq) == 0:
#                continue
            GC_ration = GC_num/len(seq)
            print (ID + " ====> " +"%.8f"%GC_ration)
        f.close()

代码来源:

GC含量计算:

https://www.cnblogs.com/nklzj/p/6275729.html#!comments

文件夹遍历:

https://blog.csdn.net/C_chuxin/article/details/83446602

python计算目标文件夹中各文件的GC含量相关推荐

  1. 计算机内用户文件夹中的文件,在位于计算机上所有用户的AppData文件夹中的文件中修改一行...

    我想修改位于计算机上所有用户的AppData文件夹中的文件中的一行.在位于计算机上所有用户的AppData文件夹中的文件中修改一行 线在prefs.js文件来改变开始: user_pref(" ...

  2. python保存文件夹中的文件路径(绝对路径)

    保存文件夹中的文件路径(绝对路径). # !/usr/bin/env python # -*- encoding: utf-8 -*-import osimg_path = '/home/jjuv/D ...

  3. Python 获取文件夹中的文件列表

    获取文件夹中的文件列表 问题 你想获取文件系统中某个目录下的所有文件列表. 解决方案 使用 os.listdir() 函数来获取某个目录中的文件列表: import os names = os.lis ...

  4. Flume监听文件夹中的文件变化,并把文件下沉到hdfs

    1.采集目录到HDFS 采集需求:某服务器的某特定目录下,会不断产生新的文件,每当有新文件出现,就需要把文件采集到HDFS中去 根据需求,首先定义以下3大要素 采集源,即source--监控文件目录 ...

  5. Flume监听文件夹中的文件变化_并把文件下沉到hdfs

    摘要: 1.采集目录到HDFS 采集需求:某服务器的某特定目录下,会不断产生新的文件,每当有新文件出现,就需要把文件采集到HDFS中去 根据需求,首先定义以下3大要素 采集源,即source--监控文 ...

  6. mvfiles:一次性提取多个文件夹中的文件

      作者:吴玉轩 (南开大学) Stata 连享会: 知乎 | 简书 | 码云 | CSDN   Stata连享会 精品专题 || 精彩推文 2019暑期"实证研究方法与经典论文" ...

  7. 拷贝文件(包括文件夹中的文件夹)

    ''' 1.查看来源文件夹中的文件 2.通过遍历得到文件夹中的文件(文件名+扩展名) 3.拼接文件 (文件夹+文件名+扩展名) 4.判断来源文件中是 文件夹 还是 文件明.扩展名如果是文件夹则:.提前 ...

  8. VMware虚拟机文件夹中各文件作用详解

    VMware虚拟机文件夹中各文件作用详解 虚拟机的文件管理由VMware Workstation来执行. 一个虚拟机一般以一系列文件的形式储存在宿主机中, 这些文件一般在由workstation为虚拟 ...

  9. 记录一下提取文件夹中所有文件名字

    配置Opencv很有用 快速提取文件夹中所有文件的名称! - 简书 (jianshu.com)

  10. C++读取文件夹中所有文件的路径,包含子文件夹

    C++读取文件夹中所有文件的路径,包含子文件夹 C++实现指定文件夹的路径,获取该路径下所有文件的路径,含子文件夹的文件,为了实现跨平台编译,最后会给出Window和Linux的完成程序: [1]下面 ...

最新文章

  1. 数人云CEO王璞:容器正成为软件交付的标准
  2. UA MATH565C 随机微分方程III Ito积分的构造
  3. android 时间计划软件,时间规划局专业版
  4. python 代理抓包_python requests代理设置,fiddler抓包
  5. 处理器后面的字母含义_工业铝型材名称的含义是什么
  6. PLSQL工具连接Oracle
  7. PWM整流器仿真。 在simulink中搭建了PWM整流器,采用电压电流双闭环控制,实现了网侧电压与电流同相位,单位功率因数运行
  8. 【个人笔记一】ART系统类的编译解析加载探究
  9. AutoCAD2007 打开缓慢解决方案
  10. onblur onchange
  11. 手把手教你实现基于eTS的分布式计算器
  12. 【NOIP2006】【Luogu1063】能量项链
  13. XP IIS之——问题总结
  14. C++ 实验3-2本月有几天?
  15. C#中Get和Set的用法
  16. ORA-12705:无法访问NLS数据文件或者指定的环境无效
  17. 用Unity进行网络游戏开发(一)
  18. telegraf介绍
  19. 分享:DFC开发平台的设计理念
  20. php下载视频文件怎么打开,后缀名为php的视频文件用什么播放器?

热门文章

  1. matlab提高循环运行效率,提高MATLAB运行效率
  2. VNC远程桌面使用方法
  3. MP3标题重命名以及文本去掉模板尾巴
  4. carry函数在C语言中用法,carry的用法总结大全
  5. 早上集合竞价抓涨停板,集合竞价抓涨停板公式
  6. qpython3编辑器手机版下载_QPython3
  7. zabbix配置方糖微信推送报警
  8. mysqldump set-gtid-purged=OFF的问题
  9. html入门:网页字体的设置
  10. c语言 两个文件相似度比较,比较两文件的相似度(比较中文)