import time
import csv
import timestart  = time.time()f = open("GM18.txt" , "r")
txt = f.read()
txt = txt.strip(">Gm18")
txt = txt.replace("\n","").replace("\r","")        #更改了此处的删除换行符!
txt = txt.strip("")pie5 = list()
with open("5pie.list", 'r') as fin:for f in fin:pie5.append(f.replace("\n","").replace("\t",""))pie3 = list()
with open("3pie.list", 'r') as fin:for f in fin:pie3.append(f.replace("\n","").replace("\t",""))pie_all = list()
for i in range(len(pie3)):pie_all.append([pie5[i], pie3[i]])
print(pie_all[:5])def indexstr(str1,str2):'''查找指定字符串str1包含指定子字符串str2的全部位置,以列表形式返回'''lenth2 = len(str2)lenth1 = len(str1)indexstr2 = []i = 0while str2 in str1[i:]:indextmp = str1.index(str2, i, lenth1)indexstr2.append(indextmp)i = (indextmp + lenth2)return indexstr2def main():pie_result = list()for i in pie_all:pie5_pos = indexstr(txt,i[0])sequence1 = ""sequence2 = ""for number in pie5_pos:if len(i[0]) == 44:sequence1 = txt[number - 302 : number-2]sequence2 = txt[number + 44 : number + 344]elif len(i[0]) == 50:sequence1 = txt[number - 300 : number]sequence2 = txt[number + 50 : number + 350]print("由以上条件我们可以得知前300个碱基为 {} ,后300个碱基为 {} ".format(sequence1,sequence2))pie3_pos = indexstr(txt,i[1])sequence3 = ''for number in pie3_pos:if len(i[1]) == 44:sequence3 = txt[number + 44 : number + 344]elif len(i[1]) == 50:sequence3 = txt[number + 50 : number + 350]print("由以上条件我们可以得知前300个碱基为 {} ,后300个碱基为 {} ".format(sequence1,sequence2))pie_result.append([pie5_pos, pie3_pos, sequence1, sequence2, sequence3])print("此次查找花费的时间是:{:.5f} 秒".format(time.time() - start))with open('csv.csv', 'w') as csvfile:writer = csv.writer(csvfile)writer.writerow(['5_pos', '3_pos', '5_front', '5_end', '3_end'])for result in pie_result:writer.writerow([result[0], result[1], result[2], result[3], result[4]])if __name__ == '__main__':main()

代码背景介绍:
查找SNP位点的5‘端的前300基因序列和后300基因序列以及3’端后300基因序列,并保存到csv文件中。

大豆SNP位点信息查找V2.1版本相关推荐

  1. 大豆SNP位点查找V2.0

    大豆SNP位点查找V2.0 from time import perf_counter import csv import timestart = perf_counter()f = open(&qu ...

  2. plink提取特定染色体中特定区域内SNP位点信息

    /home/kkx/software/plink --file 5osnp --recode HV -chr 8 --from-bp 25000000 --to-bp 26000000 --out 8 ...

  3. MirSNP:miRNA相关SNP位点数据库

    欢迎关注"生信修炼手册"! 在SNP研究领域,通过GWAS或者eQTL等手段,发现了大量与疾病或者某种复杂性状相关的SNP位点,而这些SNP的具体功能还需要进一步分析和挖掘.有科学 ...

  4. lncRNASNP:SNP位点对lncNA结构和lncRNA-miRNA影响的数据库

    欢迎关注"生信修炼手册"! lncRNASNP数据库收集整理了人和小鼠中位于lncRNA基因上的SNP位点信息,通过以下两种思路将lncRNA与SNP结合起来 探究SNP位点对于l ...

  5. 生信技能04 - 生信分析所需致病SNP位点Excel文件制作教程

    致病SNP位点Excel文件制作教程 在生信分析项目中,有遗传相关的项目会涉及到SNP位点的查找,将该SNP位点文件作为程序输入文件,本文将介绍如果通过NCBI查看目标基因的致病SNP位点,并制作成可 ...

  6. R语言算法丨批量查找SNP位点连锁区内对应的QTL以及基因

    批量查找SNP位点连锁区内对应的QTL以及基因 如果已知SNP位点的物理位置和其LDblock区间的端点,想要快速找到该区间内的QTL,之后根据参考基因组找到与连锁区域存在交集的基因,最终得到与SNP ...

  7. SNP位点上下游序列查找1.0 2020-9-27

    换账号重新发布orz /** Author:Henriette-L(luanxito@163.com)* Date: 2020-9-27* Introduction: (等我有空补)简单来说给定SNP ...

  8. R语言实现GWAS结果显著SNP位点归类提取与变异类型转化

    GWAS结果显著SNP位点归类提取与变异类型转化 根据GWAS得到的Rresult文件信息,能够找出每个snp位点对应的显著性情况和基因变异信息,接下来,需要根据表格中的信息进行归纳总结,对不同显著性 ...

  9. 「群体遗传学实战」第一课: 对SNP位点进行注释

    文章 我们用于实战的数据集来自于2019年发表于NG的西瓜文章,它提供了GATK过滤后的SNP数据集用于分析,并且附录提供了完整的样本信息.该SNP数据集包括414个西瓜,2000万个SNP信息,数据 ...

最新文章

  1. 简明Python3教程 8.控制流
  2. android 解决华为 SlidingMenu出现白屏
  3. 谷歌云计算机,google云计算的三大核心技术
  4. 关 于 正 则 表 达 式 的 类 习 题
  5. 同步函数与同步代码块的区别
  6. Vmware由于centos升级内核不可运行(C header files matching your running kernel were not found)的解决方案
  7. 响应式图像对齐中心引导3
  8. [转载] Python连接MySQL、Mongodb、SQLite
  9. 真正的技术大牛,可能根本不写代码
  10. C# 开发 OPC Server 系列之二
  11. Linux tty远程退出,screen 如果程序没结束就退出远程管理终端
  12. Java 用Myeclipse部署项目基础坏境搭建
  13. npm link详解
  14. Android Studio 编译 UVCCamera
  15. Tumblr扫黄正式开始!AI鉴黄也许是老司机们的头号敌人
  16. 北大计算机mooc题库,人工智能原理MOOC习题集及答案 北京大学 王文敏
  17. 西南交大计算机第3次作业答案,西南交大大学英语I第3次作业题答案
  18. IT男人:四十岁是一枝花吗?
  19. 使用函数创建多个备选BOM
  20. 用于优化广告展示的深度强化学习实践

热门文章

  1. C语言循环结构输出爱心,C语言--循环结构(示例代码)
  2. 转 CSS兼容技巧整理--从IE6-IE9 火狐谷歌浏览器兼容
  3. Sencha Touch 做相册
  4. 计算机和人脑在线阅读,人脑与电脑(原文)
  5. Android远程登录Telnet配置
  6. maya(学习笔记)之Arnold渲染器二
  7. 电子信息工程找什么工作,能干什么
  8. 蚂蚁金服推出区块链服务应用,用于跟踪稻米质量
  9. VR和AR可以怎样干掉智能手机
  10. 行为识别(CVPR2020南京大学腾讯) ~ TEA论文笔记 ~《TEA: Temporal Excitation and Aggregation for Action Recognition》