文章目录

  • 前言
  • 一、ASAquick安装
  • 二、利用Python跑多条序列
    • 2.1 准备数据
    • 2.2 Python循环调用ASAquick的溶剂可及性
    • 2.3 Python循环调用PSIPred得二级结构
  • 总结

前言

在小编的上一篇文章里,主要介绍了利用python对包含多条蛋白质序列的fasta文件的拆分,其实小编做这一步就是因为有一些生物软件在跑特征的时候,需要一条一条的输入蛋白质序列,比如利用PSIPred得到蛋白质的二级结构的时候。今天小编依然和大家分享一下我在做东西的时候碰到的一些值得记录的过程。
今天的分享主要是在linux系统中利用Python对每条蛋白质序列循环计算得到其对应的二级结构(SS)和溶剂可及性面积(RSA),用到的软件是PSIPred和ASAquick,


一、ASAquick安装

  1. 下载所需要的包,链接:http://mamiris.com/ASAquick/GENN+ASAquick2.tgz
    两种方法:在windows系统中,可以在网页中下载下来,并借助Xftp将压缩包传到linux系统中;直接使用下面的命令在linux中下载。(注:小编将压缩包放到了“/home/ASAquick/GENN+ASAquick.tgz”这个路径下)
 wget http://mamiris.com/ASAquick/GENN+ASAquick2.tgz#(wget+空格+链接)

  1. 在linux中对下载的压缩包进行解压
    直接上代码,不过要记得哦,现在操作的应该是有这个压缩包的路径,在小编这里就是“/home/ASAquick
tar zxvf GENN+ASAquick.tgz


回撤

解压之后进入到ASAquick文件中,并进行安装,这两步很简单,小编就不赘述了

cd GENN+ASAquick
./install

至此,你的ASAquick就整好了,可以用了,在任何路径下输入ASAquick filename.fasta文件就可以得出来结果了,这里的filename.fasta如果没有在当前的操作目录下,记得加上路径,输出的结果会是一个文件夹,保存在当前操作的目录下

举个简单的操作例子,小编的数据路径是“/home/DNA-binding/all_data/New_D31/3wpcA.fasta”,小编想保存到“/home/DNA-binding/all_data”中

cd /home/DNA-binding/all_data
ASAquick /home/DNA-binding/all_data/New_D31/3wpcA.fasta


利用Xftp找到/home/DNA-binding/all_data路径,就可以发现存放结果的文件夹了:

或者直接通过ls命令查看:


ASAquick的安装使用就是这样了,简单总结一下:下载、解压、安装、测试,还是很简单的呢!


二、利用Python跑多条序列

2.1 准备数据

上一篇文章我们已经拆分好文件了,小编将文件放到了’/home/DNA-binding/all_data’路径下了,利用ls命令查看一下,是6个文件夹:

打开其中一个查看一下,是多个fasta文件,每个文件中都是一条序列:

2.2 Python循环调用ASAquick的溶剂可及性

在这里小编需要说一下,其实压缩包中有介绍跑多条序列的文件,但是小编想要按照自己之前的思路做一下,感兴趣的小伙伴可以仔细阅读一下readme哦

思路:遍历每个文件中的每一条序列,dirname存放7个文件夹的路径,seqname用于存放指定文件夹下的所有文件名称,seq_file为当前遍历到的fasta文件,运用ASAquick name.fasta进行结果输出,在这一步之前打开指定的文件(即7个中的一个)

import os
path = '/home/DNA-binding/all_data/'#数据集路径
filenames = os.listdir(path)#读取path目录下的所有目录和文件名称存放到filenames中
file_count = 0#file_count用于计算path路径下所有目录和文件的个数
dirname = []#dirname用于存放path目录下所有目录的路径,即文件夹路径
for i in range(0,len(filenames)):file_count += 1if os.path.isdir(path+filenames[i]):dirname.append(path+filenames[i])#此时,dirname中已经存放了所有文件的路径
for i in range(len(dirname)):seqname = os.listdir(dirname[i])savepath = 'cd '+dirname[i]+';ASAquick'#'cd '+dirname[i]+'表示要将结果保存到的路径位置,ASAquick为执行命令for j in range(len(seqname)):seq_file = dirname[i]+'/'+seqname[j]os.system('%s %s'%(savepath, seq_file))

2.3 Python循环调用PSIPred得二级结构

这个软件中有两个脚本可以调用,一个是基于序列比对的./runpsipred,另一个是不用序列比对的./runpsipred_single
命令调用和ASAquick相同./runpsipred name.fasta或者./runpsipred_single name.fasta,但是需要注意的是这两个需要在存放这个脚本的路径下进行。依旧是一条一条跑,python程序如下:
代码如下(示例):

import os
path = '/root/psipred/ourdata/'#存放数据的路径
filenames = os.listdir(path)#读取path目录下的所有目录和文件名称存放到filenames中
file_count = 0#file_count用于计算path路径下所有目录和文件的个数
dirname = []#dirname用于存放path目录下所有目录的路径,即文件夹路径
for i in range(0,len(filenames)):file_count += 1if os.path.isdir(path+filenames[i]):dirname.append(path+filenames[i])
for i in range(len(dirname)):seqname = os.listdir(dirname[i])for j in range(len(seqname)):seq_file = dirname[i]+'/'+seqname[j]os.system('%s %s'%("cd /root/psipred;./runpsipred_single", seq_file))#命令cd /root/psipred为进入到脚本所在位置路径中,./runpsipred_single seq_file为利用runpsipred_single脚本做非序列比对的二级结构计算

总结

今天的介绍就到这里了,作为小白的我,希望厉害的大佬们多多指教哦!

Python+ASAquick+PSIPred蛋白质序列特征计算,ASAquick安装调用(Linux)相关推荐

  1. python万能装饰器实现计算函数的调用次数和执行时间

    直接上代码 # python万能装饰器实现计算函数的调用次数和执行时间 import timedef set_fun(func):num = 0 # 初始化次数def call_fun(*args, ...

  2. Python 英汉-汉英 词典脚本,可以安装到Linux命令中

    声明:脚本文件为原作者所有,我只是做了些自定义修改而已,脚本使用有道词典网页版作为查询API 将脚本扔到/usr/bin/下面,使用命令yd + 单词进行查询. 支持英汉查询和汉英查询. #! /us ...

  3. python中的 怎么用_Python中如何调用Linux命令

    一.使用os模块 In [1]: import os #导入os模块 In [2]: os.system('ls') anaconda-ks.cfg epel-release-7-5.noarch.r ...

  4. 在虚拟机上安装Kali Linux的简易指南

    Let's learn to install Kali Linux on a Virtual machine today. If you want to venture into the field ...

  5. kali linux 磁盘,在硬盘上安装Kali Linux

    Kali Linux安装条件 在计算机上安装Kali Linux的过程非常简单. 首先,您需要兼容的计算机硬件. Kali支持i386,amd64和ARM(armel和armhf)平台. 最低硬件要求 ...

  6. 不同平台上安装python的方式是一样的对还是错_不可以在同一台计算机上安装多个不同的Python版本...

    [多选题]食品处于冰点以上时,影响水分活度 A w 的因素有( ). [单选题]不属于蛋白质起泡的必要条件的是() [多选题]蛋白质变性后,可能出现的变化() [单选题]腐竹的加工应用的是蛋白质的哪种 ...

  7. 遥感影像的纹理特征计算(基于ENVI和Python实践)

    纹理特征计算的一些方法 1.主要有四大类:统计方法.信号处理方法.模型方法和结构方法 2.灰度共生矩阵的概念 在水平方向也就是0方向,0-0有共计4个:0-1共计2个 3.灰度共生矩阵计算的结果 4. ...

  8. python+NLTK+科学计算包安装(numpy/scipy/matplotlib等)+win64位

    最近折腾python下nltk的学习,在安装科学计算包的时候好纠结...官方给的几乎都是win32的包,再者安装的过程由于版本的问题,卸载安装了好几次...写下来,大家也能借鉴借鉴. nltk是一个p ...

  9. python多个版本可不可以装在一起_可以在同一台计算机上安装多个Python版本。

    可以在同一台计算机上安装多个Python版本. 答:对 合理膳食的核心问题是 ( ) 答:膳食结构 青天明月来几时?我今停杯一问之.人攀明月不可得,. --李白<把酒问月> 答:月行却与人 ...

最新文章

  1. Python3 除法取整取余,上下取整
  2. 以太坊、Hyperledger Fabric和Corda,哪个更好?
  3. threejs模型可视化编辑器_一个近乎无门槛、零基础的3D场景编辑器
  4. oracle 日期6,EF 6与Oracle - 如何加入日期字段?
  5. MVC架构设计——EF-Code First
  6. php 加tab键,php 生成Tab键或逗号分隔的CSV
  7. nginx解析漏洞简单复现及修复
  8. git clone 拉取github上面的代码报错:fatal: Authentication failed for xxx解决
  9. php是日元吗,PHP to JPY
  10. python和pycharm版本要对应吗_pycharm的版本问题
  11. 德卡Z90读卡器读取社保卡,德卡Z90读卡器CSharp示例程序源码
  12. 甲方在IT信息化中的项目管理
  13. 无法创建视频捕捉过滤器怎么办
  14. Java自定义类的属性、方法结合数组简单使用
  15. 003 C语言 输出名言
  16. java解析word示例(支持docx、doc,wps格式)
  17. Excel#整体增加相同行高的宏命令#
  18. 扫地机器人相关传感器技术
  19. cdh6.2离线安装(傻瓜式安装教程)
  20. 小程序集-朋友圈集赞神器

热门文章

  1. 一个程序员的平凡日常
  2. ios设备如何安装chatgpt
  3. 每日一问。2015.1.8
  4. python:defaultdict
  5. 计算机网络基本概念相关习题
  6. poj1144 - tarjan求割点
  7. LINK 2001 找不到__iob_func, 找不到__fprintf
  8. 有没有游泳可以戴的耳机、防水耳机能戴着游泳
  9. 全自动过滤器:全自动叠片过滤器工作原理及应用范围
  10. 设置Win10系统我的电脑中不展示文件夹