利用代码将网站预测蛋白稳定性突变自动化
蛋白的热稳定一直是蛋白类药物或者产品生产及保存运输要考虑的重要问题,现在有不少软件可以预测能提高蛋白热稳定性的突变体,而且有很多还是在线网站,能节省不少计算资源。但是很多在线网站的特点是每次预测都要重新输入值,然后提交得到新的结果。如果有大量预测,那么无疑是费时费力的,这个时候就需要网页自动化测试技术了。本文以裂解酶的热稳定预测为例,展示如何进行完整的自动化预测和结果输出。
一、网站分析
基于氨基酸序列的热稳定位点突变预测网址:http://mupro.proteomics.ics.uci.edu/
需要我们需要我们输入有四个位置,分别是突变位置,原始氨基酸,突变后的氨基酸,还有蛋白质的氨基酸序列,完成以上四点的输入,点击predict,网站就会自动计算并形成如下结果页面:
红色圈中的地方表示突变稳定性结果,这个值越小表明热稳定性越差。
二、自动化代码运行
我们要做的就是第一个页面输入四个值,然后点击predict,之后获取第二个页面标红位置的数值即可,然后比较不同位置突变19个氨基酸后值的大小即可获得某一位置突变某一个氨基酸后增强其稳定性的结果。代码如下:
python
import selenium
from tqdm import tqdm
from selenium import webdriver
import re
data5 = []
A = "MEIQKKLVDPSKYGAKCPYTMKPKYIIVHNTYNDAPAENEVSYMISNNNEVSFHIAVDDKKAIQGIPLERNAWACGDGNGSGNRQSISVEICYSKSGGDRYYKAEDNAVDVVRQLMSMYNIPIENVRTHQSWSGKYCPHRMLAEGRWGAFIQKVKNGNVATTSPTKQNIIQSGAFSPYKTPDVMGALTSLKMTADFILQSDGLTYFISKPTSDAQLKAMKEYLDRKGWWYEVK
"
AA = list(A)
B = ['G','A','V','L','I','P','F','Y','W','S','T','C','M','N','Q','D','E','K','R','H']
browser = webdriver.Firefox()
browser.get('http://mupro.proteomics.ics.uci.edu/')
length = [83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 133, 135, 137, 138, 139, 140, 141]
for a in tqdm(length):for b in B:if AA[a - 1] != b:browser.find_elements_by_css_selector('body > font:nth-child(1) > table:nth-child(4) > tbody:nth-child(1) > tr:nth-child(4) > td:nth-child(1) > textarea:nth-child(3)')[0].send_keys(A)browser.find_elements_by_css_selector('body > font:nth-child(1) > table:nth-child(4) > tbody:nth-child(1) > tr:nth-child(3) > td:nth-child(1) > input:nth-child(3)')[0].send_keys(a)browser.find_elements_by_css_selector('body > font:nth-child(1) > table:nth-child(4) > tbody:nth-child(1) > tr:nth-child(3) > td:nth-child(2) > input:nth-child(3)')[0].send_keys(AA[a - 1])browser.find_elements_by_css_selector('body > font:nth-child(1) > table:nth-child(4) > tbody:nth-child(1) > tr:nth-child(3) > td:nth-child(3) > input:nth-child(3)')[0].send_keys(b)browser.find_elements_by_css_selector('body > font:nth-child(1) > input:nth-child(6)')[0].click()data1 = browser.find_elements_by_tag_name('body')[0].textdata11 = re.findall(".*delta G =(.*)(stability).*" , data1)data2 = adata3 = AA[a - 1]data4 = bdata5.append(str(data2) + " " + data3 + " " + data4 + " " + data11[0][0][1:7])browser.get('http://mupro.proteomics.ics.uci.edu/')
从data5我们可以得到任意一个位置突变19个氨基酸后的稳定性值,我们可以有选择的挑选稳定性值高的突变:
MM = []
for m in data5:if float(m[-6:-1]) >= 0.2:MM.append(m)f = open("/home/lxh/Documents/Lysin/clyc_thermal_predict.txt","a+")
for kk in data5:f.write(kk + "\n")f.close()
结果示例如下:
89 G L 0.3043
104 G L 0.3908
104 G I 0.4117
104 G M 0.3637
105 P L 0.2652
106 S L 0.3620
108 K V 0.2034
108 K L 0.3556
108 K I 0.4437
108 K F 0.3513
108 K M 0.2814
109 S L 0.2571
141 H L 0.3399
141 H I 0.5351
第一位数字表示氨基酸的位置,第二位和第三位分别表示突变前后的氨基酸缩写,第四位表示稳定性提高的数值。由结果可知141位H(组氨酸)变为I(异亮氨酸),得到的突变体稳定性是最高的。再通过蛋白序列保守性分析,我们即可筛选到有活性并且热稳定性提高的突变体。
三、其他方法
热稳定预测网站有很多,我们不妨可以相互比较验证下结果是否一致。还有基于蛋白质结构的预测方法,也就是我们需要该分析蛋白的PDB文件,本次我们就暂不展示如何预测PDB文件蛋白的稳定性。
利用代码将网站预测蛋白稳定性突变自动化
利用代码将网站预测蛋白稳定性突变自动化相关推荐
- ML/DL之预测分析类:利用机器学习算法进行预测分析的简介、分析、代码实现之详细攻略
ML/DL之预测分析类:利用机器学习算法进行预测分析的简介.分析.代码实现之详细攻略 目录 机器学习算法进行预测的简介 机器学习算法进行预测的分析 机器学习算法进行预测的代码实现 机器学习算法进行预测 ...
- Keras之DNN:基于Keras(sigmoid+binary_crossentropy+predict_proba)利用DNN实现分类预测概率——DIY二分类数据集预测新数据点
#Keras之DNN:基于Keras(sigmoid+binary_crossentropy+predict_proba)利用DNN实现分类预测概率--DIY二分类数据集&预测新数据点 目录 ...
- 利用Matlab进行灰色预测,利用matlab进行灰色预测.pdf
利用matlab进行灰色预测,灰色预测matlab程序,灰色预测模型matlab,matlab灰色预测,matlab灰色预测代码,matlab灰色预测工具箱,灰色预测的matlab程序,matlab灰 ...
- 机器学习从蛋白序列预测蛋白分类(二)
半路出家学机器学习,先在自己熟悉的领域尝试,每天进步一点点,记录自己成长过程(正式开始前的小叨叨) 接([机器学习从蛋白序列预测蛋白分类(一)])继续分析 三,特征提取 其实在(机器学习从蛋白序列预测 ...
- 利用Matlab实现Mann-Kendall(MK)突变检验函数
利用Matlab实现Mann-Kendall(MK)突变检验函数 一.MK突变检验 1.一般取显著性水平α=0.05,那么临界值U0.05= ±1.96 .将UFk和UBk两个统计量序列曲线和±1.9 ...
- 利用git提交网站到码云出现权限问题,弹框要求输入用户名和密码老是出错
一般情况下利用git提交网站到码云的步骤如下: 1.git config --global user.name "用户名" git config --global user.ema ...
- 数据分享|SAS与eviews用ARIMA模型对我国大豆产量时间序列预测、稳定性、白噪声检验可视化...
全文链接:http://tecdat.cn/?p=31480 我国以前一直以来都是世界上大豆生产的第一大国.但由于各国的日益强大,导致我国豆种植面积和产量持续缩减.因此,预测我国的大豆产量对中国未来的 ...
- 利用LSTM进行股价预测
利用LSTM进行股价预测 效果 原理 代码 应用 效果 原理 LSTM即长短记忆网络,是一种很强的RNN,这种网络的特性是以前的输入会影响现在的输出,具体原理请自行搜索. 算法流程: 获取yahoo财 ...
- 多尺度生成扩散模型预测蛋白-配体复合物结构的动态骨架
今天给大家介绍的是来自加州理工大学Zhuoran Qiao和NVIDIA团队发表在arxiv上的预印本<DYNAMIC-BACKBONE PROTEIN-LIGAND STRUCTURE PRE ...
- 百度分享代码_360网站关键词快排系统 - 百度快照不更新的原因分析
原出处:超级排名系统 原文链接:http://www.chaojipaiming.com 360网站关键词快排系统注册地址 seo.chaojipaiming.com 网站关键词快速排名优化,7-15 ...
最新文章
- 从头理解self-attention机制
- mongodb自动关闭:页面太小,无法完成操作
- python的用途实例-python 星号(*)的多种用途
- Linux共享内存(二)
- Redis:11---Set对象
- 小米手环导出心率_这个功能有意思,小米11支持指纹检测心率,没有手环也不怕...
- 2017.9.22 middle 失败总结
- [android] android 获取网络连接信息
- mysql计算经纬度亮点之间的距离
- Jackson的JSON——JsonUtils工具类
- 怎么用静图做gif动图?三步教你轻松做动图
- 【数据结构(C语言版)严蔚敏 第一章 绪论】
- 51单片机之共阳极静态数码管
- 中国特殊灯具行业市场供需与战略研究报告
- [python][转载]pyltp的使用教程
- 点击图片实现预览功能
- 零基础学习SpringBoot
- 关于便携式打印机程序开发(一、原生安卓蓝牙调用)
- 如何一键删除PPT的动画效果?
- pandas读取txt文件第一行列名困扰我许久的'点'
热门文章
- win7无法连接打印机拒绝访问_如何解决Win7共享打印机拒绝访问的问题?
- 基于matlab实现双路音频信号的AM调制与解调
- xp计算机限制打开u盘,XP系统无法读取u盘的解决设置方法
- “女生当程序员?”你们骂我,我也要说!
- 服务器上qq邮件不能打开方式,qq邮箱打不开解决方法汇总
- 透明网桥的自学习算法
- qt 飞扬青云_Qt编写图片及视频TCP/UDP网络传输
- 计算机老师教师节祝福语,2020教师节祝福语精选
- 憎恨之心最强套装攻略_憎恨之心装备选择 | 手游网游页游攻略大全
- Java根据出生日期判断星座