使用蛋白质和mRNA序列信息预测蛋白质亚线粒体定位
使用蛋白质和mRNA序列信息预测蛋白质亚线粒体定位
对亚线粒体蛋白质M254的预测
数据集
M254(来自M317)
共包含317条亚线粒体蛋白质且序列间的相似性低于40%,分别位于基质、内膜、外膜三个位置。从GeneBank中找出每条蛋白质对应的成熟的mRNA,即编码蛋白质的mRNA。由于有的蛋白质在数据库中没有实验证实的mRNA,并且删除亚细胞位置从单定位变成多定位的、在Swiss-Prot数据库中已经删除的蛋白质,获得254条与mRNA对应的蛋白质,即M254。
特征选择
mRNA序列的H联体频数(3-mer)
分段氨基酸组分(AAC)
将序列分段整理为相同长度的序列,采用SVM算法jackknife检验,得出序列分成的段数与整体的准确率之间的关系,取最佳结果。然后统计氨基酸组分信息。
PSSM
进化信息中的λ是相关长度,从0到7变化时,总体预测成功率从86.61%到90.16%之间变化,取最高:λ=1时
对PSSM矩阵的每行用标准差进行归一化,再用伪氨基酸组分算法得出伪进化信息PsePSSM:
同源GO术语
考虑到目标蛋白质序列的GO信息不太全面,为了更好地反映亚线粒体蛋白质序列的功能,利用数据集中每条目标序列的同源序列的GO信息构建特征向量,并对特征进行筛选(选择GO ID出现频率高的特征)(最后得到136维)
最优相关长度
利用氨基酸的亲疏水特性指标进行标准化,根据氨基酸序列构建标准化后的指数值序列,然后计算序列的自相关函数值:
然后选择最优自相关长度k=13
平均化学位移(ACS)
预测方法
支持向量机
Hy6是指融合了AAC、PSSM、GO、AAindex、RS和ASC六种信息参数,当加入3-mer后,整体的预测准碗率从96.85%提高到97.64%
M880亚线粒体定位预测
方法类似
使用蛋白质和mRNA序列信息预测蛋白质亚线粒体定位相关推荐
- eLife | 利用进化信息预测蛋白质界面间残基-残基相互作用
导语:蛋白质在进化过程中,会发生氨基酸突变,破坏了残基之间的相互作用而导致蛋白质结构不稳定,若此时与突变残基具有相互作用的残基也随之发生突变,且构成新的相互作用,使蛋白质结构保持稳定,称这种变化为蛋白 ...
- 论文翻译:《Phosvardeep:使用序列信息对磷酸变化的深度学习预测》
Title:PhosVarDeep: deep-learning based prediction of phospho-variants using sequence information 期刊: ...
- Nat. Commun. | 无需参数的几何深度学习,可准确预测蛋白质结合界面
今天为大家介绍的是来自Matteo Dal Peraro团队的一篇关于预测蛋白质结合的论文.蛋白质是生命的重要分子组成部分,由于其特定的分子相互作用而负责大多数生物功能.然而,预测它们的结合界面仍然是 ...
- 生物学50年难题被DeepMind解决了,蛋白质版“阿法狗”预测结构准确性达92.4
郑集杨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一早醒来,发现搞蛋白质结构研究的朋友都在纷纷自嘲:要失业了. 啊这,怎么回事?原来是结构生物学,迎来了一个「革命性」的突破. 11月30 ...
- 《用于预测蛋白质-配体结合亲和力的结构感知交互图神经网络》
1.文章原标题与链接 <Structure-aware Interactive Graph Neural Networks for the Prediction of Protein-Ligan ...
- DeepFunc:一种深度学习框架,可根据蛋白质序列和相互作用准确预测蛋白质功能
摘要 蛋白质功能的诠释对于从分子水平理解生命具有重要作用.高通量测序产生了大量的原始蛋白质序列,只有大约1%的蛋白质序列被人工标注了功能.函数的实验性注释是昂贵的.耗时的,并且跟不上序列号的快速增长. ...
- [论文阅读]使用深度学习方法预测蛋白质磷酸化位点DeepPhos: prediction of protein phosphorylation sites with deep learning(一)
文章目录 摘要 一.背景 二.数据收集和预处理 三.Deepphos框架和模型训练 摘要 这项研究中,文章提出了一种新颖的多层CNN架构DeepPhos,以准确预测具有蛋白质序列信息的磷酸化位点.与之 ...
- html中弹出是否翻译成蛋白质,蛋白质的结构与功能预测
一.蛋白质的结构与功能预测 蛋白质结构与功能的研究已有相当长的历史,由于其复杂性,对其结构与功能的预测不论是方法论还是基础理论方面均较复杂.统计学方法曾被成功地应用于蛋白质二级结构预测中,如Chou和 ...
- 论文解读:ToxinPred2:一种预测蛋白质毒性的改进方法
ToxinPred2: an improved method for predicting toxicity of proteins 期刊:Briefings in Bioinformatics 中科 ...
- FastRNABindR:快速准确预测蛋白质-RNA界面残基
paper 单位:宾夕法尼亚州立大学 信息科学与技术学院 Abstract 广泛的生物学过程,包括基因表达的调节.蛋白质的合成以及许多病毒的复制和组装都是由RNA-蛋白质相互作用介导的.然而,蛋白质- ...
最新文章
- java中的关键字static(静态变量)和final定义常量
- [LeetCode] Kth Smallest Element in a BST
- 综合布线的12大热点技术
- 大数相乘(大数阶乘模板)
- Intellij Idea 多模块Maven工程中模块之间无法相互引用问题
- 关于 web.config impersonate 帐号模拟
- c语言4x4按键计算器代码,4X4按键实现计算器功能.doc
- python中字典不自动排序/删除指定类型文件/执行可执行文件的返回值
- 微信小程序支付-付款(Java后台)
- mysql ip 远程连接不上_【技术贴】解决MySql连接不上 ip远程连接Host is not allowed to conn-阿里云开发者社区...
- 万字长文详解JavaScript(JavaScript从入门到精通)(持续更新)
- 1.4多媒体技术的发展历史
- 饿了么自动登录解决方案(手机短信登录)
- goole服务框架Android ID,GSF ID KEY(谷歌服務框架ID)作爲Android設備唯一標識符
- 80386常用内部寄存器
- 自然科学 计算机,自然科学计算器:Natural Scientific Calculator
- 《Detecting Adversarial Examples through Image Transformation》和CW attack的阅读笔记
- 幼儿园计算机网络教室工作计划,幼儿园2017-2018学年游戏教学工作计划
- vue如何调用高德地图
- 时间格式YYYYMM与yyyyMM的区别
热门文章
- soapui生成java客户端_用soapUI生成客户端代码
- 成人高考计算机专业,成人高考计算机类里的哪个专业好找工作?
- 64 串口测速工具及实验
- 质数的后代c语言,GRE机经:2014数学sub回忆题(造福后人)
- 最新亲测可用的免费google翻译api
- hao643.com劫持(IE和Chrome等被修改快捷方式跳转到hao123.com)
- 通过汉字查找五笔码和拼音
- STM32笔记之 FLASH(内存)
- 图神经网络-图与图学习笔记-中
- 前端地图之色斑图渲染(数据格式为.tif的栅格数据)(一)——以leaflet为例