使用蛋白质和mRNA序列信息预测蛋白质亚线粒体定位

对亚线粒体蛋白质M254的预测

数据集

M254(来自M317)

共包含317条亚线粒体蛋白质且序列间的相似性低于40%,分别位于基质、内膜、外膜三个位置。从GeneBank中找出每条蛋白质对应的成熟的mRNA,即编码蛋白质的mRNA。由于有的蛋白质在数据库中没有实验证实的mRNA,并且删除亚细胞位置从单定位变成多定位的、在Swiss-Prot数据库中已经删除的蛋白质,获得254条与mRNA对应的蛋白质,即M254。

特征选择
  1. mRNA序列的H联体频数(3-mer)

  2. 分段氨基酸组分(AAC)

    将序列分段整理为相同长度的序列,采用SVM算法jackknife检验,得出序列分成的段数与整体的准确率之间的关系,取最佳结果。然后统计氨基酸组分信息。

  3. PSSM

    进化信息中的λ是相关长度,从0到7变化时,总体预测成功率从86.61%到90.16%之间变化,取最高:λ=1时

    对PSSM矩阵的每行用标准差进行归一化,再用伪氨基酸组分算法得出伪进化信息PsePSSM:

  1. 同源GO术语

    考虑到目标蛋白质序列的GO信息不太全面,为了更好地反映亚线粒体蛋白质序列的功能,利用数据集中每条目标序列的同源序列的GO信息构建特征向量,并对特征进行筛选(选择GO ID出现频率高的特征)(最后得到136维)

  1. 最优相关长度

    利用氨基酸的亲疏水特性指标进行标准化,根据氨基酸序列构建标准化后的指数值序列,然后计算序列的自相关函数值:

    然后选择最优自相关长度k=13

  2. 平均化学位移(ACS)

预测方法

支持向量机

Hy6是指融合了AAC、PSSM、GO、AAindex、RS和ASC六种信息参数,当加入3-mer后,整体的预测准碗率从96.85%提高到97.64%

M880亚线粒体定位预测

方法类似

使用蛋白质和mRNA序列信息预测蛋白质亚线粒体定位相关推荐

  1. eLife | 利用进化信息预测蛋白质界面间残基-残基相互作用

    导语:蛋白质在进化过程中,会发生氨基酸突变,破坏了残基之间的相互作用而导致蛋白质结构不稳定,若此时与突变残基具有相互作用的残基也随之发生突变,且构成新的相互作用,使蛋白质结构保持稳定,称这种变化为蛋白 ...

  2. 论文翻译:《Phosvardeep:使用序列信息对磷酸变化的深度学习预测》

    Title:PhosVarDeep: deep-learning based prediction of phospho-variants using sequence information 期刊: ...

  3. Nat. Commun. | 无需参数的几何深度学习,可准确预测蛋白质结合界面

    今天为大家介绍的是来自Matteo Dal Peraro团队的一篇关于预测蛋白质结合的论文.蛋白质是生命的重要分子组成部分,由于其特定的分子相互作用而负责大多数生物功能.然而,预测它们的结合界面仍然是 ...

  4. 生物学50年难题被DeepMind解决了,蛋白质版“阿法狗”预测结构准确性达92.4

    郑集杨 发自 凹非寺  量子位 报道 | 公众号 QbitAI 一早醒来,发现搞蛋白质结构研究的朋友都在纷纷自嘲:要失业了. 啊这,怎么回事?原来是结构生物学,迎来了一个「革命性」的突破. 11月30 ...

  5. 《用于预测蛋白质-配体结合亲和力的结构感知交互图神经网络》

    1.文章原标题与链接 <Structure-aware Interactive Graph Neural Networks for the Prediction of Protein-Ligan ...

  6. DeepFunc:一种深度学习框架,可根据蛋白质序列和相互作用准确预测蛋白质功能

    摘要 蛋白质功能的诠释对于从分子水平理解生命具有重要作用.高通量测序产生了大量的原始蛋白质序列,只有大约1%的蛋白质序列被人工标注了功能.函数的实验性注释是昂贵的.耗时的,并且跟不上序列号的快速增长. ...

  7. [论文阅读]使用深度学习方法预测蛋白质磷酸化位点DeepPhos: prediction of protein phosphorylation sites with deep learning(一)

    文章目录 摘要 一.背景 二.数据收集和预处理 三.Deepphos框架和模型训练 摘要 这项研究中,文章提出了一种新颖的多层CNN架构DeepPhos,以准确预测具有蛋白质序列信息的磷酸化位点.与之 ...

  8. html中弹出是否翻译成蛋白质,蛋白质的结构与功能预测

    一.蛋白质的结构与功能预测 蛋白质结构与功能的研究已有相当长的历史,由于其复杂性,对其结构与功能的预测不论是方法论还是基础理论方面均较复杂.统计学方法曾被成功地应用于蛋白质二级结构预测中,如Chou和 ...

  9. 论文解读:ToxinPred2:一种预测蛋白质毒性的改进方法

    ToxinPred2: an improved method for predicting toxicity of proteins 期刊:Briefings in Bioinformatics 中科 ...

  10. FastRNABindR:快速准确预测蛋白质-RNA界面残基

    paper 单位:宾夕法尼亚州立大学 信息科学与技术学院 Abstract 广泛的生物学过程,包括基因表达的调节.蛋白质的合成以及许多病毒的复制和组装都是由RNA-蛋白质相互作用介导的.然而,蛋白质- ...

最新文章

  1. java中的关键字static(静态变量)和final定义常量
  2. [LeetCode] Kth Smallest Element in a BST
  3. 综合布线的12大热点技术
  4. 大数相乘(大数阶乘模板)
  5. Intellij Idea 多模块Maven工程中模块之间无法相互引用问题
  6. 关于 web.config impersonate 帐号模拟
  7. c语言4x4按键计算器代码,4X4按键实现计算器功能.doc
  8. python中字典不自动排序/删除指定类型文件/执行可执行文件的返回值
  9. 微信小程序支付-付款(Java后台)
  10. mysql ip 远程连接不上_【技术贴】解决MySql连接不上 ip远程连接Host is not allowed to conn-阿里云开发者社区...
  11. 万字长文详解JavaScript(JavaScript从入门到精通)(持续更新)
  12. 1.4多媒体技术的发展历史
  13. 饿了么自动登录解决方案(手机短信登录)
  14. goole服务框架Android ID,GSF ID KEY(谷歌服務框架ID)作爲Android設備唯一標識符
  15. 80386常用内部寄存器
  16. 自然科学 计算机,自然科学计算器:Natural Scientific Calculator
  17. 《Detecting Adversarial Examples through Image Transformation》和CW attack的阅读笔记
  18. 幼儿园计算机网络教室工作计划,幼儿园2017-2018学年游戏教学工作计划
  19. vue如何调用高德地图
  20. 时间格式YYYYMM与yyyyMM的区别

热门文章

  1. soapui生成java客户端_用soapUI生成客户端代码
  2. 成人高考计算机专业,成人高考计算机类里的哪个专业好找工作?
  3. 64 串口测速工具及实验
  4. 质数的后代c语言,GRE机经:2014数学sub回忆题(造福后人)
  5. 最新亲测可用的免费google翻译api
  6. hao643.com劫持(IE和Chrome等被修改快捷方式跳转到hao123.com)
  7. 通过汉字查找五笔码和拼音
  8. STM32笔记之 FLASH(内存)
  9. 图神经网络-图与图学习笔记-中
  10. 前端地图之色斑图渲染(数据格式为.tif的栅格数据)(一)——以leaflet为例