来自麻省理工学院的研究团队近来透过机器学习技术,打造利用胺基酸链段预测蛋白质结构的模型,也就是能够理解个别胺基酸链段如何决定蛋白质功能,对于生物相关研究、药物开发、蛋白质设计和测试都是一大进展,未来,该机器学习模型能够让研究人员更专注于修改特定胺基酸片段,改善蛋白质工程。蛋白质是由胺基酸分子线性链结而成,个别胺基酸分子透过肽键连接,根据链结中的物理相互作用和序列,折迭成相当复杂的3D结构,而这些不同的结构决定了蛋白质在生物学上的功能,因此,了解蛋白质的3D结构对于预测蛋白质对特定药物的反应是有价值的。

过去数十年来的研究,主要都是用多种成像技术来研究蛋白质结构,而这些研究只能了解非常小部分的蛋白质结构,近来,研究人员开始用机器学习模型根据胺基酸序列,来预测蛋白质结构,但是,由于胺基酸序列的多元性,会生成非常类似的结构,再者,也没有足够多的结构样本来训练模型。因此,有别于过去直接预测结构的方法,MIT研究团队将预测蛋白结构的数据转译成以数值表示的向量值,为此,团队用已知的蛋白质结构近似度,来监督机器学习模型,让模型学习特定氨基与蛋白质功能的关系,首先,利用3D蛋白质结构当作训练指引,来简单地计算每个胺基酸在蛋白质序列的位置,接着,再透过计算出的位置代表值当作机器学习模型输入数据,根据每个胺基酸链段来预测蛋白质功能。
训练过程总共使用了22,000个来自蛋白质结构数据库SCOP的蛋白质数据,该数据库包含数千个依照相似结构和胺基酸序列分类的蛋白质,团队利用SCOP数据库分类的类别,模型针对每对蛋白质,计算蛋白质结构真实相似分数,因此,每个蛋白质结构的向量会包含与其他序列相似程度的信息,再根据该相似分数预测胺基酸序列的3D结构。最后模型会将比对预测的相似分数和SCOP真实的相似分数的结果,当作回传到编译程序的讯号。同时,模型还会针对每个胺基酸序列向量预测联系地图(contact map),也就是呈现出每个胺基酸在蛋白质预测结构中,与其他胺基酸之间的距离,该模型还会将预测的联系地图与SCOP数据库的联系地图拿来做比较,回馈到模型中,如此一来,能够帮助模型学习胺基酸在蛋白质结构中正确的位置,进一步更新胺基酸功能。

转载于:https://blog.51cto.com/13373212/2369431

MIT透过机器学习技术用胺基酸预测蛋白质结构相关推荐

  1. Google透过机器学习 侦测与分类手机装置上的威胁

    Google近日释出2017年度 Android资安报告,报告中指出,有60.3%的潜在有害的应用(Potentially Harmful Applications,PHAs),是透过机器学习技术检测 ...

  2. 5-(4-烟酸酰业胺基)苯基-10,15,20-三苯基卟啉配体(H2P)/meso-四(4-N,N,N-三甲氨基苯基)卟啉钯配合物(Pd-TAPP)/四-(4-三甲铵基苯基)-卟啉(ATPP)齐岳

    5-(4-烟酸酰业胺基)苯基-10,15,20-三苯基卟啉配体(H2P) 向装有20mL二氯甲烷的三口瓶中加入60mg4二甲氨基吡啶(DMAP)和40mg烟酸,并加入2mL干燥过的三乙胺,冰浴冷却后, ...

  3. 2020胺基化工艺复审模拟考试及胺基化工艺实操考试视频

    题库来源:安全生产模拟考试一点通公众号小程序 2020胺基化工艺复审模拟考试及胺基化工艺实操考试视频,包含胺基化工艺复审模拟考试答案解析及胺基化工艺实操考试视频练习.由安全生产模拟考试一点通公众号结合 ...

  4. 2020年胺基化工艺考试及胺基化工艺考试题

    题库来源:安全生产模拟考试一点通公众号小程序 2020年胺基化工艺考试及胺基化工艺考试题,包含胺基化工艺考试答案和解析及胺基化工艺考试题练习.由安全生产模拟考试一点通公众号结合国家胺基化工艺考试最新大 ...

  5. Cell Biolabs丨艾美捷丨L-氨基酸检测试剂盒

    氨基酸是含有胺(-NH2)和羧基(-COOH)的有机化合物以及赋予每个氨基酸独特性的侧链(R基团).主要氨基酸的元素有碳.氢.氧和氮,但其他元素也可以是在一些氨基酸中发现.目前已知约500种氨基酸,但 ...

  6. 运动合成——机器学习技术

    参考文献:<人体运动合成中的机器学习技术合成综述> 根据机器学习的用途分类,在图形学中使用到的大致如下: 1>    回归和函数逼近.回归是一种插值技术,分析已知数据点来合成新的数据 ...

  7. Python数据挖掘与机器学习技术入门实战

    摘要: 什么是数据挖掘?什么是机器学习?又如何进行Python数据预处理?本文将带领大家一同了解数据挖掘和机器学习技术,通过淘宝商品案例进行数据预处理实战,通过鸢尾花案例介绍各种分类算法. 课程主讲简 ...

  8. 13 大论坛同开播!数百专家带你从机器学习技术与工程实践,聊到开源生态 | AI ProCon 2020...

    2020 年 7 月 4 日,由 CSDN 主办的第三届 AI开发者大会(AI ProCon 2020)在线上进行到了第二天的议程.作为"百万人学AI"的阶段性成果展示,AI Pr ...

  9. 机器学习ai选股_机器学习技术能够有效用于选股吗?(下)

    未经授权,严禁转载 前言 在本篇论文的前半部分,作者提供了一些关于机器学习的基本概念,并指出机器学习在处理金融数据时很容易遭受过拟合的问题.作者对此提出了几种解决方法,包括结合不同的算法和信号窗口.此 ...

最新文章

  1. JS一起学01:css复习、js基础知识、事件、参数、函数、网页换肤、if判断、className问题、浏览器执行顺序
  2. PHP SHA1withRSA加密生成签名及验签
  3. 5939. 半径为 k 的子数组平均值
  4. html 鼠标图标做成动画效果,纯css3实现的鼠标悬停动画按钮
  5. [转载] 一致性哈希
  6. Git下使用Beyond Compare作为比较和合并工具
  7. Web3.0中国峰会将于7月在成都召开
  8. 一个手机阅读器的WebApp
  9. CAD给标注尺寸加上下公差的方法
  10. 百度Java出现:“现在学java的都是傻子”相关搜索!
  11. 新手如何成为一名黑客
  12. Python3爬虫抓取网易云音乐热评实战
  13. 解决nvcc --version显示command not found问题
  14. 运动小插件(有氧运动)
  15. alsa 驱动介绍及user层到hw层文件ioctl操作流程分析
  16. 第六次大灭绝还远吗?––读《大灭绝时代》
  17. 一个有趣的python项目---一个好玩的网站
  18. 如何引领万亿休闲零食市场新消费浪潮?三只松鼠提供了一种思路
  19. 滴滴出行前端实习生面试经验
  20. 主席树模板 + 题解(无修改)

热门文章

  1. 【Oracle】Over函数的用法
  2. 新手做shopee虾皮为什么一直不开单?知虾数据分享开店几个技巧
  3. 地税申报提示服务器证书不合法,为什么地税网上申报打不开申报表且提示网页上有错误...
  4. [COCI2017-2018#5] Olivander
  5. SQL语句排序中null值的处理
  6. 2023年电大秋季招生截止日期 什么时候开始报名
  7. python矩阵转置_867. 矩阵转置(Python)
  8. CenterNet环境搭建
  9. 环保数采仪助力空气质量在线监测系统
  10. PyCharm破解方法收藏