蛋白质的空间结构是其行使功能的基础,所以蛋白质既有序列数据库还有结构数据库。


蛋白质序列数据库

蛋白质序列数据库有很多,如SwissProt,TrEMBL,Pir等。

Pir是世界上第一个具有分类和功能注释的蛋白质序列数据库。

SwissProt包括了从EMBL翻译而来的蛋白质序列,经过人工校验和注释,冗余度较小。

为了解决人工注释较慢的问题,建立了由计算机注释的TrEMBL数据库,该数据库序列由EMBL中核酸序列翻译而来,其中剔除了包含在SwissProt数据库中的蛋白质序列。

UniProt数据库

整合了SwissProt,TrEMBL,Pir三家数据库的资源构建了通用蛋白质数据库。

UniProt分为三层:

  • UniParc

由于蛋白质序列冗余,将序列相同的合并为一条,为每条序列提供唯一的编号。

  • UniRef

为了加快检索速度,将UniParc中的序列根据一定的条件进行分类并去除冗余。

  • UniProtKB

分为UniRef/TrEMBL和UniRef/SwissProt两部分,为其提供序列的详细信息。


蛋白质结构数据库

蛋白质空间结构

一级:组成蛋白质的氨基酸序列。

二级:由氨基酸序列在空间构成的有规律的结构,一般依靠氢键,疏水键等非共价键维持空间结构,如α螺旋,β折叠。

结构域:介于二级和三级结构之间,蛋白质上的功能区域。

三级:在二级基础上经过进一步弯曲折叠形成的结构。

四级:单体蛋白通过非共价键结合形成的聚合体。

PDB数据库

PDB通过存储原子坐标数据记录蛋白质分子空间结构,数据主要来源是X射线衍射,核磁共振等试验方法所得。

PDB以文本形式存储数据,为了方便查应与结构模型显示软件(RasMol,MBT,JSmol)结合起来以图形方式显示三维结构。

蛋白质结构家族分类数据库

蛋白质结构相比序列在进化上相对更加保守,相同的结构家族同源关系更加可靠,且同一家族功能往往相似,可以进行功能推断。

蛋白质结构家族分类数据库主要由:SCOP,CATH,FSSP。

  • SCOP(人工分类)

  • CATH(半自动分类)


蛋白质组

基因组 转录组 蛋白质组

基因组:构成完整生物体的全部DNA。

转录组:一个基因组表达的全部RNA。

蛋白质组:一个基因组表达的全部蛋白质。

蛋白质组随着时间而变化,并且蛋白质组因为选择性剪切和翻译后修饰等存在,蛋白质组总是多于基因组的基因数目。

生物信息学_分子数据库(三)蛋白质数据库相关推荐

  1. 生物信息学_分子数据库(一)分子数据库概述

    为什么需要分子数据库? 数据库记录包括两部分: 1.原始序列数据 2.描述原始数据的生物学信息的注释 随着研究的积累,生物信息数据越来越多,且在研究中,如果仅仅知道数据的来源 而对其他方面知之甚少,研 ...

  2. 生物信息学_分子数据库(四)其他数据库

    生物数据库除核酸和蛋白质还有一些专用数据库. 当你明确研究对象,应尽可能多的寻找并阅读相关文献. 文献数据库 PubMed数据库 Pubmed是互联网最著名的免费Medline数据库,由NLM的生物信 ...

  3. 常见蛋白质种类_[转载]常用蛋白质数据库

    1.PDB数据库 蛋白质的基本立体结构数据库为PDB (Protein Data Bank),1971年建立于美国布鲁海克海文国家实验室.该数据库中收集了通过X射线衍射和核磁共振(NMR)试验测定的蛋 ...

  4. c access mysql数据库_基于C#的Access MsSQL MySQL 三种数据库访问演示(含源文件Demo)...

    基于C#的Access MsSQL MySQL 三种数据库访问演示(含源文件Demo) 一.三种数据库的主要对比 数据库类型 特点 Microsoft Access 桌面数据库.数据库载体是单个文件 ...

  5. easyui数据表格重置_数据库三种删除方式

    第一种 使用delete 语句 特点: delete 属于数据库操纵语言DML,表示删除表中的数据, 删除过程是每次从表中删除一行,并把该行删除操作作为事务记录在日志中保存 可以配合事件(transa ...

  6. sql 单引号_三种数据库的 SQL 注入详解

    SQL 注入原理 SQL注入攻击指的是通过构建特殊的输入作为参数传入Web应用程序,而这些输入大都是SQL语法里的一些组合,通过执行SQL语句进而执行攻击者所要的操作,其主要原因是程序没有细致地过滤用 ...

  7. 实验三 mysql数据库与表的创建_实验二 数据库和表的创建与管理

    实验二 数据库和表的创建与管理 创建用于企业管理的员工管理数据库,数据库名为YGGL中,YGGL数据库中包括三个表:Employees(员工信息表).Departments(部门信息表).Salary ...

  8. db2 删除索引_数据库三种删除方式

    第一种 使用delete 语句 特点: delete 属于数据库操纵语言DML,表示删除表中的数据, 删除过程是每次从表中删除一行,并把该行删除操作作为事务记录在日志中保存 可以配合事件(transa ...

  9. 使用DB2 pureXML管理蛋白质数据库

    蛋白质数据库( PDB.org )是有关生物分子(主要是蛋白质)的结构数据的全球档案. 蛋白质数据库(PDB)由多个成员组织管理,这些组织负责存放,维护,加工和免费提供此生物学数据给科学界. 为了提供 ...

最新文章

  1. 样本不均衡常见解决方法
  2. Asp.net中的Cache--HttpRuntim.Cache 和 HttpContext.Current.Cache
  3. YTU_3137: 动态规划基础题目之拦截导弹
  4. @onetoone中被控表不能做自我删除吗?_儿童生活自律表,孩子总是不能坚持,那是因为父母犯了这4个错误...
  5. [蓝桥杯][算法训练VIP]方格取数(双线程dp)
  6. c语言将字母的acsaii,C语言上机实验 答案
  7. 8月12号=》391页-395页
  8. math 向上取整_自我说明:关于Math和File类的具体说明.
  9. python 波动率_旧文:历史波动率的计算 (Python)
  10. 【1489】求二叉树的先序遍历 SDUTOJ
  11. 我就是TMD很无聊的女生怎么样。
  12. ssh连接服务器时特别慢的问题的解决方法
  13. JavaScript语言精粹 ——笔记
  14. 新工作上班九天心得(附 bootstrap分页写法)
  15. Oracle书籍推荐
  16. 追求神乎其技的程式设计之道
  17. 基于mybatis的数据库脱敏
  18. SLAM导航全栈书的正确打开方式(强烈推荐)
  19. 由于磁盘坏道导致的系统卡顿令我抓狂
  20. 2020年的计算机专业就业形势,2020计算机专业就业分析

热门文章

  1. 内向的人适合学计算机么,内向 反应也慢的人适合学车吗?
  2. Java多线程:线程间通信方式
  3. Python零基础爬取网页数据并导出Excel
  4. 内控安全软件测试经验
  5. Ueditor富文本编辑器修改图片上传路径
  6. 城市轨道交通运营管理属于什么院系_城市轨道交通运营管理是什么
  7. [好玩的CMD]CMD批处理绘制彩色的像素画
  8. OpenCV C++案例实战十三《人脸打马赛克》
  9. Word2003入门动画教程49:巧用Word中的选择性粘贴功能
  10. Linux Debian利用Dockefile将Python的py文件项目代码打包为Docker Podman镜像