NR(non-redundant,非冗余)数据库

文献:Deng YY, Li JQ, Wu S F, Zhu YP, et al. Integrated NR Database in Protein Annotation System and Its Localization. Computer Engineering 2006.,32(5):71-74.

特点:

  1、对已知的或者可能的编码序列,给出相应的氨基酸序列,其中部分提供蛋白数据库的序列号;

  2、可以用blast软件做比对连接。

Swiss-Prot数据库

文献:Apweiler R, Bairoch A, Wu CH, Barker WC, et al. UniProt: the Universal Protein knowledgebase. Nucleic Acids Research 2004 Jan 1;32(Database issue):D115-9.

特点:

SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。

GO数据库

文献:Ashburner M, Ball C A, Blake J A, Botstein D, et al. Gene ontology: tool for the unification of biology. Nature Genetics 2000, 25(1): 25-29.

特点:

  1. GO 不是基因序列或基因产物数据库,相反的,GO强调基因产物在细胞中的功能。
  2. GO不是整合数据库的一种方式(如联邦式整合数据库),它并不能做到这点是因为:
    a. 更新速度较慢
    b. 由于每个人对数据定义的方式不同,标准难以达到一致。
    c. GO并不对生物学的每个方面进行描述。如功能域的结构、3D结构、进化等。
  3.GO 是对基因功能的注解,但是有其局限性。比如说,GO不能反映此基因的表达情况,即是否在特定细胞中、特定组织中、特定发育阶段或与某种疾病相关。GO虽然不涉及这些方面,但是支持其他的OBO(open biology ontologies)成员成立其他类型的本体论数据库(如发育本体学、蛋白组本体学、基因芯片本体学等)

COG数据库(Cluster of Orthologous Groups of proteins(蛋白相邻类的聚簇))

文献:Tatusov RL, Galperin MY, Natale DA. The COG database: a tool for genome scale analysis of protein functions and evolution. Nucleic Acids Research 2000, 28(1):33-36.

特点:

  1、蛋白的注解。COG的一个蛋白成员的已知功能(以及二维或三维结构)可以直接应用到COG的其他成员上去。然而,这里也要警告,因为有些COG含有paralogs,它们的功能并非对应与那些已知蛋白。

  2、种系发生图谱。这给出在一个特定的COG中一个给定物种是否存在某些蛋白。系统使用,这些图谱可以用来确定在一个物种中是否一个特定的代谢途径。

  3、多重对齐。每一个COG页面包括了一个链接到COG成员的一个多重对齐,那可以被用来确定保守序列残基和分析成员蛋白的进化关系。

KOG数据库

文献链接:Koonin EV, Fedorova ND, Jackson JD, et al. A comprehensive evolutionary classification of proteins encoded in complete eukaryotic genomes. Genome biology, 2004, 5(2): R7.

可以理解为COG是NCBI的数据库。COG的中文释义即“同源蛋白簇”。COG分为两类,一类是原核生物的,另一类是真核生物。原核生物的一般称为COG数据库;真核生物的一般称为KOG数据库。

Pfam

文献链接:Finn RD, Bateman A, Clements J, et al. Pfam: the protein families database. Nucleic Acids Research, 2013: gkt1223.

蛋白质家族数据库,根据多重序列比对和突变谱HMM构建

KEGG数据库

文献链接: Kanehisa M, Goto S, Kawashima S, Okuno Y, et al. The KEGG resource for deciphering the genome. Nucleic Acids Research 2004, 32(Database issue):D277-D280.

KEGG(京都基因与基因组百科全书)是基因组破译方面的数据库。在给出染色体中一套完整的基因的情况下,它可以对蛋白质交互(互动)网络在各种细胞活动起的作用作出预测。 KEGG 的PATHWAY 数据库整合当前在分子互动网络(比如通道,联合体)的知识,KEGG 的GENES/SSDB/KO 数据库提供关于在基因组计划中发现的基因和蛋白质的相关知识,KEGG 的COMPOUND/GLYCAN/REACTION数据库提供生化复合物及反应方面的知识。

转载于:https://www.cnblogs.com/daimakun/p/5092473.html

有参转录组常用数据库相关推荐

  1. 互作转录组常用数据库介绍

    互作转录组可研究两个物种或多个物种的相互作用机制,也就是说利用该研究方法,我们不仅可以得到宿主防御病原菌机制,也可以研究病原菌如何侵染宿主.关于病原菌如何导致宿主患病和宿主如何防御病原菌入侵,一直以来 ...

  2. 分析方法升级三代测序辅助,优化无参转录组测序策略

    分析方法升级&三代测序辅助,优化无参转录组测序策略 无参转录组拼接升级 Corset 让"基因"概念更准确 在无参转录组项目中,利用主流软件 Trinity 进行 De n ...

  3. 常用数据库的Jdbc连接代码

    常用数据库有:Oralcle,MySql,Postgresql,ODBC,SQL server 1. Oracle Class.forclass("oracle.jdbc.driver.Or ...

  4. db2主键自增和oracle,oracle_浅析常用数据库的自增字段创建方法汇总,DB2复制代码 代码如下:CREATEnbsp - phpStudy...

    浅析常用数据库的自增字段创建方法汇总 DB2 CREATE   TABLE  T1 ( id  INTEGER   NOT   NULL  GENERATED ALWAYS  AS   IDENTIT ...

  5. 【腾讯面试题】MySQL常用数据库引擎

    MySQL常用数据库引擎 MyISAM存储引擎 InnoDB存储引擎 MEMORY存储引擎 存储引擎的选择 查看MySQL数据库使用的引擎 SHOW ENGINES; 查看数据库默认使用哪个引擎 SH ...

  6. 超大数据量存储常用数据库分表分库算法总结

    这篇文章主要介绍了超大数据量存储常用数据库分表分库算法总结,本文讲解了按自然时间来分表/分库.按数字类型hash分表/分库.按md5值来分表/分库三种方法,以及分表所带来的问题探讨,需要的朋友可以参考 ...

  7. destoon网站mysql分表_destoon : 常用数据库操作

    destoon在初始化系统后系统会自动连接数据库,并将数据库操作对象保存在$db. 对于数据库操作方法参考include/db_mysql.class.php函数原型,我来写几个常用数据库操作.1.读 ...

  8. 使用OLE DB方式连接常用数据库的连接字符串的设置

    使用OLE DB方式连接常用数据库的连接字符串的设置 SQL Server 使用 OLE DB 所设置的连接字符串: 标准连接方式 Provider=sqloledb;Data Source=data ...

  9. 达梦数据库查看某个表的字段类型、常用数据库驱动类名以及URL

    达梦数据库查看某个表的字段类型 select * from all_tab_columns where Table_Name='T_FILES' AND OWNER='WJW'; 注:Table_Na ...

最新文章

  1. 关于华为虚拟操作键收起后页面高度不会刷新问题的总结
  2. 在线视频解决方案供应商
  3. 视频和音频播放的演示最简单的例子9:SDL2广播PCM
  4. 软件测试2019:第七次作业—— 用户体验测试
  5. Java为什么会存成undefined,为什么我在Java中获得NoClassDefFoundError?
  6. 【机器学习实战】第2章 k-近邻算法(kNN)
  7. openresty nginx php,diy 你的nginx-OpenResty
  8. 将单链表翻转的两种方法
  9. 2021年商业的几点变化
  10. 怎样才能知道自己的手机是否支持北斗导航?
  11. 程序员Mac常用软件之效率工具
  12. C# 基础系列--程序集三
  13. vm8.0下安装mac
  14. SAI2 安装及导入笔刷素材
  15. ios睡眠分析 卧床 睡眠_苹果ios14睡眠记录功能 让用户清楚的了解自己的睡眠
  16. Go语言判断接口的具体类型并进行类型转换
  17. Maven详解(第二节)
  18. Python基础(六):字符串、元组、列表习题
  19. 高仿网易云音乐一(可扫描本地音乐播放)
  20. linux ping不通自动关机脚本,服务器断电自动关机bat脚本

热门文章

  1. mysql从一张表更新另外一张表_MySQL 从一张表update字段到另外一张表中
  2. tp3.2.3权限控制一之详解及demo
  3. 一个星期+4轮面试终拿下offer,极致干货
  4. python【力扣LeetCode算法题库】4- 寻找两个有序数组的中位数
  5. 7-18 银行业务队列简单模拟 (25 分)
  6. 回归插补法_用均值替换、 回归插补及多重插补进行插补
  7. vue-video-player文档_vue的video插件vue-video-player
  8. 归并排序执行次数_归并排序过程、时间复杂度分析及改进
  9. 子网划分为什么全0全1子网号不能使用?CIDR为什么能使用全0全1子网号?
  10. 企业网站SEO优化如何做引流并促进转化?