转自:http://liucheng.name/379/

  NCBI RefSeq (美国国立生物技术信息中心参考序列库) 是目前世界上最具有权威性的序列数据库。NCBI的参考序列计划(RefSeq)将为中心法则中自然存在的分子,从染色体到mRNA到蛋白提供参考序列标准。RefSeq标准为人类基因组的功能注解提供一个基础。它们为突变分析,基因表达研究,和多态发现提供一个稳定的参考点。由于一些序列来自异常连接产生的转录物或由计算机推演产生的不正确内含子-外显子剪切,因此该数据库所收集的参考序列一直在不断地被修改中,尽管如此,NCBI RefSeq仍是目前最可信赖的人类基因mRNA序列数据库。

RefSeq一般的命名格式:前缀为两个字母,然后下横线('_')。区别于其它的GenBank的命名格式。

Accession Molecule Method @ Note 说明 
AC_123456 Genomic Mixed Alternate complete genomic molecule. This prefix is used for records that are provided to reflect an alternate assembly or annotation. Primarily used for viral, prokaryotic records.  基因组序列,主要是病毒、原核生物。
AP_123456 Protein Mixed Protein products; alternate protein record. This prefix is used for records that are provided to reflect an alternate assembly or annotation. The AP_ prefix was originally designated for bacterial proteins but this usage was changed.  蛋白序列,AP_原本只用于细菌的蛋白。
NC_123456 Genomic Mixed Complete genomic molecules including genomes, chromosomes, organelles, plasmids.  全基因组序列,包括细胞器的、质粒等
NG_123456 Genomic Mixed Incomplete genomic region; supplied to support the NCBI genome annotation pipeline. Represents either non-transcribed pseudogenes, or larger regions representing a gene cluster that is difficult to annotate via automatic methods.  不完整的基因组序列,
NM_123456
NM_123456789
mRNA Mixed Transcript products; mature messenger RNA (mRNA) transcripts.  成熟的mRNA
NP_123456
NP_123456789
Protein Mixed Protein products; primarily full-length precursor products but may include some partial proteins and mature peptide products.  全长蛋白序列。但也有可能包括非全长的蛋白或成熟的多肽序列。
NR_123456 RNA Mixed Non-coding transcripts including structural RNAs, transcribed pseudogenes, and others.  不编码的RNA,假基因或其它
NT_123456 Genomic Automated Intermediate genomic assemblies of BAC and/or Whole Genome Shotgun sequence data.  BAC法或鸟枪法得到的基因组序列
NW_123456
NW_123456789
Genomic Automated Intermediate genomic assemblies of BAC or Whole Genome Shotgun sequence data.  BAC法或鸟枪法得到的基因组序列
NZ_ABCD12345678 Genomic Automated A collection of whole genome shotgun sequence data for a project. Accessions are not tracked between releases. The first four characters following the underscore (e.g. 'ABCD') identifies a genome project.  'ABCD'代表的是具体的基因组计划
XM_123456
XM_123456789
mRNA Automated Transcript products; model mRNA provided by a genome annotation process; sequence corresponds to the genomic contig.  转录序列
XP_123456
XP_123456789
Protein Automated Protein products; model proteins provided by a genome annotation process; sequence corresponds to the genomic contig.  蛋白序列
XR_123456 RNA Automated Transcript products; model non-coding transcripts provided by a genome annotation process; sequence corresponds to the genomic contig.  不编码的转录序列,
YP_123456
YP_123456789
Protein Mixed Protein products; no corresponding transcript record provided. Primarily used for bacterial, viral, and mitochondrial records.  蛋白序列,没有对应的转录序列。用于细菌、病毒和线粒体
ZP_12345678 Protein Automated Protein products; annotated on NZ_ accessions (often via computational methods).  蛋白序列。来自对应的NZ_开头的核酸序列。
NS_123456 Genomic Automated Genomic records that represent an assembly which does not reflect the structure of a real biological molecule. The assembly may represent an unordered assembly of unplaced scaffolds, or it may represent an assembly of DNA sequences generated from a biological sample that may not represent a single organism.  比较复杂

@ Method:   
Mixed: indicates the process flow includes both automated processing and expert review for some of the records; curation analysis may be provided either by NCBI staff or collaborators.由专家手动检查过的
Automated: indicates records that are not individually reviewed; updates are released in bulk for a genome.自动注释的

原文链接: http://www.ncbi.nlm.nih.gov/RefSeq/key.html#accession

NCBI RefSeq命名格式的详细说明相关推荐

  1. 从NCBI refseq 中下载特定物种的蛋白质数据

    前言 今天又和NCBI数据库干上了.由于NCBI奇奇怪怪的格式,导致我们下载特定物种(某个科.某个属)比较麻烦,手动一条条下载肯定是不现实的,而对于部分很少涉及干实验的生物研究人员来讲写代码也不容易. ...

  2. 基于Python的文件批量重命名(附详细过程解读)

    基于Python的文件批量重命名(附详细过程解读) 0.闲言碎语 hi ~ 欢迎关注公众号"壹贰叁言"! 啥都写,图一乐哈哈! 1.前因后果 前几日,我在用arcgis处理一些数据 ...

  3. 软件项目版本号的命名格式

    软件项目版本号的命名格式 版本控制比较普遍的 3 种命名格式 : 一. GNU 风格的版本号命名格式 : 主版本号 . 子版本号 [. 修正版本号 [. 编译版本号 ]] 英文对照 : Major_V ...

  4. 暴风影音播放视频显示连接服务器失败,暴风影音出现无法观看MKV格式的详细解决方法...

    暴风影音是款很不错的播放器,很多朋友们都喜欢使用,包括小编也很喜欢使用,那么暴风影音中出现无法观看MKV格式该怎么处理呢?以下就带来了暴风影音出现无法观看MKV格式的详细解决方法. 周所周知,暴风影音 ...

  5. (沂水县地图)行政区划交通图高清矢量cdr|pdf|ai格式(详细2021年)

    (沂水县地图)行政区划交通图高清矢量cdr|pdf|ai格式(详细2021年).pdf格式可以导入cdr软件ai软件另保存cdr,ai格式,可以编辑内容文字,矢量高清图,尺寸高1.2米宽1米.可以无限 ...

  6. (宁波江北区地图)区划乡镇图高清矢量cdr|pdf格式(详细2021年)

    (宁波江北区地图)区划乡镇图高清矢量cdr|pdf格式(详细2021年)pdf格式可以导入cdr软件ai软件另保存cdr,ai格式,可以编辑内容文字,矢量高清图,尺寸高1.5米宽2米.可以无限放大矢量 ...

  7. Zotero如何修改文献命名格式

    通常来讲,在浏览器中使用zotero connector插件保存的文章,其默认命名不是我们想要的格式. 这个时候就要对命名规则进行修改.这里我们已经提前安装了ZotFile插件,所以选择Tools&g ...

  8. 怎么把PPT转成EXE格式,详细步骤

    前几天,我做求婚记的PPT,把它转成了EXE格式.这样做,有以下几点好处: 1 方便没有安装PPT的人观看 2 可以保护PPT的内容不被COPY或者修改 3 便于播放,因为很多PPT里面使用了一些音频 ...

  9. 交叉编译器的命名规则及详细解释(arm/gnu/none/linux/eabi/eabihf/gcc/g++)

    在linux系统下搞嵌入式开发,交叉编译器那肯定是必备工具.用的场合多了,就会见到各种各样的编译工具,比如: arm-linux-gcc arm-linux-gnueabi-gcc arm-none- ...

最新文章

  1. 工业界AI项目落地的繁琐过程
  2. 百度之星第一题竟然没过
  3. java编写类骑士游历_java课程设计骑士游历程序的开发
  4. python 去除字符串的标点符号 用_7步搞定数据清洗-Python数据清洗指南
  5. 张家口以太坊智能合约开发实战pdf_以太坊的再次腾飞,你看得懂么?
  6. [Java]图片压缩
  7. ubuntu下面navicat连接本地数据库出现2003 - Can't connect to MySQL server on 'localhost'(10061 Unknown errort;)
  8. laravel-admin 中怎么给 grid 的列添加行数序号
  9. 前端面试每日 3+1(每日三问)
  10. mysql存储过程是不是不能穿sql语句_mysql存储过程能不能直接执行拼接的sql语句...
  11. 用积分来衡量博客的成绩
  12. 关于解决Permission is only granted to system apps
  13. 地址已在使用 java_java – UDP地址已经在使用?
  14. aba会导致问题_ABA问题
  15. 3D顶点转换和法线转换
  16. 解决“未找到与约束CContractName Microsoft.Internal.VisualStudio”
  17. 3D建模师是吃青春饭的吗?被高薪挖掘的建模人才,靠的是这个
  18. vueminder ultimate 2020中文版(电脑桌面日历工具) v2020.07
  19. 计算机组装有哪些,详解电脑组装配置有哪些
  20. 企业新站,如何建立外链,提高预期排名?

热门文章

  1. 深度linux 内核符号表,linux 内核符号表
  2. cad2006安装未找到html文件,我的CAD已安装在D驱动器上,但是在打开dwg文件时,它提示找不到C...
  3. javaee入门笔记2
  4. 打开dll文件时模块加载失败,请确保二进制存储在指定的路径中,或者调试它以检查该二进制或相关的.DLL文件是否有问题
  5. IBM 能靠 2nm 芯片翻身吗?
  6. android8.1字体,Android8.1系统字体
  7. 刺客信条起源服务器换装备显示错误6,刺客信条起源手柄切换装备 | 手游网游页游攻略大全...
  8. 关于国土空间交通专项规划体系框架与编制要点的思考
  9. 2022年第二届中国高校大数据挑战赛A题探究
  10. oracle查询列出24小时,ORACLE日期相关操作