批量下载基因的蛋白质氨基酸序列
前提:有一批基因(有基因名,转录本编号:NM_xxxx.x,UniprotID),需要下载这些基因(相应转录本)的蛋白质氨基酸序列。
过程:
一、下载单个基因(某个转录本)的蛋白质序列:
----- 找到指定转录本(NM_xxx)对应的蛋白质序列(NP_xxx)
a. 根据基因名在NCBI-Gene数据库中找到该基因,在该基因的详细页面中,通过ctrl+F 搜索NM编号,找到NM编号对应的NP编号,点击NP编号链接,转到下载氨基酸fasta序列页面。
b. 根据基因名在Uniprot数据库中搜索,在Uniprot页面中ctrl+F搜索"refseq",可看到该基因所有的转录本NM_编号及对应的蛋白NP_编号,点击NP_可转到下载序列页面
以CHD7基因为例,在Uniprot数据库中找到Human的Entry:
在CHD7_Human页面中,ctrl+F搜索"refseq",可看到该基因所有的转录本NM_及对应的蛋白NP_:
点击NP_xx即可转到下载蛋白序列页面。
二、获取这些基因指定转录本(NM_xxxx)对应的NP_xxx信息,再根据NP编号批量下载蛋白序列
1. 按照上面的方式,逐个查询并记录指定转录本的NP编号。
2. 是否有数据库能同时提供NM_xx及对应NP_xx信息?--批量获取
-------Uniprot数据库-Retrieve/ID mapping,可根据某一类型的identifier批量获取其他多种信息:
包括Gene name, Length, Sequence, PDB 等。
"Columns"设置需要展示的信息(Gene name, Length, Sequence, PDB 等),并可调整好column顺序后下载到本地:
可在下载前选择Reviewed的部分,或者下载后在Status列筛选"reviewed"的内容。(一般用到的是reviewed的)
批量下载基因的蛋白质氨基酸序列相关推荐
- 新版TCGA数据库学习:批量下载新版TCGA数据
众所周知,TCGA数据库改版了!!改的比之前更好用了! 对于常规转录组数据,主要是以下几点改变: 下载一次即可获得counts.TPM.FPKM三种类型的表达矩阵,再也不用单独下载了 自带gene s ...
- 利用毒株的accession号,批量下载fasta格式的文件
一.安装好Entrez Driect 见:http://www.cnblogs.com/lmt921108/p/8087474.html 二.在NCBI官网找到需要下载的文件的accession号 二 ...
- 批量注释基因到基因座上(map gene to locus)
GWAS研究中经常涉及到基因座(locus)的概念,下面简要介绍一下批量注释基因到基因座的方法. 1.单个基因注释到基因座 对于单个基因的基因座注释,比较简单,常用的工具有:UCSC Genome B ...
- Getfasta--根据Acession Number(Ac号)批量下载GenBank分子序列数据的自动化程序
推断分子系统发育树时,很多分子序列数据都是从GenBank等公共数据库下载的.当数据很多时,每条序列都要检索.下载十分耗时,而且容易出错.作者基于NCBI官方提供的Entrez direct软件包,二 ...
- JGI Phytozome 批量下载的几种方法
介绍 目前Phytozome v13版本已经增加 Command line download 选项,如果你需要下载的数量不多直接选择命令行下载就可以啦. 当然下面的方法也可以参考,如果你需要下载全部P ...
- linux下载TCGA数据,使用gdc-client批量下载TCGA数据
欢迎关注"生信修炼手册"! GDC的在线下载功能只适用于下载小的数据集,当需要下载数据量较大的TCGA数据时,必须借助于GDC官方提供的客户端工具gdc-client.网址如下 h ...
- 如何从cBioPortal批量下载TCGA数据
cBioPortal对癌症基因组数据集做了比较好的整合,为了进行数据集的下载.分析和可视化. 可以用网页工具或者它们提供的R包"cgdsr"对几个目标基因进行分析,或者下载他们从B ...
- android源码下载方法 批量下载 基于windows os
安装win版的Gitbash, 在这里 http://msysgit.googlecode.com/files/Git-1.6.0.2-preview20080923.exe. 选择默认安装路径(否则 ...
- 批量下载文献中的参考文献
批量下载文献中的参考文献 这里写目录标题 批量下载文献中的参考文献 一级目录 二级目录 三级目录 一.下载所有你需要文献的引文题录 二.导入到文献管理软件中 **点击导入文献,上一步已经下载的,如果不 ...
- Python批量下载XKCD漫画只需20行命令
XKCD是一个流行的极客漫画网站,其官网首页有一个 Prev 按钮,让用户导航到前面的漫画.如果你希望复制该网站的内容以在离线的时候阅读,那么可以手动导航至每个页面并保存.但手动下载每张漫画要花较长的 ...
最新文章
- Java Optional类源码解析和用法
- 趋势科技:黑客勒索瞄准智能电视
- vhd安装windows 7 64位
- 网易云信荣获第十五届中国企业年终评选「IT行业优秀技术奖」!
- MyBatis DAO层开发——Mapper动态代理方式
- boost::timer模块检查在同一程序中使用 Chrono 和 Timer 不会导致链接错误
- c语言输入整数要求输出字符,求C语言 将输入整数转换成字符串输出!
- 在CSDN上的第一篇博客
- 理科都要学大学计算机吗,女生不适合学理科专业?报考这些理科专业,一毕业就会遭到疯抢!...
- 华为鸿蒙系统自动驾驶,华为高阶自动驾驶 + 华为鸿蒙 OS 车机系统体验
- MongoDB 副本集的相关概念【转】
- java subset_Java TreeSet subSet()方法
- mysql8.0.16安装_mysql8.0.16安装(补) September 24,2019
- js计算html的font-size
- 大众点评有多少用户2019_据说2019年度大众点评排名第一
- 海康威视在linux下使用笔记——ros驱动相机
- IMD下载软件的使用
- 微信小程序怎么用? 老徐小程序!
- 阅读小结:The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognition
- 走进量子计算的大门——使用量桨PaddleQuantum创建单量子比特门
热门文章
- 图示代码,轻松解决IV值计算问题(python)
- 计算机用几个字节储存,一个文字在计算机中用两个字节来储存。()
- 多元线性模型的分位数回归
- 趣挨踢 | 只有挨踢人才能读懂的西游记
- Saber2016仿真软件安装详细步骤及hostID全为0的可能原因
- Springboot毕设项目基于SpringBoot的个人理财系统ibx9hjava+VUE+Mybatis+Maven+Mysql+sprnig)
- 用户价值分层——基于RFM模型的研究分析
- 美国迈阿密二手房房价预测
- 如何做好终端安全管理?
- windows系统VS code coderunner 运行shell脚本