点击上方“蓝色字体”关注我们

鹿明

生物

蛋白、代谢组学服务专家

关注我们收获更多

关注

随着生物科技的迅速发展,每天都会有海量的生物学数据产生,如何有效的分析这些“生物学大数据”?生物信息学的应用变得尤为重要,在生物领域从基因测序,到基因编辑,再到基因疗法的精准医疗,由生物科技引发的又一场变革正悄然而至。试问大家做好准备迎接它到来了吗?

本次分享的主题为:如何快速获取海量数据?我们就从物种的DNA或蛋白质序列说起,在我们的科学研究中下载序列是一件简单不过的事情,无非就是联网NCBI等主页上,选择数据库后输入AC号或GI号后直接下载。

如果是少量的序列数据,我们可以通过一个个ID去查找,复制,粘贴方式保存到本地文件中。

但是如何大批量下载数据呢?再通过复制、粘贴方法虽然很精确但是对于大批量的数据下载效率实在是太低了。是否可以直接下载数据库准备好的序列文件?或者编写程序脚本进行批量下载?

本次小鹿分享的是2种热门物种(人和鼠)的无编程基础的下载方式。(我们后面会分享“如何使用代码批量下载生物学序列数据”)

物种  人

1.NCBI的GenBank数据库

基因:MYH9

物种:人Homo sapiens

(1)用浏览器登录NCBI数据库官网:https://www.ncbi.nlm.nih.gov/

(2)数据库选择框:选择Gene;在搜索框输入:MYH9,可以添加Homo sapiens或者Human,这样匹配更准确;

(3)点击MYH9 - myosin heavy chain 9,选择FASTA格式;

(4)点击下载MYH9基因序列NCBI Reference Sequence: NC_000022.11,起个合适的文件名,推荐使用基因名或者数据库登录号;

(5)物种基因组和蛋白组序列的下载

选择Genome子数据库,同样在搜索框输入物种英文名或拉丁学名,例如,输入human,我们查找人的基因组数据,如下所示:

点击下载基因组或蛋白组FASTA序列,直接会弹出下载链接,选择保存文件的位置即可开始下载;

还可以下载NCBI上的基因组注释GFF文件(Ensembl数据库也可以下载物种的GFF文件,后面会给大家讲到)

物种  人和小鼠

2.Uniprot数据库

样例蛋白:P35579

物种:人Homo sapiens和小鼠Mus musculus

(1)用浏览器登录Uniprot数据库官网:https://www.uniprot.org/

(2)搜索框输入:P35579,点击Search;

(3)查看P35579蛋白的生物学信息:肌球蛋白9(Myosin-9);

可以看到该蛋白主要分布在细胞基质中,是细胞的动力蛋白;

(4)下载序列数据,点击FASTA;

(5)下载物种蛋白质组序列文件(例如下载物种:小鼠mus musculus);

在Uniprot数据库官网选择Proteomes子库,然后在搜索框输入:mus musculus,选择Organism ID为10090的小鼠;

点击Protein Count: 55462,显示小鼠蛋白Entry,可以根据需要定制自己需要的数据:例如,我们需要GeneID,点击Columns进行个性化的定制;

如下所示:

点击Download下载所需要的数据,选择文件格式。如果我们需要的是表格数据,我们通常下载为Tab分割符(Tab-separated)的txt文件,因为Excel表格有最大行数的限制,如果超出最大行数会导致数据丢失;

如果是序列文件,我们选择下载FASTA格式的文件;

物种  人

3.Ensembl(Ensembl Genome Browser)数据库

物种:人Homo sapiens

(1)使用浏览器登录数据数据库:https://asia.ensembl.org/index.html

(2)选择Human数据库,如下所示:

(3)选择下载基因组序列,见下图:

(4)在Ensembl数据库下载物种的GFF文件

前面我们讲到了在NCBI数据库中下载物种基因组注释GFF文件,其实我们还可以在Ensembl数据库中下载物种的注释文件,而且在Ensembl中下载的GFF文件更加标准,使用起来更方便。

(5)直接连接到ensembl的FTP服务器,

网址:ftp://ftp.ensembl.org/pub/release-100/fasta/homo_sapiens/dna/

选择toplevel标签的序列文件进行下载,如下所示:

小鹿后面还会分享“如何使用代码批量下载生物学序列数据”哦,请关注鹿明生物,get最新分享热文。

猜你还想看

生信分析:你可以更美一些:SnapGene Viewer软件序列可视化操作

云平台:震惊!他花了3分钟就完成了我三个周的工作!

云平台:欧易/鹿明云 | 免费的聚类热图不试试吗?

生信分析:这个R包不太冷系列——GOplot(功能富集绘图)

生信分析:10行代码让你的相关性图貌美如花

生信分析:对话百年名画--文章绘图配色高级又简单!

生信分析:只需3分钟Get“代谢通路分析神器”

生信分析:玩转生信—火山图中“亿点细节”,你会打造吗?

生信分析:【指南】Cytoscape之stringAPP蛋白互作分析详解

生信分析:【教程】组学研究,用python快速实现PCA分析和绘图

生信分析:组学研究,R语言实用技巧—热图,运用pheatmap包简单易懂快速汇图方法来袭~

生信分析:【情人节】R语言—小提琴图的浪漫邂逅

END

北极星  撰文

欢迎转发到朋友圈

本文系鹿明生物原创

转载请注明本文转自鹿明生物

我知道你在看

从hbitmap中获取位图数据_如何快速从主流数据库中获取人/小鼠数据?相关推荐

  1. mysql如何定位到数据_如何快速定位当前数据库消耗CPU最高的sql语句?

    概述 如果是Oracle数据库我们可以很容易通过sql来定位到当前数据库中哪些消耗CPU高的语句,而mysql数据库可以怎么定位呢?这里用一个简单例子说明下... 主要是了解如何定位的思路,具体看官网 ...

  2. MySQL获取数据库连接对象_利用JDBC连接mysql数据库,获取连接对象的通用格式

    String driverName="com.mysql.jdbc.Driver";        //驱动程序名 String userName="root" ...

  3. 从oracle9i/92数据库中导出数据至 oracle 8.1.7 数据库中

    根据ORACLE官方文档的说明,一旦数据库创建后,数据库的字符集是不能改变的.因此,提前考虑自己的数据库将选用哪一种字符集 是十分重要的.数据库字符集选择的一般规则是将数据库字符集设定为操作系统本地字 ...

  4. java sql 写入万条数据_如何快速向数据库插1000万数据?4种方法对比,它简单却速度最快

    目录 场景介绍 项目配置 Mybatis为什么慢? JdbcTemplate让我眼前一亮 原生JDBC就是快啊! 存储过程怎么样? 越简单越快 前言 一直有一种说法:批量插入大量数据到MySQL数据库 ...

  5. 如何快速的向数据库中插入已知的1000万条数据

    MySQL 如何快速的向数据库中插入已知的1000万条数据 假设这1000W条数据在同一个集合里,那么将这个集合进行遍历,循环1000W次,结合数据库编程技术,如JDBC,就可以插入数据库,这么简单的 ...

  6. java中集合和数据库中_java中list集合的内容,如何使用像数据库中group by形式那样排序...

    标签:java中list集合的内容,如何使用像数据库中group by形式那样排序,比如: 有一个 List 他中包含了一些如下的内容 JavaBean: name    money (名称)  (金 ...

  7. MySQL 用 truncate 命令快速清空一个数据库中的所有表

    MySQL 用 truncate 命令快速清空一个数据库中的所有表. 1. 先执行select语句生成所有truncate语句 语句格式: select CONCAT('truncate TABLE ...

  8. delphi dbgrid 上下移动并获取选中值_如何在UE4移动端中实现HZB?

    文 | Youwei 腾讯互动娱乐 游戏客户端开发 Hierarchical Z-Buffering分层Z缓冲(HZB)对遮挡剔除研究具有重要影响,是GPU Driven Rendering Pipe ...

  9. sql 获取两个月内数据_如何在3个月的时间内自学成为数据分析师?

    从一名0基础的用户运营自学成为数据分析师,我花了大半年的时间,但是抛开工作时间,系统性的学习只花了3个月. 这篇文章会从学习资源和学习路径两个方面分享我的自学经验,希望能对大家有所帮助. 先来说说有哪 ...

最新文章

  1. hive报错(1)MoveTask/HIVE return code 1、2、3
  2. cd库图像处理php,PHP图像处理类库及演示分享
  3. 【计算机图形学课程】二.MFC鼠标响应函数模拟画图软件
  4. 如何使用Chrome开发者工具找到Marketing Cloud某个contact的guid
  5. 手动添加mysql服务
  6. django与mysql实现增删_django与mysql实现简单的增删查改
  7. vue 加载太慢_Vue首页加载过慢 解决方案
  8. C++中static与const成员
  9. vue中使用kindeditor编辑器_vue中使用kindeditor富文本编辑器
  10. 设置Linux用户无口令登陆方式
  11. Google Instant Apps VS 微信小程序
  12. C语言字符串函数(strcpy,strlen,strcat,stsstr,strchr,strcmp,memcpy,memmove)
  13. Shader Graph 护盾
  14. 怎样使用BMFont生成fnt字体
  15. 安装与配置SVN版本控制器(汉化包)
  16. 简单的jsp代码(登录界面)
  17. 请给孩子多一点点空间
  18. 无法获取 vmci 驱动程序版本句柄无效解决办法
  19. 如何维持手机电池寿命_教你如何让自己的手机电池寿命多用两年
  20. 5阶魔方阵c语言程序设计,五阶魔方阵源代码c语言课到程设计.docx

热门文章

  1. c++输出控制台彩色字体
  2. 电话薄排序C++--结构体数组
  3. 虚拟机下如何安装ISP编程下载器(或JTAG仿真器)
  4. Mac 开机卡在进度条界面
  5. 微信群怎么自动回复消息?微信群有关键字自动回复功能吗?
  6. 汇编语言笔记(待更新大作业)
  7. 关于 Kubernetes中Volume实操的一些笔记
  8. linux steam输入法,Ubuntu 13.04安装搜狗输入法
  9. 主图批量添加文字水印
  10. 分布式事务——Saga实现思路