基因组序列及注释数据下载
1. 网站下载
NCBI Download - NCBI
Ensembl Accessing Ensembl Data
UCSC https://hgdownload.soe.ucsc.edu/downloads.html
2. 命令行下载
从ucsc下载基因组序列
wget https://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz ./
wget https://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/md5sum.txt ./wget https://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz ./
wget https://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/md5sum.txt ./
从Ensemble下载注释数据
wget http://ftp.ensembl.org/pub/release 104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz ./
下载annovar 注释数据
# datadb list from annovar
annotate_variation.pl -downdb -webfrom annovar avdblist humandb/ -buildver hg38wget http://www.openbioinformatics.org/annovar/download/hg38_avdblist.txt.gz ./
Broadinstitute GATK数据下载
ftp
open ftp.broadinstitute.org # 连接站点
# 输入用户名
gsapubftp-anonymous
# 密码 直接回车
# 查看文件,切换目录
ls
cd close # 关闭连接
exit #推出ftpnohup wget ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/hg38/* . &
nohup wget ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/hg19/* . &
nohup wget ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/Mutect2/* . &
nohup wget ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/oncotator/* . &
nohup wget ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/funcotator/* . &
Reference:
参考基因组及注释文件下载 - 小xuo生 - 博客园
Ensembl 基因组下载方法-新闻-诺禾致源
ENSEMBL | 生信菜鸟团
基因组序列及注释数据下载相关推荐
- 人类基因组参考序列及基本注释数据下载
1. 从UCSC下载hg38参考序列及注释数据 # 下载到当前文件夹 wget https://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/md5s ...
- WebMGA:超快的基因组序列聚类注释在线工具
文章目录 超快的基因组序列聚类注释在线工具WebMGA 序列聚类cd-hit 基因预测ORF prediction 蛋白COG注释 作者简介 参考文献 猜你喜欢 写在后面 超快的基因组序列聚类注释在线 ...
- 如何对基因组序列进行注释
基因组组装完成后,或者是完成了草图,就不可避免遇到一个问题,需要对基因组序列进行注释.注释之前首先得构建基因模型,有三种策略: 从头注释(de novo prediction):通过已有的概率模型来预 ...
- RNA-seq(2):下载参考基因组及基因注释,及测序数据-学习笔记
今天学习了如题的一些操作.但是并不算成功.本来打算做到quality control,结果大部分时间卡在了下载测序数据上. 参考网站: 下载参考基因组及基因注释) 1.安装ASPERA 1)wget ...
- 一种PacBio测序数据组装得到的基因组序列的纠错方法技术 (专利技术)
一种PacBio测序数据组装得到的基因组序列的纠错方法技术 技术编号:17008244阅读:83留言:0更新日期:2018-01-11 04:20 本发明专利技术提供一种PacBio测序数据组装后序列 ...
- databasemetadata获取表注释_宏基因组测序中短序列的注释
宏基因组中短序列的注释是理解测序微生物群落潜在功能的重要步骤之一.单纯利用局部匹配的注释容易混淆那些蛋白同源性且局部序列非常相似的序列,进而不能真实准确反映复杂蛋白质家族中多变的结构和功能域. 今天我 ...
- linux 基因组数据下载,phytozome植物基因组下载网站
Phytozome 作为专门收录植物基因组的网站,在基因组数据的下载.查询.可视化浏览等方面做的也很不错,也是一个不错的基因组数据下载数据库. 今天主要介绍一下该网站基因组如何下载,如何通过blast ...
- linux 基因组数据下载,批量下载JGI(phytozome植物基因组数据库)数据
写在前面 今天课题组师妹与我提到,其要下载Phytozome上的所有数据.这个事情,我在早在几年前干过.不过前年有整了一次.整体简单,以下附上之前的记录. 2017年的记录 稍微整理了流程,方便批量下 ...
- 一种PacBio测序数据组装得到的基因组序列的纠错方法
技术领域 本发明涉及生物信息技术领域,更具体的说,它涉及一种PacBio测序数据组装得到的基因组序列的纠错方法. 背景技术 PacBio是一家测序仪公司,提供第三代测序技术测序平台,他们的测序仪产生的 ...
最新文章
- [Head First设计模式]山西面馆中的设计模式——装饰者模式
- idea junit简单实践
- MAP(Mean Average Precision)
- python字符串类型str_python数据类型之字符串类型str
- [XSS神器]XssEncode chrome插件 - 0x_Jin
- linux环境下安装nginx步骤(不错)
- [html] websocket和http有什么区别?
- 网站定时监控平台有哪些 7款好用的实时监控网站工具
- 安装ubuntu系统,保留原始分区数据
- wp后台页面切换慢,打开速度慢:jquery-ui.min.css加载失败——在国外
- html在一行内横向排列并排同行同时显示两个多个div盒子的方法
- 曙光服务器重装系统centos7.9
- Python matplotlib绘图,使用鼠标滚轮放大/缩小图像
- CAD中怎么绘制攒尖屋顶?CAD设计攒尖屋顶技巧
- 需求预测模型分类与选择
- macbook 2020 wintogo 安装驱动问题解决
- SpotlessCity:第一个干洗服务网站 反映纽约人有多懒
- 【Rust日报】 2019-07-29:关于创建「更小的」Rust的思考
- Drynx: 基于区块链的去中心化隐私保护机器学习系统
- 语义网简介(非应用)
热门文章
- C#利用Graphics类绘制进阶--绘制商品69码EAN-13
- PlaneTR:一种用于提取场景中3D平面特征的Transformer(ICCV 2021)
- 计算机视觉中的数据预处理与模型训练技巧总结
- 规划2021年技术路标,百度研究院做出了这样一份预测
- 数值分区间_EXCEL统计区间个数的专属函数
- conda 和 pip 安装本地包
- RDKit | 基于RDKit的PandasTools加速数据分析
- 变分自编码器VAE代码
- java gstripe_通过Stripe Connect进行交易
- 如何使用ggplot2绘制左右分布的柱状图