win10下的RNA测序(一)
参考资料
大多数的下载软件都可以根据这篇博客下载:https://www.jianshu.com/p/6a4855023330
feature_count下载与用法 :https://blog.csdn.net/weixin_43840576/article/details/106527854
gtf文件下载:https://www.jianshu.com/p/2371e489bb1c
genome注释文件的index可以在hisat官网下下载,建议不要自己建索引,因为时间太久
第一步:下载windows下的linux系统(wsl)
基本检索下即可,下面这篇是官方的安装文档:https://docs.microsoft.com/zh-cn/windows/wsl/install-win10
后面也可用xshell连接子系统,但是这一步我暂时失败了,有时间再探索下
如何打开linux的文本夹
explorer.exe .
第二步:conda 创建环境,下载软件
比对软件hista2:下载网址https://daehwankimlab.github.io/hisat2/download/#m-musculus,而且在hista2中还能下载到小鼠以及人类的基因组以及index
samtools:由于装二进制版的实在是过于艰难,所以考虑用conda安装好了,conda装的话如果装1.7版本的话会有libcrypto.so.1.0.0的错误,安装1.9的版本就好了
conda install -c bioconda samtools=1.9 --force-reinstall
fastqc文件也搞完了
一些我的目录设置,主要方便调用
hista2_menu=/home/yuanhang/data/reference/index/hista2/mmuGrcm38/genome/grcm38
work_menu=/mnt/d/BaiduNetdiskDownload/RNA测序/X101SC20083264-Z01-J002/2.cleandata
gtf=/home/yuanhang/data/reference/gtf/hista2/mmuGrcm38/mm39.gtf
比对
# 单个样本hisat2 -p 16 -t -x $hista2_menu/genome -1 PBSzu-2_1.clean.fq.gz -2 PBSzu-2_2.clean.fq.gz | samtools sort -@ 2 -o ${id}.bam ; done# 多个样本时ls *.gz | cut -d "_" -f 1 |sort |uniq |while read id ; do hisat2 -p 4 -t -x $hista2_menu/genome ;-1 ${id}_1.clean.fq.gz -2 ${id}_2.clean.fq.gz |samtools sort -@ 2 -o ${id}.bam ; done
done 后的字符串,比对率在98%以上,还行。这边在比对时如果加上一个-t参数会输出比对时间,但是如果你不管的话就不会跳到下一步,这造成了我比对时间长。但其实只是因为我没有点击屏幕导致的
feature_counts 计数
我吐了,这1.6的版本报的是subread内核有问题用不了,结果我去官网下了个新版的,运行,ε=(´ο`*))可以了http://subread.sourceforge.net/
# 先下载资源包
#wget https://jaist.dl.sourceforge.net/project/subread/subread-1.6.0/subread-1.6.0-Linux-x86_64.tar.gz
#tar -zxf subread-1.6.0-Linux-x86_64.tar.gz
# 解压后设定bin文件到bashrc中,方便调用
vi ~/.bashrc
export PATH=/home/你的目录xxxx/subread-1.6.0-Linux-x86_64/bin/:$PATH
source ~/.bashrc
# 计数
featureCounts -p -a $gtf -T 6 -g gene_id -t exon -o exp.txt *.bam
写在后面
后面的刚开始数据的调用,比如下载sra数据,以及sra解压成fastq数据,再到trim去接头后面再补充
第二篇应该是写feature_counts后的数据怎么处理
win10下的RNA测序(一)相关推荐
- win10下的RNA测序(二)
写在前面 这部分讲的是根据上游得到的counts数做差异分析以及通路富集 读入文件 options(stringsAsFactors = F) rm(list = ls()) pwd = " ...
- 从引力波探测到RNA测序,AI如何加速科学发现
来源:AI科技评论 本文约6600字,建议阅读5分钟 本文还展示了多科学领域共同面临的挑战和应对策略,希望通过集成和加速的机器学习解决方案为科学发现提供更多示例和灵感. 本篇综述报告主要讨论了机器学习 ...
- 重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述)
原文链接: https://www.embopress.org/doi/10.15252/msb.20188746 主编评语 这篇文章最好的地方不只在于推荐了工具,提供了一套分析流程,更在于详细介绍了 ...
- 【R语言】Splatter,一个用于简单模拟单细胞RNA测序数据的R包
Splatter是一个用于模拟单细胞RNA测序数据的R包,本文概述并介绍Splatter的功能 一.参数功能 名称 功能 说明 可以通过splatEstimate函数估计 备注 nGenes -> ...
- 易基因 | 文献解读:单细胞RRBS+RNA测序揭示黄曲霉毒素B1诱导S期阻滞L02细胞肝毒性新机制
大家好,这里是专注表观组学十余年,多组学科研服务领跑者的易基因. 错过易基因11.492高分项目文章的可点击这里:项目文章 | oxBS-seq揭示了宫颈癌发生过程中的表观遗传特征变化 一起来看今天的 ...
- 单细胞RNA测序研究的实验设计指南(部分阅读)
本篇内容只了解了数据处理与数据分析两个方面,其余方向与计算的关系不是很大,故没有学习.该篇论文的出版时间为2018,我们以流程了解为主,方法新颖性比较小. 目录 数据处理 Normalization ...
- 基于RNA测序技术的转录组从头拼接算法研究
基于RNA测序技术的转录组从头拼接算法研究 摘要: 生物信息学主要研究分子生物学领域,而对于分子生物学领域,转录组的从头拼接又是其核心内容,即利用转录组的测序片段拼接出整个转录组中的所有表达的转录体. ...
- 单细胞RNA测序技术之入门指南
单细胞RNA测序技术之入门指南 [字体: 大 中 小 ] 时间:2018年09月12日 来源:生物通 编辑推荐: 在这个飞速发展的测序时代,DNA和RNA测序已经逐渐成为"实验室中的家常菜& ...
- 文献解读|气管抽吸物RNA测序可识别COVID-19 ARDS的不同免疫学特征
TITLE:Tracheal aspirate RNA sequencing identifies distinct immunological features of COVID-19 ARDS 译 ...
最新文章
- TensorRT深度学习训练和部署图示
- Knn算法(约会问题应用)
- 【视频课】8小时系统性地掌握深度学习视频分类与行为识别理论+实践
- 线段树模板hdu 1754:I Hate It
- linux bash 字符串 连接,Linux Bash 中字符串操作
- [摘]UML学习二:标准建模语言UML的静态建模机制
- 计算机学stata,stata(统计学软件)
- java js页面提示报警声音
- 5G大规模MIMO技术
- window内置对象和js内置对象与方法
- Android系统移植与调试之-------)如何修改Android手机NFC模块,使黑屏时候能够使用NFC
- Regsvr 32命令的用处
- 赛门铁克:软件是灵魂
- 用计算机中的知识秀恩爱,自从用专业知识改了情侣名,女友再也不逼我秀恩爱了...
- CAD2021精简版安装教程附下载地址
- Mysql索引的原理、调优及其相关基础知识
- 恋爱百分百-五十条经典的爱情观
- UG NX 12 视图布局
- 成名后抛弃糟糠之妻的明星们
- 腾讯AI Lab宣布中国首款智能显微镜获药监局批准进入临床应用
热门文章
- latex缩进与对齐_latex 换行缩进
- ubuntu16.04安装cajviewer
- 2022国赛C:古代玻璃制品的成分分析与鉴别
- 海奥华预言--第五章 学会在另一个星球上生活
- linux ubuntu 安装git服务器,[linux] Ubuntu20.04上安装搭建私有Git服务器Gitea
- ctfIDF实验室捉到一只苍蝇
- MAC下的切图神器!SLICY使用说明
- Vue中,当组件同时注册单机事件(@click)和双击事件(@dblclick)时,处理事件冲突
- oracle02518,ORA-00600: internal error code [kkmupsViewDestFro_4] in oracle 11.2.0.1
- python钉钉自动打卡怎么设置_几行python代码实现钉钉自动打卡,网友:终于告别缺勤了...