转录组测序day 1 基础知识
写在前面,听完生信技能树的生信课之后受益匪浅,因此做一些整理和自己的理解,再次感谢生信技能树
一、概述
转录组是RNA转录本的集合,包括了在单个细胞或者大量细胞内的编码和非编码RNA。RNA在中心法则中是基因表达的起始,在一定程度上可以指示基因的表达或者某些LncRNA microRNA调控RNA的表达。因此我们通过了解单个细胞或者整体的RNA水平,可以得到不同处理因素之下对基因表达的影响,并通过下游分析,得出影响的核心基因、生物过程等。
二、普通转录组的基本流程
构建文库,连接好带接头的cDNA,接头自身并不配对,用途是与flowcell上的接头结合,起着固定的作用。barcode也就是index,起到识别的作用,这样可以多个样本一同上机测序。
SBS(边成边测序)在上机测序的中通过单分子阵列实现在小型芯片(Flowcell)上进行桥式PCR 反应。通过可逆阻断技术实现每次只合成一个碱基,再利用 四种带有不同荧光标记的碱基,通过荧光激发/捕获,读取碱基信息。基于可逆终止的、荧光标记dNTP,边合成边测序。
三、得到fastq文件
上机完成的结果以fastq文件形式保存,双端测序一般一个样本对应两个fq文件,gz是压缩的后缀,如
高通量测序(如Illumina NovaSeq等测序平台)得到的原始图像数据文件,经碱基识别(Base Calling)分析转化为原始测序序列(Sequenced Reads),我们称之为Raw Data或Raw Reads, 结果以FASTQ(简称为fq)文件格式存储,其中包含测序序列(Reads)的序列信息以及其对应的 测序质量信息。测序样品中真实数据随机截取结果如下图
四、设置清晰的工作路径
## 示例如下:
├── database # 数据库存放目录,包括参考基因组,注释文件,公共数据库等
├── project # 项目分析目录└── Human-16-Asthma-Trans #具体项目├── data # 数据存放目录│ ├── cleandata # 过滤后的数据│ ├── trim_galore # trim_galore过滤│ └── fastp # fastp过滤│ └── rawdata # 原始数据├── Mapping # 比对目录│ ├── Hisat2 # Hisat比对│ └── Subjunc # subjunc比对└── Expression # 定量├── featureCounts # featureCounts└── Salmon # salmon定量
# 进入到个人目录
cd ~## 1.建立数据库目录:在数据库下建立参考基因组数据库,注意命名习惯:参考基因组版本信息
mkdir -p database/GRCh38.105## 2.建立项目分析目录
mkdir project
cd project
mkdir Human-16-Asthma-Trans # 注意项目命名习惯:物种-样本数-疾病-分析流程
cd Human-16-Asthma-Trans# 建立数据存放目录
mkdir -p data/rawdata data/cleandata/trim_galore data/cleandata/fastp
# 建立比对目录
mkdir -p Mapping/Hisat2 Mapping/Subjunc
# 建立定量目录
mkdir -p Expression/featureCounts Expression/Salmon
# 查看整个分析目录准备结构
tree
├── data
│ ├── cleandata
│ ├── trim_galore
│ └── fastp
│ └── rawdata
├── Expression
│ ├── featureCounts
│ └── Salmon
└── Mapping├── Hisat2└── Subjunc
转录组测序day 1 基础知识相关推荐
- 二代测序之SNV基础知识笔记总结
二代测序之SNV基础知识笔记总结 文章目录 二代测序之SNV基础知识笔记总结 SNV基础知识 SNVs Mutation vs. Variant[变异和突变] 不同层次的突变 DNA: 1.编码DNA ...
- (待补充)单细胞测序的基础知识
什么是单细胞测序 单细胞RNA-Seq提供成千上万个单个细胞的 transcriptional profiling.这种水平的通量分析使研究人员能够在单细胞水平上了解哪些基因表达,多少数量以及异质样品 ...
- 各种测序基础知识汇总
1.RNA-Seq名词解释 2.测序名词解释 3.高通量测序常用名词解释 4.转录组测序问题集锦 RNA-Seq名词解释 index 测序的标签,用于测定混合样本,通过每个样本添加的不同标签进行数据区 ...
- 二代三代转录组测序分析实战班
本文原创"生信宝典"公众号,作者陈同. 转录组大家都很熟悉了,我们之前也有几篇介绍: 转录组分析的正确姿势 39个转录组分析工具,120种组合评估(转录组分析工具哪家强-导读版) ...
- 全长转录组测序在植物中的应用研究进展 赵陆滟,曹绍玉,龙云树,张应华,许俊强
基因组和转录组测序是生命科学领域的基础 性工作[1].高通量测序技术正向着高通量.低成本.长读取长度的方向发展.一代[2-3] .二代[4-7]测序技术,加快了高通量测序时代的到来,也从单个基因位点的 ...
- access2013数据库实验笔记_医学科研实验基础知识笔记(十):甲基化
往期回顾 医学科研实验基础知识笔记(一):细胞增殖 医学科研实验基础知识笔记(二):细胞凋亡检测 医学科研实验基础知识笔记(三):细胞周期检测 医学科研实验基础知识笔记(四):细胞自噬研究策略 医学科 ...
- 非链特异性转录组测序
非链特异性转录组测序 转录组(transcriptome)在广义上是指细胞内全部转录产物的集合,狭义上是指细胞中所有转录本(mRNA)的集合.转录组测序通常来说是指依托于高通量测序平台对细胞中的mRN ...
- 掌握三代全长转录组测序,看这一篇就够了!
"三代转录组"是什么?对于混迹在科研领域的一员,如果现在还不了解全长转录组测序,恐怕都不好意思说自己了解高通量测序了呢! 今天小编总结了一些三代全长转录组测序的相关问题,给大家来一 ...
- 机器学习——基础知识
机器学习--基础知识 机器学习 概述 机器学习(Machine Learning,ML) 是使用计算机来彰显数据背后的真实含义,它为了把无序的数据转换成有用的信息.是一门多领域交叉学科,涉及概率论.统 ...
- 易基因 | 学科前沿:转录组测序在原核生物研究中的应用(2)|文献科普
易点评 最近有研究表明,在多细胞真核生物的发育转录本中存在着系统发育和个体发育的相关性.同时,人们逐渐认识到多细胞行为是细菌生物膜形成的基础.然而,目前还不清楚细菌生物膜的生长是否与复杂真核生物的发育 ...
最新文章
- PNAS-2018-根系分泌物香豆素调控微生物群落结构并促进植物健康
- 帝国Cms批量上传多图morepic上传超过最大文件2m的限制的方法
- 用perl访问Oracle
- 从传统操作系统角度理解Hadoop YARN
- SQL语言学习(五)流程控制函数学习
- vim 环境变量 encoding、fileencoding、fileencodings 的作用
- Delphi程序自删除
- Hive文件数创建过多的问题
- JQuery判断元素是否存在
- 一个用于创建JSON接口的网站 http://myjson.com/api
- 阅读笔记——基于CART决策树的计算机网络课程学生成绩分析
- U盘安装fedora 9
- LaTex制作中文简历模板_PART 1
- LaTex 常用数学公式符号速记
- wordpress php格式,PHP_WordPress自定义时间显示格式,在帮King改他的私人情侣博客模 - phpStudy...
- 一组匹配手机号码的正则表达式
- 数电基本触发器(全)
- Python+Vue计算机毕业设计车辆年检系统的设计与实现u7cih(源码+程序+LW+部署)
- android mvvm官方demo,Android MVVM实战Demo完全解析
- 树莓派4b+mcp2515实现CAN总线通讯和系统编程(一.配置树莓派CAN总线接口)