中科大瞿老师生物信息学复习参考:
复习资料及考题、A4纸链接:链接,点击进入https://download.csdn.net/download/qq_43337249/71503385?spm=1001.2014.3001.5503

1.QUIZ参考答案

2.整理的课题笔记

3.复习重点(整理)

比如:
(1)ATAC-SEQ 一定会考,技术原理,用了哪些酶,为什么能检测到开放位点 ,质控标准:3个
(2)又比如会判断哪个是Chip-seq的峰图

最后附上的是2020年的考题大概内容

以下是部分容易排版的内容:
QUIZ参考答案:

  1. Which gene is the most highly mutated gene in cancer?
    TP53
  2. Which gene is the most highly mutated gene inCOAD/READ?
    APC
  3. Name three alignment tools.
    Bowtie 2 Histat , Tophat BWA
  4. What is the method for SNP calling that we introduced in this class?
    .(BWA)-GATK
  5. Name three advantages of this method.
    做序列比对和SNP calling的算法中,表现优,现在成为金标。(1)灵敏度95% (2)特异度97% (3)准确度96%
    第四课:
  6. What is the main difference between DNA-seq and RNA-seq alignment?
    RNA-seq has junction reads
  7. What percentage of the genome is transcribed?
    90%(基因组中约 90% 的基因是转录基因。这些转录基因中只有 1-2% 编码蛋白质;大多数转录为 ncRNA。)
  8. Name three types of ncRNAs.
    tRNA、rRNA 、snRNA、piRNA、siRNA and lncRNA
  9. Name three RNA-seq alignment tools.
    bowtie tophat 2 、 HISAT 或 STAR
  10. What are the main functions of lncRNAs?

    第6课:
    第7课:

    复习资料:






    2020.12.29 第16周课 单细胞测序 2
    假时间轨迹:①monocle ②Velocyto ③Palantir (从1个时间点的数据模拟出成熟体系的过程)
    1.monocle(基于表达量expression) 时间树,进行降纬分析,建立发育路径,
    ·利用真实数据进行验证软件功能是可靠的。
    ·monocle2 预测肺部上皮细胞分化命运:(可以预测与发育分支密切相关的基因集)利用免疫刺激树突细胞分化的基因knockout进行验证(基因是已知的)。
    Go term分析:从基因集到基因集功能
    Monocle的pros和cons:

2.Velocyto(基于splicing)`
·mRNA成熟度:验证实验SCP细胞向chromaffin cells的分化过程
·小鼠海马区:(细胞分群,进行细胞图谱构建):不同的发育轨迹由不同的转录因子调控
Velocyto的pros和cons:
优点:①从RNA成熟度的角度出发预测发育的起点和终点;②对多分支路径的预测比较好;
缺点:①对测序质量有一定要求,最好是全长测 ②路径的预测是基于tSNE或者UMAP的降维结果,需要质量是较高的(细胞群的相连)
3.Palantir·基于熵增大原理:
发育潜能很大,但变化幅度(熵)是较小的,而分化后,发育潜能小,变化幅度熵是较大的。
适合于诸如研究胚胎细胞的分化 ·验证方法:早期人类造血干细胞
Palantir的pros和cons:
Pros: ①从发育可能性的熵值出发,估计发育起点和终点 ②仅需要表达量信息 (需要很多样本)
Cons:①对原本就高无序性的样本,如肿瘤可能不适用 ②路径的展示方法比较依赖于降维方法
假时间轨迹:算法横向比较
判断指标:①分叉树的结构的正确性②分叉支点的正确性(细胞是否位于正确的结点上)③分叉的顺序④分化过程中重要的基因
合成数据 进行评估

插值与降噪:①Magic ②Saver ③DCA ④WEDGE (原因:细胞分群的稀疏,只有5%-10%的数据能被捕捉)
单细胞数据分析中的科学问题:
①稀疏矩阵(采用插值与降噪 解决) ②调控关系 (scATAC-seq解决)
③RNA-蛋白表达差异(RNA被翻译的次数不同) ④空间转录组(采用整合分析 解决)发育过程的空间位置信息
整合分析及原因
插值与降噪
1.MAGIC(细胞与细胞之间的关联,构建关联矩阵,关联度很高的基因表达量相互为依据)
(依赖对于邻居cell的确定)
2.SAVER(深度学习模型,负二项分布,利用偏移的负二项分布 挪移以重新获取基因表达量)
(假设基因表达符合负二项分布,理论与实践是近似的)
3.DCA(使用深度学习回归表达量均值和离散度)
拟合分析
4.WEDGE(对表达量矩阵中的零元和非零元分别做不同权重的非负矩阵分解) qulab
非零元:基因表达量的确很低
零元:由于实验原因,噪音基因表达信息未get,进行非权重分解 进行分群质量恢复的提高
用途:发现精细细胞亚型() 细胞层次降维

单细胞ATAC-seq分析:
前边提到的SIMIR 也可以用于验证 表达基因片段的上游是否存在一些motif
scATAC-Seq技术的开发:由斯坦福大学Howard Chang 和Greenleaf实验室联合开发
科学问题:scATAC-seq数据过于稀疏(>95%丢失),细胞分群无法达到scATAC RNA-seq一样的精度
1.ChromVAR:group peaks by motifs
peak的开放位点上游的motif进行堆积富集
用途:①细胞分化 路径的确立(造血干细胞 HSC的分群)②细胞聚类clustering ③假时间轨迹:细胞发育路径
ChromVAR优缺点:
优点:①从motif/TF分析容易定义每个亚群的功能 ②可以发现细胞发育的路径
缺点:①分群效果较差(将motif进行堆积,忽略了很多信息)②使用的motif都(必须)是已知的 ③只考虑开放位点上游调控的关系(忽略了开放位点下游网络)
2.Cicero(group peak by genes)
认为基因的开放性(转录起始位点)周围与附近的峰认为也与之相关,能得到顺式开放型(下游网络)
Cicero的优缺点
优点:①揭示基因转录区域附近的调控因子 ②从DNA开放程度预测RNA表达量
缺点:①分群效果较差 ②仅考虑近端的调控因子 ③仅考虑下游调控关系
3.cisTopic:group peaks by topics
topic(影响开放位点差异型的组合)降纬,能够凝练成细胞和topic的矩阵 - 集群
ARI越高,细胞分群可信度越高 利用不同的表达topic(区分细胞亚群)
cisTopic优缺点: (一个topic可能包含了很多功能类型的细胞,因此)
优点:①细胞分群的效果较好 ②每个亚群的特征清晰
缺点:①每个特征(topic)的生物学功能比较模糊 ②每个topic内DNA开放片段之间的关联不清楚。
4.APEC:group peaks by pattern qulab
Peak的开放位点的Pattern - 细胞 和 pattern group 矩阵
缺点:有批次效应
用途:对单细胞数分群存在优势 构建单细胞发育路径(发育轨迹构建)

多组学整合:seurat novoSpaRc
1.seurat
Mutual 相互之间寻找neighbor 将不同 的数据整合在一起 用了cicero
空间转录组:将很少的scRNA RNA转录组信息 投影 到整体的空间转录组,在空间转录组得到更多的转录信息。
2.novoSpaRc
假设表达量模式相近的细胞在空间上也是相近的。


本文参考以下内容,引用:
https://blog.csdn.net/qq_43337249/article/details/121766883

中科大生物信息学复习资料推荐相关推荐

  1. 5y计算机应用选择题答案,2016年电大网考计算机应用基础统考试题模拟真题及答案 含小抄复习资料推荐.docx...

    2016年电大网考计算机应用基础统考试题模拟真题及答案 含小抄复习资料推荐 电大计算机应用基础1一.单选题1.第一台电子计算机是1946年在美国研制成功的,该机的英文缩写名是______.答案: A ...

  2. 如何选择考研数学资料?最全考研数学复习资料推荐

    不是吧?都2023年了,还在实体店买书呢? 读初高中的时候可能大多都是逛书店.在书店买复习资料,但考研不一样,毕竟受众比较有限,书店里卖的资料也比较有限,倒不如挑好需要的书以后打开淘宝,要啥有啥. 如 ...

  3. gre复习资料推荐整理

    想要参加新G考试,首先要准备新GRE备考书籍,然后我们才能展开以后的复习计划.市面上花花绿绿的各种参考书目,究竟哪一本才是最权威.最适合自己的呢?以下是小编为大家介绍的几本比较好的新GRE备考书籍. ...

  4. 【2021年】中科大研究生-考试题、复习资料汇总(往年真题+复习资料)

    前言 这里主要针对中科大(中国科学技术大学)研究生期末考,列表里的资料来自对往年的整理及平时的笔记,有些资料来自老师的答疑,同时参考了3个人的笔记(包括考试题的记录)因此内容还是比较全面的,因为需要排 ...

  5. 英语听力采用计算机化考试,高考英语复习资料及听力机考特点与应对建议

    高考英语听力机考特点与应对建议 北京市西城研修学院研修员 闫雪梅 2018年北京市高考英语听力将首次采用计算机化考试,与统考笔试分离.英语听力一年两次考试,取听力最高成绩与笔试成绩一同组成英语科目成绩 ...

  6. 湖科大 2022大三上 软件工程复习资料

    前言 湖科大 2022大三上 软件工程复习资料 推荐参考 ffj笔记 主要内容来源于老师画的重点和ppt:由于ppt知识点不详细,部分内容参考了<软件设计师教程> 由于老师划重点不详细,笔 ...

  7. 软件设计师の备考经验帖及复习资料

    文章目录 Laptoy祝大家逢考必过 9月1号备考-11月05号考试 复习资料 推荐up主:[zst_2001](https://space.bilibili.com/91286799) 跟着视频来基 ...

  8. 考研英语二81分复习经验分享|资料推荐|复习方法|复习规划

    关注学长公众号 计算机考研帮帮帮(cskaoyan666) 获取 复试资料, 面试问题等珍贵资料哦 视频地址 https://www.bilibili.com/video/BV1s54118772 视 ...

  9. [渝粤教育] 西南科技大学 管理学原理 在线考试复习资料(5)

    管理学原理--在线考试复习资料 一.单选题 1.通常所说的"小道消息"属于: A.双向沟通 B.口头沟通 C.非正式沟通 D.用含蓄的形式进行沟通 2.古人云:"运筹于帷 ...

最新文章

  1. 生成,保存和转换pcd点云文件
  2. linux线程下的读写锁
  3. LaTeX 的对参考文献的处理
  4. 分布式文件系统FastDFS架构剖析
  5. vscode怎样导入数据_【Python开发】用VSCode+Jupyter notebook 编写 Python
  6. 算法训练营 重编码_编码训练营后十四天如何找到工作
  7. Threejs初级教程
  8. java是如何调用native方法?hotspot源码分析必会技能
  9. 单片机技术与c语言编程教学大纲,单片机原理及应用课程教学大纲
  10. 【转】小谈PNG转SVG的方法 在线转换网站与illustrator
  11. python Only timezones from the pytz library are supported
  12. Matlab 曲线拟合之polyfit与polyval函数
  13. 年终报告:通过3个维度,回看2022全球电商市场的“多样性”
  14. 本地缓存与分布式缓存
  15. 基金收益率计算1:资管业务、资管产品和基金
  16. 无法显示计算机列表,W7系统Internet Explorer无法显示该页面
  17. STP/RSTP协议(二)
  18. 半年经验Java面试准备
  19. 巴法络nas硬盘挂linux,教你轻松DIY——巴法络家用NAS使用详解
  20. TPS和事务响应时间的关系、计算公式

热门文章

  1. Linux上安装Oracle11g
  2. Nginx的正向代理和反向代理
  3. R语言空间数据分析学习笔记1——读取矢量数据并可视化
  4. 程序员们也需要提高文学修养,整理得到十分优美的古诗词,程序员也应该有的精神世界,拿去装吧
  5. cpress Psoc4BLE 处理器及外设介绍
  6. 一个小玩具:Python调用Mysql
  7. 什么是钩子(Hook)
  8. Eclipse下open iExplorer插件安装
  9. ubuntu18 升级 gitlab
  10. 【转】怎样将APP或PXL转为IPA格式