开源生信 R 教程

http://www.ehbio.com/Bioinfo_R_course/

1 思考题

2 R基础

2.1 R安装

2.2 Rstudio基础

2.2.1 Rstudio版本

2.2.2 Rstudio安装

2.2.3 Rstudio 使用

2.3 R基本语法

2.3.1 获取帮助文档,查看命令或函数的使用方法、事例或适用范围

2.3.2 R中的变量及其初始化

2.3.3 变量类型和转换

2.3.4 R中矩阵运算

2.3.5 R中矩阵筛选合并

2.3.6 str的应用

2.3.7 R的包管理

2.4 ggplot2绘图

2.4.1 数据格式转换和字符串处理

2.4.2 配色

2.4.3 pheatmap绘制热图

3 R plots

3.1 qplot绘制图形 (王绪宁)

3.2 热图绘制

3.2.1 生成测试数据

3.2.2 转换数据格式

3.2.3 分解绘图

3.2.4 图形存储

3.3 热图美化

3.3.1 对数转换

3.3.2 Z-score转换

3.3.3 抹去异常值

3.3.4 非线性颜色

3.3.5 调整行或列的顺序

3.4 热图绘制 - pheatmap

3.5 聚类热图如何按自己的意愿调整分支顺序?

3.5.1 数据示例

3.5.2 绘制一个聚类热图很简单

3.5.3 如何自定义分支顺序呢

3.5.4 人为指定顺序排序样品

3.5.5 按某个基因的表达由小到大排序

3.5.6 按某个基因的表达由大到小排序

3.5.7 按分支名字(样品名字)的字母顺序排序

3.5.8 梯子形排序:最小的分支在右侧

3.5.9 梯子形排序:最小的分支在左侧

3.5.10 按特征值排序

3.6 箱线图

3.6.1 一步步解析箱线图绘制

3.6.2 绘制单个基因 (A)的箱线图

3.6.3 长矩阵绘制箱线图

3.7 线图

3.7.1 单线图

3.7.2 多线图

3.7.3 横轴文本线图

3.8 散点图

3.8.1 横纵轴都为数字的散点图解析

3.8.2 横纵轴都为字符串的散点图展示

3.9 功能富集泡泡图

3.9.1 单样品分开绘制

3.9.2 多样品合并绘制

3.10 韦恩图

3.10.1 韦恩图三个圈

3.10.2 韦恩图五个圈

3.10.3 UpSetView展示

3.11 柱状图绘制

3.11.1 常规矩阵柱状图绘制

3.11.2 长矩阵分面绘制

3.12 图形支持中文字体

3.12.1 修改图形的字体

3.12.2 ggplot2支持中文字体输出PDF

3.12.3 系统可用字体

3.12.4 合并字体支持中英文

3.12.5 一个示例

3.13 PCA原理解析和图形绘制

3.13.1 主成分分析简介

3.13.2 主成分分析的意义

3.13.3 示例展示原始变量对样品的分类

3.13.4 PCA的实现原理

3.13.5 简单的PCA实现

3.13.6 PCA结果解释

3.13.7 PCA应用于测试数据

3.13.8 PCA注意事项

3.13.9 参考资料

3.14 生存分析

3.14.1 R做生存分析

3.15 一步作图的优势

3.16 不改脚本的热图绘制

3.16.1 箱线图 - 一步绘制

3.16.2 线图 - 一步绘制

3.16.3 一网打进散点图绘制

4 网络图

4.0.4 基本操作

4.0.5 miRNA-mRNA调控网络

4.0.6 不同的布局的调试和修改

5 图形排版

6 高通量数据中批次效应的鉴定和处理

6.1 什么是批次效应?

6.2 批次效应会有什么影响?

6.3 怎么确认数据有无受到批次效应影响

6.4 怎么避免批次效应呢?

6.5 如何在差异基因鉴定过程中移除批次效应

6.5.1 不考虑批次因素直接进行差异基因分析

6.5.2 考虑已知的批次因素进行差异基因分析

6.5.3 比较批次校正前后差异基因变化

6.6 批次效应未知时如何判断和在差异基因鉴定过程中移除批次效应

6.6.1 预测混杂因素(cofounding factors)并在差异基因分析中移除这些因素

6.6.2 预测可能存在的混杂因素

6.6.3 比较批次校正前、已知批次校正后和预测的批次校正后差异基因变化

6.6.4 直接校正表达矩阵

6.6.5 ComBat_seq直接校正Count matrix

6.6.6 怎么从FASTQ数据中获得测序设备和批次相关信息

6.6.7 如何合并人的表达数据和小鼠的表达数据?

6.6.8 质控中的GC含量和Overrepresented sequences

6.6.9 样品是否在某种属性中存在偏好性

6.6.10 为什么聚类结果不可靠

6.6.11 sampleFile文件的生成

7 易生信-数据可视化

7.1 加载需要的包

7.2 读入数据

7.2.1 Duplicate row names

7.2.2 行名唯一化处理

7.3 热图绘制

7.3.1 提取差异基因绘制热图

7.4 箱线图和统计比较

7.4.1 单基因箱线图

7.4.2 多基因箱线图 (combine)

7.4.3 多基因箱线图 (merge)

7.4.4 数据对数转换后绘制箱线图

7.4.5 用ggplot2实现ggpubr

7.4.6 配色

7.4.7 箱线图加统计分析

7.5 通路内基因的比较

7.5.1 密度图

7.6 ggstatsplot绘图和统计分析

7.6.1 散点图

7.6.2 相关性图

8 高颜值免费在线绘图(提供绘图源码)

8.1 高颜值免费在线绘图基础版视频

8.2 高颜值免费在线绘图进阶版视频

9 参考

开源生信 Linux Bash教程

http://www.ehbio.com/Bioinfo_Bash_course/

1 Linux初探,打开新世界的大门

1.1 Linux系统简介和目录理解

1.1.1 为什么要用Linux系统1.1.2 Linux系统无处不在1.1.3 免费的Linux系统来一套1.1.4 Linux系统登录-联系远方的她1.1.5 初识Linux系统 - 黑夜中的闪烁是你的落脚点1.1.6 我的电脑在哪?1.1.7 系统配置怎样?来看看256M硬盘的服务器1.1.8 看下目录下都有什么1.1.9 新建一个目录1.1.10 访问文件1.1.11 查看帮助,获取可用命令行参数1.1.12 小结1.1.13 做个小测试

1.2 Linux下文件操作

1.2.1 文件按行翻转和按列翻转1.2.2 新建文件的n种方式1.2.3 文件拷贝、移动、重命名、软链1.2.4 Linux下命令的一些突发事故1.2.5 了解和操作你的文件1.2.6 小结和练习

1.3 Linux终端常用快捷操作

1.4 Linux下的标准输入、输出、重定向、管道

1.5 Linux文件内容操作

1.5.1 命令组合生成文件1.5.2 文件排序原来有暗仓

1.6 Linux下的查找命令 - 文件哪里跑

1.6.1 命令/可执行程序查找 - 定位脚本的位置1.6.2 locate普通文件快速定位1.6.3 find让文件无处可逃 find按时间查找限制查找深度1.6.4 按文件内容查找 grep

1.7 一句话加速grep近30倍

1.7.1 获取单基因表达量1.7.2 那如果获取多个基因怎么操作呢?

1.8 监控程序的运行时间和资源占用

2 Linux下软件安装相关

2.1 文件属性和可执行属性

2.1.1 文件属性2.1.2 可执行属性

2.2 PATH和path,傻傻分不清

2.2.1 小事也不能忽略

2.3 软件安装的几种传统方式

2.3.1 系统包管理器安装2.3.2 下载二进制文件2.3.3 源码编译安装2.3.4 Python包的安装2.3.5 Anaconda的两个福利2.3.6 R和R包的安装2.3.7 Perl包的安装

2.4 Conda安装配置生物信息软件

2.4.1 Conda安装和配置2.4.2 Conda基本使用2.4.3 Conda的channel2.4.4 创建不同的软件运行环境2.4.5 移除某个conda环境2.4.6 Conda配置R2.4.7 Conda环境简化运行2.4.8 Conda环境备份2.4.9 Conda环境导出和导入2.4.10 Conda软件安装 core dump error/Segment fault/段错误 怎么办2.4.11 Conda为什么越来越慢?2.4.12 Conda是如何工作的2.4.13 Conda哪一步慢?2.4.14 如何提速Conda2.4.15 下载提速2.4.16 使用conda-pack直接从已经安装好的地方拷贝一份 (同一操作系统)

2.5 Docker安装

2.5.1 Docker能做什么2.5.2 Docker的几个基本概念2.5.3 安装和配置2.5.4 Docker用户权限2.5.5 Docker试用2.5.6 Docker系统基本操作2.5.7 使用Dockerfile自动构建镜像2.5.8 Docker的特征2.5.9 Docker使用注意

2.6 Makefile知识

2.6.1 参考

3 Linux神器

3.1 正则表达式替换文本随心所欲

3.2 awk-生信分析不可缺少

3.2.1 awk基本参数解释3.2.2 awk基本常见操作3.2.3 awk糅合操作 - 命令组合体现魅力

3.3 SED命令 - 文本替换舍我其谁

3.3.1 sed基本参数解释3.3.2 常见操作

3.4 VIM的使用

3.4.1 初识VIM3.4.2 VIM中使用正则表达式

3.5 有了这些,文件批量重命名还需要求助其它工具吗?

3.5.1 简单重命名rename演示3.5.2 复杂重命名假如已经有对应关系组合文件名,使用mv重命名使用rename会不会稍微简单一点?从原文件名获取对应关系基于paste

3.6 耗时很长的程序忘加nohup就运行了怎么办?

4 Bash 字符串处理

4.1 Bash特殊字符

4.2 Bash变量

4.3 Bash操作符

4.4 Shell中条件和test命令

4.5 Shell流控制

4.6 Shell函数

4.7 输入输出

4.8 命令行处理 命令行处理命令

4.9 进程和作业控制

4.10 寻找Cas9的同源基因并进行进化分析

4.11 如何获取目标基因的转录因子(上)——biomart下载基因和motif位置信息

4.11.1 文件准备4.11.2 什么是bed文件?4.11.3 BioMart数据下载

4.12 如何获取目标基因的转录因子(下)——Linux命令获取目标基因TF

4.12.1 基础回顾4.12.2 文件格式处理4.12.3 计算基因的启动子区4.12.4 取两文件的交集4.12.5 提取我们关注的基因4.12.6 重点总结

4.13 emboss的使用

4.14 使用samtools计算SNP

4.15 Bedtools使用

4.16 SRA toolkit使用

4.17 生信流程开发

4.18 数据同步和备份

4.18.1 原创拷贝scp4.18.2 镜像备份和增量同步 rsync4.18.3 增量备份,记录各个版本 rdiff-backup

5 生物信息中Linux命令练习

5.1 统计GTF文件中染色体数目?

5.2 统计GTF文件中基因数目?

5.3 计算GTF中外显子总长度?

5.4 计算GTF文件中基因所拥有的平均转录本数目

5.5 生成一个多行Fasta测试序列供后续运算 (也可使用我们前面提供的脚本生成)

5.6 test.fa中的序列全转成大写

5.7 计算多行FASTA文件test.fa中每条序列长度

5.8 多行FASTA转单行FASTA序列

5.9 取出单行FASTA文件中序列长度大于40的序列的名字

5.10 分别用awkgreptest.fa中提取给定ID对应的序列

5.11 利用AWK对基因表达数据进行标准化

5.12 写出3种写法,去掉上一题test.expr矩阵中的第一行?

5.13 分别用awksedtest.expr矩阵加上标题行?

5.14 给定一个BAM文件,怎么计算有多少基因组区域被测到了?平均测序深度是多少?

5.15 如何使用bedtools的其它工具或其它Linux命令实现bedtools jaccard子功能?

5.16 如何使用命令生成这次课程的目录

开源生信 Python教程

生信专用简明 Python 文字和视频教程

目录

  1. 背景介绍

    1. 编程开篇

    2. 为什么学习Python

    3. 如何安装Python

    4. 如何运行Python命令和脚本

    5. 使用什么编辑器写Python脚本

  2. Python程序事例

  3. Python基本语法

    1. 数值变量操作

    2. 字符串变量操作

    3. 列表操作

    4. 集合操作

    5. Range使用

    6. 字典操作

    7. 层级缩进

    8. 变量、数据结构、流程控制

  4. 输入输出

    1. 交互式输入输出

    2. 文件读写

  5. 实战练习(一)

    1. 背景知识

    2. 作业(一)

  6. 函数操作

    1. 函数操作

    2. 作业(二)

  7. 模块

  8. 命令行参数

    1. 命令行参数

    2. 作业(三)

  9. 更多Python内容

    1. 单语句块

    2. 列表综合,生成新列表的简化的for循环

    3. lambda, map, filer, reduce (保留节目)

    4. exec, eval (执行字符串python语句, 保留节目)

    5. 正则表达式

    6. Python画图

  10. Reference

文字版本开源 (链接在本文每一部分开头)

视频讲解优惠

点击阅读原文直达视频 http://bioinfo.ke.qq.com/

源码在:https://github.com/Tong-Chen

三大开源生信基础教程(bookdown编写,源码可作为模板)和视频课程相关推荐

  1. 三大开源生信基础教程和视频课程

    开源生信 R 教程 http://www.ehbio.com/Bioinfo_R_course/ 1 思考题 2 R基础 2.1 R安装 2.2 Rstudio基础 2.2.1 Rstudio版本 2 ...

  2. C++入门教程:大白话讲解,新手基础篇(附源码及详解、视频课程资料推荐)

    C++ Tutorial C++教程 前言 视频教程 文字教程 集成开发环境(IDE) 编译器 工作原理 学习指南 入门书籍 进阶书籍 算法.竞赛书籍 教程 标准构建 程序解释 第一个C++程序--& ...

  3. python飞机大战源码素材包_小甲鱼python基础教程飞机大战源码及素材

    原博文 2018-12-22 23:32 − 百度了半天小甲鱼python飞机大战的源码和素材,搜出一堆不知道是什么玩意儿的玩意儿. 最终还是自己对着视频一行行代码敲出来. 需要的同学点下面的链接自取 ...

  4. 简单实用的笑话段子小程序详细搭建教程(附源码),包含了视频、图片、段子三个模块

    首先上个图,看下线上效果 扫码查看线上案例 线上服务器搭建这类的,这里就不多说了,有需要的可以看我之前的文章   >> 最新版短视频去水印小程序安装详细教程(附免费源码和去水印解析接口), ...

  5. 最新二开抢单系统淘宝自动抢单源码安装教程

    最新二开抢单系统淘宝自动抢单源码安装教程 [2次开发版]2020最新五代分佣抢单系统唯品会京东淘宝自动抢单区块源码 新增理财宝收益分佣功能 五代分佣 新增用户提现手续费 2020年02月04日升级 新 ...

  6. 135k代驾安装教程+功能模块源码+前端源码

    简介: 135k代驾安装教程+功能模块源码+前端源码 网盘下载地址: http://kekewangLuo.net/pOYRFCVcFvC0 教程: 微信公众号配置: 登录服务号,注意:必须是服务号, ...

  7. 后台管理系统怎么实现操作日志原理_springboot角色权限后台管理系统脚手架实战开发教程包含完整源码...

    自从猿来入此发布实战开发教程以来,我们截至目前一共发布了22个Java实战项目开发教程,从最基础的Java控制台实战项目到数据库封装教程再到swing的单机项目教程.servlet的web实战教程.s ...

  8. Hyperledger Fabric Rest API服务开发教程【含源码】

    Hyperledger Fabric Rest API服务开发教程[含源码] Hyperledger Fabric 提供了软件开发包/SDK以帮助开发者访问fabric网络 和部署在网络上的链码,但是 ...

  9. 正点原子提供免费开源的的连接机智云平台开发教程和实例源码

    相信使用过云平台开发物联网产品的同学对国内领先的机智云平台都不陌生了.2017年6月,正点原子与机智云正式签订战略合作,推出机智云系列教程,所有正点原子的开发板都可以轻松连云了,几小时搞定远程控制. ...

最新文章

  1. 谋局科技创新:两院院士大会释放重要信号
  2. linux make链接.o文件,Linux操作系统至gcc编译器、makefile
  3. LeetCode-动态规划-198. 打家劫舍
  4. 程序员面试题精选100题(12)-从上往下遍历二元树[数据结构]
  5. python数据结构的列表_Python内置数据结构——列表list
  6. php atime,PHP DirectoryIterator getATime()用法及代码示例
  7. 重新深入理解零拷贝技术
  8. 在UnitTest中读取*.config文件的郁闷
  9. php自动抓取文章图片,从文章中提取图片,把图片保存到本地,自动提取缩略图...
  10. Reveal v4(8796) 使用
  11. Linux中的pipe(管道)与named pipe(FIFO 命名管道)
  12. Tensorflow使用教训:被tf.image.resize浪费的60天
  13. 新时代、新挑战、新机遇
  14. 如何成功移植cleanflight、INAV到keil开发环境
  15. 烂土豆 (ms16-075) 提权方法
  16. pvr.ccz文件转png方法
  17. CodeForces - 19E Fairy【二分图】【DFS】
  18. 计算机显卡怎样安装方法,电脑装机小知识,新手如何正确安装好独立显卡
  19. 谷歌浏览器检查元素时,开发者工具打开的很慢
  20. unity触发时播放音效

热门文章

  1. 第一次“2016第三届科学数据大会”新闻发布会在上海举行
  2. 【MySQL】命令行遇到 ‘> 而无法结束语句编辑的解决方案
  3. 【VBS】归纳 Visual Basic Script 内置函数
  4. 【Java】GUI界面切换的解决方案
  5. 《Python程序设计》——1.2 程序开发周期
  6. 2016年第12本:成功就靠专注一件事
  7. hibernate(3)对象关联映射
  8. 云虚拟主机和传统虚拟主机的区别?
  9. replace使用案例--替换空格
  10. 工作与生活平衡(2)运动也需要执行力