【佳学基因人工智能】RNA测序数据的信息分析——基因解码信息源的准备

人的基因信息解码策略

人的基因信息解码有两种策略,一是数据库比对策略,二是基因解码策略。数据库比对策略只能用数据库中记录过的案例。由于人的特殊性,常规的基因检测无法发现临床中遇到的病人,所以查找基因病的致病原因,基因解码策略要优与数据库比对的基因检测策略。RNAseq是基因解码策略中获取原始信息并进行后续的重要一步。

分析工具的选择

佳学基因出与培训基因检测公司的目的,将使用小鼠参考基因组的一小部分(染色体1)来演示如何使用R进行高通量测序数据的比对和计数。将测序数据映射到基因组是一项非常重要的任务,并且有许多不同的比对工具可用,例如bowtie,topHat、STAR和Rsubread。根据佳学基因基因信息分析中心的实际测定,Rsubread是唯一可以在R中运行的基因信息比对分析工具。大多数对齐工具都是在linux环境中运行的,并且计算量非常大。大多数比对任务需要比普通笔记本电脑更大的计算机,因此通常在类似linux的环境中的服务器上完成原始数据的读取和比对。在这里,佳学基因的生物信息培训学员只将从智能分析老师准备的小鼠泌乳数据集中的每个样本抽取1000个数据,学习过程将比对1号染色体。因为佳学基因的主要目的是为了让基因检测机构的技术人员可以尝试使用RStudio笔记本电脑方便的进行数据分析。
软件包的安装:
不能从R中直接安装:会出现下面的结果:
install.packages(“Rsubread”)
WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding:

https://cran.rstudio.com/bin/windows/Rtools/
将程序包安装入‘C:/Users/yunli/Documents/R/win-library/4.1’
(因为‘lib’没有被指定)
Warning in install.packages :
package ‘Rsubread’ is not available for this version of R

A version of this package for your version of R might be available elsewhere,
see the ideas at
https://cran.r-project.org/doc/manuals/r-patched/R-admin.html#Installing-packages

我们对Markdown

而应当运行如下代码:

if (!requireNamespace("BiocManager", quietly = TRUE))install.packages("BiocManager")BiocManager::install("Rsubread")

出现如下信息:
https://cran.rstudio.com/bin/windows/Rtools/
将程序包安装入‘C:/Users/yunli/Documents/R/win-library/4.1’
(因为‘lib’没有被指定)
trying URL ‘https://cran.rstudio.com/bin/windows/contrib/4.1/BiocManager_1.30.16.zip’
Content type ‘application/zip’ length 328795 bytes (321 KB)
downloaded 321 KB

package ‘BiocManager’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in
C:\Users\yunli\AppData\Local\Temp\Rtmpuaqk8c\downloaded_packages

要求更新部分功能

The downloaded binary packages are in
C:\Users\yunli\AppData\Local\Temp\Rtmpuaqk8c\downloaded_packages
Installation paths not writeable, unable to update packages
path: C:/Program Files/R/R-4.1.2/library
packages:
class, foreign, MASS, Matrix, nlme, nnet, spatial
Old packages: ‘broom’, ‘DBI’, ‘fansi’, ‘openssl’
Update all/some/none? [a/s/n]:

更新:键盘上敲入:a

有二进制版本的,但源代码版本是后来的:
binary source needs_compilation
fansi 0.5.0 1.0.0 TRUE

Binaries will be installed
trying URL ‘https://cran.rstudio.com/bin/windows/contrib/4.1/broom_0.7.11.zip’
Content type ‘application/zip’ length 1814717 bytes (1.7 MB)
downloaded 1.7 MB

trying URL ‘https://cran.rstudio.com/bin/windows/contrib/4.1/DBI_1.1.2.zip’
Content type ‘application/zip’ length 741837 bytes (724 KB)
downloaded 724 KB

trying URL ‘https://cran.rstudio.com/bin/windows/contrib/4.1/fansi_0.5.0.zip’
Content type ‘application/zip’ length 248710 bytes (242 KB)
downloaded 242 KB

trying URL ‘https://cran.rstudio.com/bin/windows/contrib/4.1/openssl_1.4.6.zip’
Content type ‘application/zip’ length 3987697 bytes (3.8 MB)
downloaded 3.8 MB

package ‘broom’ successfully unpacked and MD5 sums checked
package ‘DBI’ successfully unpacked and MD5 sums checked
package ‘fansi’ successfully unpacked and MD5 sums checked
package ‘openssl’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in
C:\Users\yunli\AppData\Local\Temp\Rtmpuaqk8c\downloaded_packages

软件包安装成功

检查是否可以正常调用Rsubread

library(Rsubread)

【佳学基因人工智能】RNA测序数据的信息分析——基因解码信息源的准备相关推荐

  1. 【R语言】Splatter,一个用于简单模拟单细胞RNA测序数据的R包

    Splatter是一个用于模拟单细胞RNA测序数据的R包,本文概述并介绍Splatter的功能 一.参数功能 名称 功能 说明 可以通过splatEstimate函数估计 备注 nGenes -> ...

  2. splatter包生成单细胞RNA测序数据

    Splatter是一个模拟单细胞RNA测序计数数据的软件包.它提供了一个简单的界面,用于创建可复制且文档充分的复杂模拟.可以从真实数据估计参数,并提供用于比较真实数据集和模拟数据集的函数. # if ...

  3. 生信论文分享:通过稳健矩阵分解对单细胞rna测序数据进行插值

    题目:scRMD: imputation for single cell RNA-seq data via robust matrix decomposition 出处:bioinformatics, ...

  4. 文献阅读 | 基于单细胞RNA测序数据的谱系追踪

    Overcoming Genetic Drop-outs in Variants-based Lineage Tracing from Single-cell RNA Sequencing Data ...

  5. linux分析测序数据,[转]如何分析测序结果

    测序结果的分析 测序都是从5'端进行的,正向和反向测序是指对DNA的两条互补链分别测序,通常两个方向测序结果经校读后完全一致才能认为得到可靠结果.生工测序结果一般都提供两个文档,一个是TEXT的序列文 ...

  6. 放射学中基于影像组学和人工智能预测癌症预后

    人工智能(AI)在医学影像诊断中的成功应用使得基于人工智能的癌症成像分析技术开始应用于解决其他更复杂的临床需求.从这个角度出发,我们讨论了基于人工智能利用影像图像解决临床问题的新挑战,如预测多种癌症的 ...

  7. 基于RNA测序技术的转录组从头拼接算法研究

    基于RNA测序技术的转录组从头拼接算法研究 摘要: 生物信息学主要研究分子生物学领域,而对于分子生物学领域,转录组的从头拼接又是其核心内容,即利用转录组的测序片段拼接出整个转录组中的所有表达的转录体. ...

  8. 青源 LIVE 预告 | McGill李岳Mila唐建团队新作:可迁移、可解释的单细胞RNA测序模型...

    单细胞转录组测序(scRNA-seq)是在单个细胞水平对mRNA进行高通量测序的一项新技术,解决了组织样本测序无法建模细胞异质性的问题.scRNA-seq及其衍生技术已经三次被Nature评为Meth ...

  9. 重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述)

    原文链接: https://www.embopress.org/doi/10.15252/msb.20188746 主编评语 这篇文章最好的地方不只在于推荐了工具,提供了一套分析流程,更在于详细介绍了 ...

最新文章

  1. TinyMCE 5 正式版发布,重磅更新!!!
  2. leetcode-11-盛最多水的容器
  3. CodeForces Goodbye 2017
  4. 微软发布.NET 5.0 RC1,未来将只有一个.NET
  5. hashmap存多少条数据_干货 | 面试官想问的HashMap,都在这一篇里面了!
  6. yum 安装mysql的位置_Yum安装MySQL以及相关目录路径和修改目录
  7. sql游标 while_用SQL Server中的排名函数替换SQL While循环和游标,以提高查询性能
  8. Java泛型、反射、集合、多线程
  9. Linux大棚版redis入门教程(推荐)
  10. linux ls-la/boot,CentOS系统启动/boot/vmlinuz修复(实验)
  11. 杭电OJ刷题指南(ACM)
  12. 【运筹学】分支定界法 ( 分支定界法相关概念 | 分支定界法求解整数规划步骤 | 分支定界理论分析 | 分支过程示例 )
  13. cad计算机绘图知识点,CAD制图入门初学知识点汇总
  14. kubernetes更换IP地址重新初始化master节点
  15. 无法使用资源管理器打开FTP,别被百度的结果坑了
  16. C语言程序设计第六次作业
  17. about-page
  18. Keepalived HAProxy应用
  19. png图片尺寸大小调整
  20. canvas 实现流星雨特效

热门文章

  1. 岭回归实现鲍鱼年龄预测 MATLAB实现
  2. 米家车载空气净化器拆解报告
  3. html清除浮动标签,页面布局的排列规则是什么?怎样清除浮动标签?
  4. 计算机网络 | 一文搞懂什么是TCP/IP协议
  5. matplotlib绘制蜡烛图
  6. NC 完工报检单 推单 产成品入库单 批次问题
  7. Istio - 集成ELK - HPE_INVALID_METHOD, lumberjack protocol error
  8. 手把手使用Python教你破解谷歌(Google)人机验证码—上篇
  9. vue-recaptcha 谷歌机器人验证
  10. CentOS7系统之间设置共享文件夹