阶段性汇报(5.1-5.10)

这段时间做了什么?

  • 安装ORBC mutation calling流程中的Dependencies。
  • 安装SClineagar包。

下一阶段计划:

  • 复现mutation calling的流程。
  • 使用SClineagar,复现谱系追踪的实验过程。

Step1:ORBC mutation calling流程所需的Dependencies

64位的Linux操作系统 java(version 1.8) python2,3 perl
bowtie2(>=2.3.4.3) BWA(>=0.7.15) STAR samtools(>=1.6)
lofreq_star(>=2.1.3) strelka(>=2.8.3) varscan speedseq
shimmer sambamba manta(>=1.4.0) annovar
一。64位liunx操作系统

由于之前分析用的Linux平台主要是虚拟机(以及实验室的liunx系统),内存受限。

于是选择在PC机上安装Linux双系统(70GB的磁盘空间)。

sudo lsb_release -a

No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 18.04.5 LTS
Release: 18.04
Codename: bionic

因为是最新的系统,所以需要重新配置环境。

二。Java的安装

java的解压
sudo tar -zxvf jdk-8u181-linux-x64.tar.gz -C /usr/lib/jvm

java的环境变量的配置
sudo vi ~/.bashrc

#set the jdk environment
export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_181
export JRE_HOME=JAVAHOME/jreexportCLASSPATH=.:{JAVA_HOME}/jre export CLASSPATH=.:JAVAH​OME/jreexportCLASSPATH=.:{JAVA_HOME}/lib:JREHOME/libexportPATH={JRE_HOME}/lib export PATH=JREH​OME/libexportPATH={JAVA_HOME}/bin:$PATH

source ~/.bashrc
保存环境变量的设置。
java -version

java version “1.8.0_181”
Java™ SE Runtime Environment (build 1.8.0_181-b13)
Java HotSpot™ 64-Bit Server VM (build 25.181-b13, mixed mode)

安装完成java(1.8.0)。

三。Python的安装

在任意路径下输入python出现指令。
python3 --version

Python 3.6.9

python --version

Python 2.7.17

系统中存在内置python,且两个版本都有。

但是后期用到的一些软件要求使用最新版本的Python(3.9),于是着手安装。

用关键词“python3.9安装教程 ubuntu”继续搜索,找到一篇教程,决定按照此步骤进行。
https://zhuanlan.zhihu.com/p/343237962

sudo apt install build-essential zlib1g-dev libncurses5-dev libgdbm-dev libnss3-dev libssl-dev libreadline-dev libffi-dev libsqlite3-dev wget libbz2-dev

切换到Downloads路径下,下载python9的源文件。
cd /home/zxx/Downloads/
sudo wget https://www.python.org/ftp/python/3.9.0/Python-3.9.0.tgz
安装包下载完成。

将压缩包(tgz)解压。
tar xzf Python-3.9.0.tgz

进入到解压后的文件夹下,对其进行编译。
cd Python-3.9.0/
sudo ./configure --enable-optimizations

然后,我们对其进行安装处理。
sudo make altinstall
安装需要一定的时间,我现在要检查的是我是否能够全局调用python指令,是否需要编辑环境变量。
把窗口关闭,查看是否安装成功:
python3.9 --version

Python 3.9.0

如图所示,安装成功。

四。安装conda(perl)

在官网下载与自己已经安装好的python对应版本的conda文件。
官网并没有与3.6对应版本的conda,虽然有2.7对应的conda,但是对应的是32bit,所以最终我选择最合适的版本,即3.9对应版本的conda。
下载链接:https://repo.anaconda.com/miniconda/Miniconda3-py39_4.9.2-Linux-x86_64.sh

下载之后,我暂时保存到Downloads文件夹下。

然后运行.sh文件,使用bash指令。

bash Miniconda3-py39_4.9.2-Linux-x86_64.sh

文件自动编译,期间只需要手动输入enter/yes来继续执行。
执行完成之后,会在home文件夹下自动生成miniconda3这个文件夹。
接着,我们配置conda的环境变量。
同样的方法。
sudo vi ~/.bashrc
在文件末尾追加:

export PATH=/home/zxx/miniconda3:$PATH

保存编辑好的文件。
source ~/.bashrc

接着,在任意路径敲入conda,查看是否安装完成。
conda --version

conda 4.9.2

如上,conda安装完成。

参考链接:https://www.jianshu.com/p/fab0068a32b4

由于在安装conda的时候,把所依赖的一些环境已经全部安装好了。

其中,包括perl的一些组件。

五。bowtie2

我首先使用conda进行安装,但是最后出现了与samtools相似的问题。

Collecting package metadata (current_repodata.json): failed
CondaHTTPError: HTTP 000 CONNECTION FAILED for url https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/linux-64/current_repodata.json
Elapsed: -
An HTTP error occurred when trying to retrieve this URL.
HTTP errors are often intermittent, and a simple retry will get you on your way.
‘https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/linux-64’

于是,直接下载软件包安装。
https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.4.2/
从列表中选择适用于linux系统的软件包(linux-x86_64)。
解压。
unzip bowtie2-2.4.2-linux-x86_64.zip
配置环境变量。
sudo vi ~/.bashrc
在文件中添加bowite2的系统安装路径:

export PATH="/home/zxx/workplace/bowtie2:$PATH"

保存。
source ~/.bashrc

在任意路径下输入bowite2 --version

屏幕显示:

/home/zxx/workplace/bowtie2/bowtie2-align-s version 2.4.2
64-bit
Built on fcc614744c04
Tue Oct 6 03:06:29 UTC 2020
Compiler: gcc version 8.3.1 20190311 (Red Hat 8.3.1-3) (GCC)
Options: -O3 -msse2 -funroll-loops -g3 -g -O2 -fvisibility=hidden -I/hbb_exe_gc_hardened/include -ffunction-sections -fdata-sections -fstack-protector -D_FORTIFY_SOURCE=2 -fPIE -DPOPCNT_CAPABILITY -DWITH_TBB -std=c++11 -DNO_SPINLOCK -DWITH_QUEUELOCK=1
Sizeof {int, long, long long, void*, size_t, off_t}: {4, 8, 8, 8, 8, 8}

安装成功。

六。BWA/STAR
  • BWA(比对基因组)
    官网简介:http://bio-bwa.sourceforge.net/

BWA 是一种将测序产生的小片段比对到参考基因组上的一种软件。它由三个算法所组成BWA-backtrack, BWA-SW and BWA-MEM. BWA-backtrack设计用来比对长度小于100bp的reads,剩余的两个则用以比对更长的序列,长度从70bp到1Mbp。BWA-MEM和BWA-SW拥有相似的特征,如支持长片段比对,剪接序列的比对,但是,BWA-MEM是广为推荐的,由于其比对的快速与准确,其也比BWA-backtrack在比对长度在70-100bp的片段上有更高的表现。

一句话总结:首选BWA-MEM。

下载地址:https://sourceforge.net/projects/bio-bwa/files/
版本:0.7.17
下载之后,直接解压到指定的工作目录下即可。
因为是以tar.bz2结尾的文件,所以使用tar -xjf指令。
tar -xjf bwa-0.7.17.tar.bz2
解压之后,进入解压后的文件夹,对其进行安装。
cd bwa-0.7.17
make
安装完成。
重命名文件夹bwa-0.7.17为bwa。
配置环境变量。
sudo vi ~/.bashrc
在文件中添加bowite2的系统安装路径:

export PATH="/home/zxx/workplace/bwa:$PATH"
保存。
source ~/.bashrc

在任意路径下输入bwa
得到屏显:

Program: bwa (alignment via Burrows-Wheeler transformation)
Version: 0.7.17-r1188
Contact: Heng Li lh3@sanger.ac.uk
Usage: bwa [options]
Command: index index sequences in the FASTA format
mem BWA-MEM algorithm
fastmap identify super-maximal exact matches
pemerge merge overlapping paired ends (EXPERIMENTAL)
aln gapped/ungapped alignment
samse generate alignment (single ended)
sampe generate alignment (paired ended)
bwasw BWA-SW for long queries
shm manage indices in shared memory
fa2pac convert FASTA to PAC format
pac2bwt generate BWT from PAC
pac2bwtgen alternative algorithm for generating BWT
bwtupdate update .bwt to the new format
bwt2sa generate SA from BWT and Occ
Note: To use BWA, you need to first index the genome with bwa index'. There are three alignment algorithms in BWA:mem’, bwasw', andaln/samse/sampe’. If you are not sure which to use, try bwa mem' first. Pleaseman ./bwa.1’ for the manual.
……
安装完成。
参考链接:https://github.com/lh3/bwa

  • STAR(比对转录组)

下载source包。
https://github.com/alexdobin/STAR/archive/refs/tags/2.7.9a.tar.gz
解压到指定文件夹下。
tar -zxvf STAR-2.7.9a.tar.gz
cd STAR_2.7.9a
cd source
make STAR

同样的,配置环境变量。
STAR指令在bin文件夹下的Linux_x86_64内。
sudo vi ~/.bashrc

export PATH=/home/zxx/workplace/STAR/bin/Linux_x86_64:$PATH

保存。
source ~/.bashrc
最后,同样的,在任意的路径下输入指令STAR(注意大小写)。
屏幕显示为:

Usage: STAR [options]… --genomeDir /path/to/genome/index/ --readFilesIn R1.fq R2.fq
Spliced Transcripts Alignment to a Reference © Alexander Dobin, 2009-2020
STAR version=2.7.9a
STAR compilation time,server,dir=2021-05-04T09:43:56-0400 vega:/home/dobin/data/STAR/STARcode/STAR.master/source
For more details see:
https://github.com/alexdobin/STAR
https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf
To list all parameters, run STAR --help

安装完成。

七。samtools

由于canda直接安装samtools执行失败,本次选择手动编译安装最新版的samtools。

1。下载samtools安装包。

官网下载链接:https://github.com/samtools/samtools/releases/tag/1.12
点击蓝色字体链接,下载tar.bz2格式的文件,源文件并不是很全。
下载完成之后,将其保存在指定目录下,打开目录。
解压缩文件夹。
tar -jxvf samtools-1.12.tar.bz2
cd samtools-1.12/

执行configure这一步的时候报错。
./configure

configure: error: ./configure failed for htslib-1.12

缺少hislib-1.12这个文件,需要事先安装。

2。 安装hislib。

git clone https://github.com/samtools/htslib.git
autoheader
autoconf
./configure

执行到编译的那一步的时候,又是报错。

liblzma development files not found

于是,现在着手安装liblzma。

找到链接:https://www.cnblogs.com/liujiaxin2018/p/13691805.html
但是,在ubuntu系统上yim指令是没啥用的,没啥用。

现在尝试apt-get安装。
参考链接:https://www.liangzl.com/get-article-detail-188600.html

sudo apt-get install liblzma-dev
这一步运行成功,没有报错。
make
sudo make install

不知道现在算不算是把hislib安装完成。

3。编译samtools。

安装好上述的hislib文件之后,回到samtools的文件夹下,继续编译。
依次运行以下指令,没有报错。
./configure
make
sudo make install

make/make install 指令在linux中的区别是什么?感觉很像?

注释:

  • make:make 是 Linux 开发套件里面自动化编译的一个控制程序,他通过借助 Makefile 里面编写的编译规范进行自动化的调用 gcc 、ld 以及运行某些需要的程序进行编译的程序。
  • make install:进行安装的指令,需要root权限(即 sudo make install)。

参考链接:https://github.com/samtools/samtools/blob/develop/INSTALL

在任意路径下输入指令,查看是否出现samtools的指令。
samtools

屏幕显示如下:

Program: samtools (Tools for alignments in the SAM format)
Version: 1.12 (using htslib 1.12)

Usage: samtools [options]

Commands:
– Indexing
dict create a sequence dictionary file
faidx index/extract FASTA
fqidx index/extract FASTQ
index index alignment

– Editing
calmd recalculate MD/NM tags and ‘=’ bases
fixmate fix mate information
reheader replace BAM header
targetcut cut fosmid regions (for fosmid pool only)
addreplacerg adds or replaces RG tags
markdup mark duplicates
ampliconclip clip oligos from the end of reads

– File operations
collate shuffle and group alignments by name
cat concatenate BAMs
merge merge sorted alignments
mpileup multi-way pileup
sort sort alignment file
split splits a file by read group
quickcheck quickly check if SAM/BAM/CRAM file appears intact
fastq converts a BAM to a FASTQ
fasta converts a BAM to a FASTA

– Statistics
bedcov read depth per BED region
coverage alignment depth and percent coverage
depth compute the depth
flagstat simple stats
idxstats BAM index stats
phase phase heterozygotes
stats generate stats (former bamcheck)
ampliconstats generate amplicon specific stats

– Viewing
flags explain BAM flags
tview text alignment viewer
view SAM<->BAM<->CRAM conversion
depad convert padded BAM to unpadded BAM

– Misc
help [cmd] display this help message or help for [cmd]
version detailed version information

安装成功。

八。Picard安装

参考链接:https://github.com/broadinstitute/picard
要求:必须事先有1.8.x版本的java

1。下载Picard。

git clone https://github.com/broadinstitute/picard.git
cd picard/

2。编译。

./gradlew shadowJar

Starting a Gradle Daemon, 1 incompatible Daemon could not be reused, use --status for details
Task :compileJava
Note: Some input files use or override a deprecated API.
Note: Recompile with -Xlint:deprecation for details.
Note: Some input files use unchecked or unsafe operations.
Note: Recompile with -Xlint:unchecked for details.
BUILD SUCCESSFUL in 5m 10s
4 actionable tasks: 4 executed

3。检验是否安装成功。

java -jar build/libs/picard.jar

USAGE: PicardCommandLine [-h]
Available Programs:

Base Calling: Tools that process sequencing machine data, e.g. Illumina base calls, and detect sequencing level attributes, e.g. adapters
CheckIlluminaDirectory Asserts the validity for specified Illumina basecalling data.
CollectIlluminaBasecallingMetrics Collects Illumina Basecalling metrics for a sequencing run.
……
安装成功。

九。GATK toolkit安装(Mutect)

GATK主要支持在linux平台/MacOS平台,window平台并不支持。

因此下面的操作都在linux平台运行。

参考链接:https://gatk.broadinstitute.org/hc/en-us/articles/360036194592-Getting-started-with-GATK4

1.下载GTAK并解压。

下载GATK的安装包。

参考链接:https://software.broadinstitute.org/gatk/

注意解压指令是unzip。
unzip gatk-4.2.0.0.zip -d /home/zxx/workplace/

2. 配置GATK的环境变量。

编辑环境变量
sudo vi ~/.bashrc

export PATH=/home/zxx/workplace/gatk:$PATH

保存环境变量的设置
source ~/.bashrc

3. 检验是否安装完成。

在命令行那边输入:

gatk

Usage template for all tools (uses --spark-runner LOCAL when used with a Spark tool)
gatk AnyTool toolArgs

Usage template for Spark tools (will NOT work on non-Spark tools)
gatk SparkTool toolArgs [ – --spark-runner <LOCAL | SPARK | GCS> sparkArgs ]

Getting help
gatk --list Print the list of available tools

gatk Tool --help Print help on a particular tool

Configuration File Specification
–gatk-config-file PATH/TO/GATK/PROPERTIES/FILE

……

安装成功。

gatk -version

Using GATK jar /home/zxx/workplace/gatk/gatk-package-4.2.0.0-local.jar
Running:
java -Dsamjdk.use_async_io_read_samtools=false -Dsamjdk.use_async_io_write_samtools=true -Dsamjdk.use_async_io_write_tribble=false -Dsamjdk.compression_level=2 -jar /home/zxx/workplace/gatk/gatk-package-4.2.0.0-local.jar -version
The Genome Analysis Toolkit (GATK) v4.2.0.0
HTSJDK Version: 2.24.0
Picard Version: 2.25.0

十。lofreq

参考链接:http://csb5.github.io/lofreq/

这篇文章中有介绍若干安装lofreq的方法,其中使用conda安装则最为简单。

因此,本次使用conda进行Lofreq的安装。

参考链接:https://anaconda.org/bioconda/lofreq
conda install -c bioconda lofreq
安装过程非常顺利。

检验是否安装成功:
lofreq

屏幕显示:

Fast and sensitive inference of SNVs and indels
Usage: lofreq [options]
Main Commands:
call : Call variants
call-parallel : Call variants in parallel
somatic : Call somatic variants
Preprocessing Commands
viterbi : Viterbi realignment
indelqual : Insert indel qualities
alnqual : Insert base and indel alignment qualities
……

十一。Strelka

这次的安装比我想象中的要简单,只需要下载并解压即可运行。
参考链接:
安装:https://github.com/Illumina/strelka/blob/v2.9.x/docs/userGuide/quickStart.md
使用:https://github.com/Illumina/strelka/blob/v2.9.x/docs/userGuide/README.md
官网:https://github.com/Illumina/strelka

1。 安装。

下载安装包。
wget https://github.com/Illumina/strelka/releases/download/v2.9.2/strelka-2.9.2.centos6_x86_64.tar.bz2
解压。
tar xvjf strelka-2.9.2.centos6_x86_64.tar.bz2

2。使用。

直接使用,处理示例数据。
使用bash指令,运行bash文件。
bash strelka-2.9.2.centos6_x86_64/bin/runStrelkaSomaticWorkflowDemo.bash

**** Demo results dir: ./strelkaSomaticDemoAnalysis/results/variants
**** No differences between expected and computed results.
**** Demo/verification successfully completed

十二。Varscan

参考链接:http://varscan.sourceforge.net/#install-varscan
从官网中找到VarScan的安装方式。

首先,下载.jar文件。
下载链接:https://sourceforge.net/projects/varscan/files/
我选择,VarScan.v2.3.9.jar文件。
下载之后,在文件夹下,直接运行:
java -jar VarScan.v2.3.9.jar

屏幕显示:
VarScan v2.3

USAGE: java -jar VarScan.jar [COMMAND] [OPTIONS]

COMMANDS:
pileup2snp Identify SNPs from a pileup file
pileup2indel Identify indels a pileup file
pileup2cns Call consensus and variants from a pileup file
mpileup2snp Identify SNPs from an mpileup file
mpileup2indel Identify indels an mpileup file
mpileup2cns Call consensus and variants from an mpileup file
somatic Call germline/somatic variants from tumor-normal pileups

十三。speedseq

参考链接:https://github.com/hall-lab/speedseq

1。配置环境

下载安装包。
git clone --recursive https://github.com/hall-lab/speedseq
cd speedseq
make
报了一堆的错误。

猜想可能是由于一些依赖的包是缺乏的。
参考链接:https://github.com/hall-lab/speedseq/blob/master/example/example_speedseq_install.sh
尝试按照示例代码一点点敲入,但是出现了报错。
由于我的系统是ubuntu,所以我使用apt-get代替示例代码中的yum。
sudo apt-get install make automake cmake gcc gcc-c++ git ncurses-devel zlib-devel

Reading package lists… Done
Building dependency tree
Reading state information… Done
E: Unable to locate package gcc-c+
E: Couldn’t find any package by regex ‘gcc-c+’
E: Unable to locate package ncurses-devel
E: Unable to locate package zlib-devel

再去查找出现了什么问题,我发现是由于ubuntu系统的改变,因此导致包的名字改变。
参考链接:https://blog.csdn.net/wang__rongwei/article/details/54846759
于是,现在去查找新的包的名字,无异于大海捞针。我决定从make报错中查找,我缺了什么包。

make align
make[1]: Entering directory ‘/home/zxx/workplace/speedseq’
make -C src/bwa
make[2]: Entering directory ‘/home/zxx/workplace/speedseq/src/bwa’
make[2]: Nothing to be done for ‘all’.
make[2]: Leaving directory ‘/home/zxx/workplace/speedseq/src/bwa’
cp src/bwa/bwa bin
cp src/sambamba bin
make -C src/samblaster
make[2]: Entering directory ‘/home/zxx/workplace/speedseq/src/samblaster’
make[2]: Nothing to be done for ‘SAMBLASTER’.
make[2]: Leaving directory ‘/home/zxx/workplace/speedseq/src/samblaster’

从这里也找不到线索,说缺啥。尝试失败。
那就接下来一个个的来安装先决环境。
sudo apt-get install libX11-devel libXpm-devel libXft-devel libXext-devel

E: Unable to locate package libX11-devel
E: Unable to locate package libXpm-devel
E: Unable to locate package libXft-devel
E: Unable to locate package libXext-devel

参考链接:https://blog.csdn.net/helaisun/article/details/79257697
之所以找不到包,是由于系统的版本不同,包的名字在更新的过程中也会产生变化。所以我现在的目标就是根据关键词去找,这些包在我的系统中所对应的名字是什么。然后安装。
主要的步骤如下:
首先,确定我的系统的版本。
sudo lsb_release -a

No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 18.04.5 LTS
Release: 18.04
Codename: bionic

我的系统的版本是bionic。
我就在https://packages.ubuntu.com/网站中,根据关键词,搜查与我的系统相对应的包的名字。
得到结果。

原名 现名
libX11-devel libx11-dev
libXpm-devel libxpm-dev
libXft-devel libxft-dev
libXext-devel libxext-dev

上述包全部安装成功。

同理,继续安装其他依赖的包。
sudo apt-get install make automake cmake gcc gcc-c++ git ncurses-devel zlib-devel

E: Unable to locate package gcc-c+
E: Couldn’t find any package by regex ‘gcc-c+’
E: Unable to locate package ncurses-devel
E: Unable to locate package zlib-devel

原名 现名
gcc-c+ 暂无
ncurses-devel lib64ncurses5-dev
zlib-devel zlib1g-dev

sudo apt-get install make automake cmake gcc git lib64ncurses5-dev zlib1g-dev

安装成功!

sudo apt-get install python27 python27-devel python27-pip lapack lapack-devel blas blas-devel

E: Unable to locate package python27
E: Unable to locate package python27-devel
E: Unable to locate package python27-pip
E: Unable to locate package lapack
E: Unable to locate package lapack-devel
E: Unable to locate package blas
E: Unable to locate package blas-devel

原名 现名
python27 暂无
python27-devel 暂无
python27-pip 暂无
lapack liblapack3
lapack-devel liblapack-dev
blas 暂无
blas-devel 暂无

修改为:
sudo apt-get install liblapack3 liblapack-dev
安装成功!

2。安装root

下面开始安装root。
curl -OL ftp://root.cern.ch/root/root_v5.34.20.source.tar.gz

Command ‘curl’ not found, but can be installed with:
sudo apt install curl

所以接下来,看一下,curl是什么?

该命令设计用于在没有用户交互的情况下工作。
curl 是一个工具,用于传输来自服务器或者到服务器的数据。
可支持的协议有(DICT、FILE、FTP、FTPS、GOPHER、HTTP、HTTPS、IMAP、IMAPS、LDAP、LDAPS、POP3、POP3S、RTMP、RTSP、SCP、SFTP、SMTP、SMTPS、TELNET和TFTP)。
curl提供了大量有用的技巧,比如代理支持、用户身份验证、FTP上传、HTTP post、SSL连接、cookie、文件断点续传、Metalink等等。

下载curl指令。
sudo apt install curl

下载完成之后,重新运行指令。(12:02)
curl -OL ftp://root.cern.ch/root/root_v5.34.20.source.tar.gz

% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
0 0 0 0 0 0 0 0 --:–:-- 0:02:15 --:–:-- 0curl: (7) Failed to connect to root.cern.ch port 21: Connection timed out

再次报错,ftp地址打不开,现在决定手动下载。
我们回溯到网站https://github.com/hall-lab/speedseq
发现有显示ROOT的网址为https://root.cern.ch/
我们在网址中找到与我们ubuntu系统一致的文件。

我们在选择下载的安装包时,源文件或二进制文件的区别是什么?
参考链接:https://blog.csdn.net/tiao321/article/details/109492581

所以,本次我们选择源文件进行安装。

https://github.com/hall-lab/speedseq/blob/master/example/example_speedseq_install.sh
https://root.cern.ch/releases/release-62400/

使用git指令下载:
git clone https://github.com/root-project/root.git
的确下载成功了,但是再进行下一步编译的时候,又遇到问题。
./configure
显示ROOT是由cmake编译的。
于是就:cmake root
结果文件夹下出现了一堆的文件,并不是我们想要的结果。

于是,选择手动下载,安装,解压缩。

出错。

CMakeFiles/XROOTD.dir/build.make:111: recipe for target ‘XROOTD-prefix/src/XROOTD-stamp/XROOTD-build’ failed
make[2]: *** [XROOTD-prefix/src/XROOTD-stamp/XROOTD-build] Error 1
CMakeFiles/Makefile2:288: recipe for target ‘CMakeFiles/XROOTD.dir/all’ failed
make[1]: *** [CMakeFiles/XROOTD.dir/all] Error 2
Makefile:151: recipe for target ‘all’ failed
make: *** [all] Error 2

我发现root有其他的安装方式。https://root.cern/install/

我有个想法,如果我不使用源文件,而是使用依赖于系统但不需要编译的二进制文件,是否可以更加方便一些?

重新开始。

下载事先编译(跳过前面非常复杂的编译过程)好的二进制的文件。
(1)安装好依赖的包。
sudo apt-get install dpkg-dev cmake g++ gcc binutils libx11-dev libxpm-dev \ libxft-dev libxext-dev python libssl-dev
(2)下载对应版本的二进制文件。
链接:https://root.cern/download/root_v6.24.00.Linux-ubuntu18-x86_64-gcc7.5.tar.gz
(3)解压
tar -xzvf root_v6.24.00.Linux-ubuntu18-x86_64-gcc7.5.tar.gz
到这里,算是安装完成了root。
(4)将解压后的root文件存放到/usr/local
cd ..
sudo mv root /usr/local
(5)设置环境变量
echo "source /usr/local/root/bin/thisroot.sh" >> ~/.bashrc
source ~/.bashrc
(6)移除安装包
rm root_v5.34.20.source.tar.gz
(7)最后,检验是否安装成功。
在任意路径下输入root


| Welcome to ROOT 6.24/00 https://root.cern |
| © 1995-2021, The ROOT Team; conception: R. Brun, F. Rademakers |
| Built for linuxx8664gcc on Apr 14 2021, 14:33:50 |
| From tags/v6-24-00@v6-24-00 |
| With |
| Try ‘.help’, ‘.demo’, ‘.license’, ‘.credits’, ‘.quit’/’.q’ |

安装成功。

3。python2.7包

首先,安装pip,然后根据pip下载pysam,numpy,scipy三个包。

参考链接:https://blog.csdn.net/liumaolincycle/article/details/50547275

  • 下载setuptools

wget --no-check-certificate https://bootstrap.pypa.io/ez_setup.py
sudo python ez_setup.py --insecure

  • 下载pip安装包,解压
    参考链接:https://pypi.org/project/pip/#files
    tar -zxvf pip-21.1.1.tar.gz
  • 安装pip
    cd pip-21.1.1/
    sudo python setup.py install
  • pip安装完成之后,使用pip安装包pysam,numpy,scipy
    pip install pysam numpy scipy

Collecting numpy
Downloading numpy-1.20.2-cp39-cp39-manylinux2010_x86_64.whl (15.4 MB)
|████████████████████████████████| 15.4 MB 12.1 MB/s
Collecting pysam
Downloading pysam-0.16.0.1.tar.gz (3.6 MB)
|████████████████████████████████| 3.6 MB 11.0 MB/s
Collecting scipy
Downloading scipy-1.6.3-cp39-cp39-manylinux1_x86_64.whl (27.3 MB)
|████████████████████████████████| 27.3 MB 11.3 MB/s
Building wheels for collected packages: pysam
Building wheel for pysam (setup.py) … done
Created wheel for pysam: filename=pysam-0.16.0.1-cp39-cp39-linux_x86_64.whl size=2992268 sha256=aaa602cfe1592e65b556de3ae2b316b7047f873a85d4abadeba07dc0cb78aba4
Stored in directory: /home/zxx/.cache/pip/wheels/fb/96/5b/d62b12ccae437c41f0368bca424aa34b6d3f9fef4a38640edc
Successfully built pysam
Installing collected packages: numpy, scipy, pysam
Successfully installed numpy-1.20.2 pysam-0.16.0.1 scipy-1.6.3

安装完成。

4。加载Speedup

仍然莫名原因报错。

十四。shimmer

参考链接:
https://mybiosoftware.com/shimmer-detection-of-genetic-alterations-in-tumors-using-next-generation-sequence-data.html

https://research.nhgri.nih.gov/software/Shimmer/download.shtml

https://github.com/nhansen/Shimmer

1。搭建依赖环境

安装R语言以及statmod包。
因为之前已经安装了conda,所以只需要用conda安装即可,非常方便。但是,安装得到的R并不能更新到最新版。好在这个软件对于R的版本要求并不是很高。
conda R
R安装成功!

R version 3.6.1 (2019-07-05) – “Action of the Toes”
Copyright © 2019 The R Foundation for Statistical Computing
Platform: x86_64-conda_cos6-linux-gnu (64-bit)
R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type ‘license()’ or ‘licence()’ for distribution details.
Natural language support but running in an English locale
R is a collaborative project with many contributors.
Type ‘contributors()’ for more information and
‘citation()’ on how to cite R or R packages in publications.
Type ‘demo()’ for some demos, ‘help()’ for on-line help, or
‘help.start()’ for an HTML browser interface to help.
Type ‘q()’ to quit R.

在这个基础上,安装statmod包。
即,在R的环境中,输入install.packages(statmod)即可。

2。安装shimmer

perl Build.PL --install_base $HOME

Can’t locate Module/Build.pm in @INC (you may need to install the Module::Build module) (@INC contains: /etc/perl /usr/local/lib/x86_64-linux-gnu/perl/5.26.1 /usr/local/share/perl/5.26.1 /usr/lib/x86_64-linux-gnu/perl5/5.26 /usr/share/perl5 /usr/lib/x86_64-linux-gnu/perl/5.26 /usr/share/perl/5.26 /usr/local/lib/site_perl /usr/lib/x86_64-linux-gnu/perl-base) at Build.PL line 3.
BEGIN failed–compilation aborted at Build.PL line 3.

线索:you may need to install the Module::Build module
bing搜索引擎的检索效果要比百度搜索的精准度更高。

如何安装Build 这样一个模块?
找到这样一个页面:https://metacpan.org/pod/Module::Build
并且按照链接https://www.cpan.org/modules/INSTALL.html指示安装模块。
cpan App:cpanminus
sudo cpanm Module::Build
模块下载完成。

–> Working on Module::Build
Fetching http://www.cpan.org/authors/id/L/LE/LEONT/Module-Build-0.4231.tar.gz … OK
Configuring Module-Build-0.4231 … OK
Building and testing Module-Build-0.4231 … OK
Successfully installed Module-Build-0.4231
1 distribution installed

重新运行perl代码。
perl Build.PL --install_base $HOME
./Build
./Build test
./Build install
export PATH=$HOME/bin:$PATH
export PERL5LIB=$HOME/lib/perl5:$PERL5LIB

到这里,基本安装完成。
perl shimmer.pl

Usage: shimmer.pl <–region chr1:1000-2000> <–bedfile bed file of regions> <–ref reference fasta>
For more information, type “perldoc shimmer.pl”. at shimmer.pl line 49.

十五。Sambamba

下载链接:https://github.com/biod/sambamba/releases

下载版本号为Sambamba 0.8.0的linux压缩包(https://github.com/biod/sambamba/releases/download/v0.8.0/sambamba-0.8.0-linux-amd64-static.gz)。

我们下载的是编译后的文件,所以在使用的时候相对更简单。

下载之后,解压文件夹。
gunzip sambamba-0.8.0-linux-amd64-static.gz

注:只有解压指令用对,才对按tab键直接弹出文件名(在linux中不同的压缩包对应于不同的解压指令)。
解压出来就算一个命令文件。我们将其移动到我们的工作目录下(用户自定)的自命名的sambamba文件夹下。

对sambamba文件夹的用户操作范围进行修改。

chmod a+x sambamba

然后,配置环境变量。

sudo vi ~/.bashrc

export PATH=/home/zxx/workplace/sambamba:$PATH

source ~/.bashrc

环境变量配置完成之后,在命令文件所在的文件夹下,将其指令文件改名为sambamba。

mv sambamba-0.8.0-linux-amd64-static sambamba

在任意路径敲入指令sambamba

得到屏幕显示结果:

sambamba 0.8.0
by Artem Tarasov and Pjotr Prins © 2012-2020
LDC 1.10.0 / DMD v2.080.1 / LLVM6.0.1 / bootstrap LDC - the LLVM D compiler (0.17.4)

Usage: sambamba [command] [args…]

Available commands:
view view contents and convert from one format
to another (SAM/BAM/JSON/UNPACK)
index build index (BAI)
merge merge files (BAM)
sort sort file (BAM)
slice slice file (BAM using BED)
……

至此,sambamba软件安装完成。

安装参考链接:
(1)https://www.cnblogs.com/koujiaodahan/p/13670613.html

十六。Manta

参考链接:https://github.com/Illumina/manta
安装链接:https://github.com/Illumina/manta/blob/master/docs/userGuide/installation.md

1。安装前的环境配置

sudo apt-get update -qq
sudo apt-get install -qq bzip2 gcc g++ make python zlib1g-dev

2。下载并安装

下载链接:https://github.com/Illumina/manta/releases/download/v1.6.0/manta-1.6.0.release_src.tar.bz2
下载完成。
将其解压。
tar -xjf manta-1.6.0.release_src.tar.bz2
创建工作目录build,并进入bulid文件夹。
mkdir build && cd build
编译。
manta-1.6.0.release_src/configure --jobs=4 --prefix=/home/zxx/workplace/build
安装。
make -j4 install

3。运行示例代码,检验是否安装完成。

在路径下(manta/bin)运行代码:

python2 runMantaWorkflowDemo.py

注意:用python2去操作。manta不支持python3。

屏幕显示:

**** Completed demo workflow execution.
**** Starting comparison to expected results.
**** Expected results dir: ‘/home/zxx/workplace/manta/share/demo/manta/expectedResults’
**** Demo results dir: ‘MantaDemoAnalysis/results/variants’
**** No differences between expected and computed results.
**** Demo/verification successfully completed

在路径下也生成文件夹MantaDemoAnalysis。

十七。Annoar
1。安装包下载

https://www.openbioinformatics.org/annovar/annovar_download_form.php
在这个链接中下载软件,需要教育邮箱。
下载链接:http://www.openbioinformatics.org/annovar/download/0wgxR2rIVP/annovar.latest.tar.gz
下载完成之后,存放在workplace中
解压即可使用:

tar -zxvf annovar.latest.tar.gz

2。注释数据库下载

已有数据库查询链接:https://annovar.openbioinformatics.org/en/latest/user-guide/download/

以下六个数据库是完成谱系追踪必须要求的。

  • refGene(已经有了hg19_refGene.txt)

  • ljb26_all
    perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar ljb26_all humandb/

  • cosmic70
    perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar cosmic70 humandb/

  • esp6500siv2_all
    perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar esp6500siv2_all humandb/

  • exac03
    perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar exac03 humandb/

  • 1000g2015aug
    perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar 1000g2015aug humandb/

运行起来稍微有点慢。
……
非常慢,因为一个注释的数据库真的特别大(~200GB)。

NOTE: several whole-genome databases (cadd, cadd13, fathmm, dann, eigen, gerp++, etc.) are available for download after server migration in June 2019. Please do NOT download unless you absolutely need to use them in your whole genome analysis (note that each file is ~200GB in your local computer), since each download will cost me a few dollars now.

Step2:安装SClineagar包

参考链接:https://github.com/inmybrain/SClineager
参考安装步骤,在Rstudio安装R包。

install.packages("devtools")
devtools::install_github("inmybrain/SClineager", subdir = "SClineager")

**报错1:**载入了名字空间‘cli’ 2.3.0,但需要的是>= 2.4.0
简单理解一下报错语句的意思就是载入的cli包的版本是2.3.0,但是实际要求的包的版本是2.4.0。两者之间并不匹配,产生冲突,于是在运行的过程中报错。

那这个时候,我预想的解决方法就是,更新cli包。
install.packages("cli")
更新Rstudio之后,屏显为:

trying URL ‘https://cran.rstudio.com/bin/windows/contrib/4.0/cli_2.5.0.zip’
Content type ‘application/zip’ length 534646 bytes (522 KB)
downloaded 522 KB
package ‘cli’ successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\Administrator\AppData\Local\Temp\RtmpquFlAA\downloaded_packages

下载好之后,我想查看一下,目前包的版本。
library(cli)
sessionInfo()
在下面找到cli包的版本为:[1] cli_2.5.0
所以更新成功!
重新运行代码没有报类似的错误,问题解决。

报错2 Could not find tools necessary to compile a package/compilation failed for package

报错全文:
WARNING: Rtools is required to build R packages, but is not currently installed.
Please download and install Rtools 4.0 from https://cran.r-project.org/bin/windows/Rtools/.
Downloading GitHub repo inmybrain/SClineager@HEAD
WARNING: Rtools is required to build R packages, but is not currently installed.
Please download and install Rtools 4.0 from https://cran.r-project.org/bin/windows/Rtools/.
Error: Failed to install ‘SClineager’ from GitHub: Could not find tools necessary to compile a package
Call pkgbuild::check_build_tools(debug = TRUE) to diagnose the problem.
In addition: Warning messages:
1: In untar2(tarfile, files, list, exdir) :
skipping pax global extended headers
2: In untar2(tarfile, files, list, exdir) :
skipping pax global extended headers

我觉得报错的主要原因和Warning中描述的Rtools很有关。
提示中写,Rtools对于分析而言是必要的,但是目前尚未被安装。
我尝试安装Rtools。
检索如何安装Rtools :https://zhuanlan.zhihu.com/p/346947595
按照上述教程,进行下载安装。
writeLines('PATH="${RTOOLS40_HOME}\\usr\\bin;${PATH}"', con = "~/.Renviron")
Sys.which("make")

make
“”

在这时,我以为是顺利安装完成了,但是当我重新尝试安装包的时候,报错ERROR:compilation failed for package ‘SClineager’。

Downloading GitHub repo inmybrain/SClineager@HEAD
√ checking for file ‘C:\Users\Administrator\AppData\Local\Temp\RtmpOA2RdN\remotes200422673cfd\inmybrain-SClineager-c550f70\SClineager/DESCRIPTION’ …

  • preparing ‘SClineager’:
    √ checking DESCRIPTION meta-information …
  • cleaning src
  • checking for LF line-endings in source and make files and shell scripts (444ms)
  • checking for empty or unneeded directories
  • building ‘SClineager_1.30.tar.gz’
  • installing source package ‘SClineager’ …
    ** using staged installation
    ** libs
    *** arch - i386
    "c:/rtools40/mingw32/bin/“g++ -std=gnu++11 -I"C:/PROGRA1/R/R-401.4/include” -DNDEBUG -I’C:/Program Files/R/R-4.0.4/library/Rcpp/include’ -I’C:/Program Files/R/R-4.0.4/library/RcppArmadillo/include’ -fopenmp -O2 -Wall -mfpmath=sse -msse2 -mstackrealign -c Gibbs.cpp -o Gibbs.o
    sh: c:/rtools40/mingw32/bin/g++: No such file or directory
    make: *** [C:/PROGRA1/R/R-401.4/etc/i386/Makeconf:229: Gibbs.o] Error 127
    ERROR: compilation failed for package ‘SClineager’
  • removing ‘C:/Program Files/R/R-4.0.4/library/SClineager’
    Warning message:
    In i.p(…) :
    installation of package ‘C:/Users/ADMINI~1/AppData/Local/Temp/RtmpOA2RdN/file200467b4453c/SClineager_1.30.tar.gz’ had non-zero exit status

从报错中,我们可以看到,是找不到Rtools的路径,所以报错。

sh: c:/rtools40/mingw32/bin/g++: No such file or directory
make: *** [C:/PROGRA1/R/R-401.4/etc/i386/Makeconf:229: Gibbs.o] Error 127

复盘上一步,发现我的Rtools的make结果为空(见上方)。
所以,我想是我的Rtools的路径没有配置好,所以会导致编译错误。
参考链接https://stackoverflow.com/questions/37131083/install-package-on-windows-error-compilation-failed-for-package-cldr
有一处评论。

Have you installed RTools? Choose the right version, which belongs to your R version (it seems you use R 3.2)
From the 127 return code, it looks like you don’t have a C++ compiler installed on your path. Have you installed the latest Rtools for Windows? It will give you the C++ toolchain you need.

于是,现在着手去配置Rtools的路径(之前已经下载完成Rtools)。
参考链接:https://blog.csdn.net/qq_43209742/article/details/106901746
敲入指令后,重启Rstudio。
Sys.which("make")

make
“D:\rtools40\usr\bin\make.exe”

到这里算是配置完成。
重新敲入加载包的指令,查看屏显。
devtools::install_github("inmybrain/SClineager",subdir = "SClineager")
屏显全文:

Downloading GitHub repo inmybrain/SClineager@HEAD
√ checking for file ‘C:\Users\Administrator\AppData\Local\Temp\RtmpQFPHNI\remotes5384cc82ef9\inmybrain-SClineager-c550f70\SClineager/DESCRIPTION’ …

  • preparing ‘SClineager’:
    √ checking DESCRIPTION meta-information …
  • cleaning src
  • checking for LF line-endings in source and make files and shell scripts (448ms)
  • checking for empty or unneeded directories
  • building ‘SClineager_1.30.tar.gz’
  • installing source package ‘SClineager’ …
    ** using staged installation
    ……
  • DONE (SClineager)

加载一下包,看一下是否成功。
library(SClineager)
没有任何报错!Sclineager包安装成功!

实验记录 | 阶段性汇报1相关推荐

  1. 实验记录 | mutect问题详解:No tribble type was provided on the command line and the type of the file?

    出错详情: /home/xxzhang/workplace/software/java/jdk1.7.0_80/bin/java -Djava.io.tmpdir=./output_RNA/mutmp ...

  2. 【Oracle RAC+DG实验】Oracle RAC+ASM+DataGuard配置实验记录+常见问题

    [Oracle RAC+DG实验]Oracle RAC+ASM+DataGuard配置实验记录+常见问题 1.环境规划: ---RAC环境介绍(primary database)            ...

  3. pyflink shell on yarn在per-job cluster模式下的实验记录

     实验记录: ①启动hadoop ②$FLINK_HOME/bin/pyflink-shell.sh yarn  使用了Table API的PyFlink完整代码如下: import tempfile ...

  4. Flink的scala+python的shell模式实验记录汇总

    根据[1],FLINK的shell有以下一些运行模式 ################################下面是scala-shell########################### ...

  5. 【视觉项目】【day1】8.20号实验记录(初步使用模板匹配)

    目录 [day1]8.20号实验记录(初步使用模板匹配) 模板匹配 单张图的代码 利用多个模板去匹配多张图的代码 写代码过程中遇到的问题 [day1]8.20号实验记录(初步使用模板匹配) 模板匹配 ...

  6. 【视觉项目】【day3】8.22号实验记录(利用canny检测之后的来进行模板匹配)

    [day3]8.22号实验记录(几乎没干正事的一天,利用canny检测之后的来进行模板匹配) 今天没搞代码,主要是问研究生学长工业摄像头的接法的,学长也不知道,明天问问老师... 晚上搞了一下cann ...

  7. 【深度学习】【U-net】医学图像(血管)分割实验记录

    医学图像分割实验记录 U-net介绍 数据集 实验记录 实验1 实验2(fail) 实验3(fail) 实验4(fail) 实验5(fail) 实验6(fail) 本项目仅用于大创实验,使用pytor ...

  8. 【课程作业】EA-CNN演化卷积神经网络实验记录

    large scale evaluation net -- CNN 全连接实验记录 实验相关 实验记录 实验1 实验相关 可以参考这篇博客https://blog.csdn.net/qq_406908 ...

  9. 【深度学习】图像匹配Siamese网络实验记录

    图像匹配Siamese网络实验记录 Ⅰ. Siamese 网络介绍 Ⅱ. 数据集 AT&T 分拣行李匹配图像 Ⅲ. 实验记录 A. 模型1 1. 实验1 2. 实验2 3. 实验3 B. 模型 ...

最新文章

  1. 驳斥《沙盒用于数据防泄密是重大技术原理性失误》
  2. mesos-master启动失败,报错Failed to load unknown flag 'quorum.rpmsave'
  3. SpringMVC框架第一天
  4. This iPhone is running iOS 12.2(16E227),which may be supported by this version of Xcode
  5. css大会站点顶部的一个特效
  6. 破茧成蝶2——以产品为中心的设计革命
  7. 【MCM-2017】2017年数模美赛D题 - 特奖论文学习
  8. 读《别闹了,费曼先生》 时的几点想法
  9. 图片验证码获取及验证
  10. Java程序员的工资标准是多少
  11. 判断对错。在java的多态调用中,new的是哪一个类就是调用的哪个类的方法。
  12. 2013南大专业课试题答案
  13. 1024*1024像素的图片,文件大小多少?
  14. Arcgis for JS实现台风运动路径与影像范围的显示
  15. cocos creator 学习随笔 day03 节点和组件属性
  16. 虚拟机服务器磁盘扩容步骤,vmware ESXi 虚拟机扩容磁盘空间
  17. Python 重载向量加法运算符 +
  18. Ant学习笔记(Ant入门)
  19. 如何开张美国银行卡CitiBank
  20. 计算机网络基础教程实训总结,实训总结

热门文章

  1. php httponly_php设置cookie为HttpOnly防止XSS攻击
  2. MAC M1 安装 Vue CLI
  3. 【填坑】ESP32 bootloader初探(上)
  4. 老骥伏枥,志在千里:如何在40岁后继续做软件开发?
  5. vue 移动端头像裁剪_基于vue的移动端图片裁剪压缩处理
  6. 武汉理工大学计算机学院调剂,武汉理工大学计算机科学与技术学院2017年拟接收调剂研究生公告...
  7. 华为鸿蒙内测机,多款华为旗舰机获得新系统内测资格 鸿蒙系统也快来了
  8. 以管理员身份运行cmd
  9. 2022年新能源汽车焊接市场前景分析及研究报告
  10. 程序员必备的 “ 摸鱼神器 ” 来了 !