生信技能树的转录组学习开班了, 第一个任务是安装软件, 于是我花了一个下午时间和Linux斗智斗勇。

系统准备

windows10: Unbuntu on windows10. 至于如何win10上开启Linux子系统,百度会有无数教程的。

建议搭配cmder,界面更好看,用的更开心。

但是直接在cmder里启动ubuntu不能使用方向键,需要做一些修改,即在cmder的setting的startup的command line添加%windir%\system32\bash.exe ~ -cur_console:p:n

软件准备(conda)

1.下载miniconda https://conda.io/miniconda.html Linux Python2.7cd src

wget https://repo.continuum.io/miniconda/Miniconda2-latest-Linux-x86_64.sh

bash Miniconda2-latest-Linux-x86_64.sh

根据提示,最后会安装到~/miniconda2下。

2.添加bioconda channel, 目前还没有国内源conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/

conda config --add channels bioconda

conda config --set show_channel_urls yes

3.用conda安装软件sratoolkit,fastqc,hisat2,samtools,htseq-count, 与网络有着密切的关系

查询可供安装的软件, https://bioconda.github.io/recipes.html#recipesconda create -n biostar sra-tools fastqc hisat2 samtools htseq

拓展: 了解conda的命令

注:conda只有一个问题,就是看网络条件,国内源似乎还在制作中。

R语言和Rstudio就看下面的讲解。

软件准备(麻烦的编译篇)

我的习惯:家目录下创建src文件夹,用于存放软件包

家目录下创建biosoft文件夹,用于安装软件

为了提高下载速度,我们需要替换/etc/apt/source.list中默认镜像源。方法参考自中国科学技术大学开源镜像站# 备份

cd /etc/apt/

sudo cp source.list source.list.bk

# 替换

sudo sed -i 's/http/https/g' sources.list

sudo sed -i 's/archive.ubuntu.com/mirrors.ustc.edu.cn/g' sources.list

sudo sed -i 's/security.ubuntu.com/mirrors.ustc.edu.cn/g' sources.list

# 更新

sudo apt-get update

sudo apt-get upgrade

选择合适的镜像站,让你的速度飞起来

sratookit

功能: 下载,操作,验证NCBI SRA中二代测序数据

网址:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software

步骤:cd src

wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.2-1/sratoolkit.2.8.2-1-ubuntu64.tar.gz

tar -zxvf sratoolkit.2.8.2-1-ubuntu64.tar.gz

mv sratoolkit.2.8.2-1-ubuntu64 ~/biosoft

# 加入环境变量

echo 'PATH=$PATH:~/biosoft/sratoolkit.2.8.2-1-ubuntu64/bin' >> ~/.bashrc

# 测试

prefetch -v

# 尝试下载,默认存放在家目录下的ncbi文件夹中

prefetch -c SRR390728

阅读官方文章进一步了解:如何开启ascp加速下载

vdb-config更改基本设置

fastqc

功能: 可视化展示二代测序数据质量

网站:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/

步骤:# 判断系统是否安装java

java -version

# 安装java, 请改成openjdk-9-jdk,下面的是错误演示

sudo apt install  openjdk-9-jre-headless

# 验证

java -version

# openjdk version "9-internal"

# OpenJDK Runtime Environment (build 9-internal+0-2016-04-14-195246.buildd.src)

# OpenJDK 64-Bit Server VM (build 9-internal+0-2016-04-14-195246.buildd.src, mixed mode)

# 安装fastqc

cd src

wget http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.5.zip

unzip fastqc_v0.11.5.zip

mv FastQC/ ~/biosoft/

cd ~/biosoft/FastQC/

chmod 770 fastqc

# 添加环境变量, 我用sed修改

sed -i '/^PATH/s/\(.*\)/\1:~\/biosoft\/FastQC\//' ~/.bashrc

source ~/.bashrc

fastqc -v

# FastQC v0.11.5

拓展:了解fastqc结果中各个图的含义

掌握如何从fastqc的结果中提取数据

学习sed的用法,http://dongweiming.github.io/sed_and_awk/

samtools

SAM: 存放高通量测序比对结果的标准格式

功能: Reading/writing/editing/indexing/viewing SAM/BAM/CRAM format

网站: http://samtools.sourceforge.net/

安装:cd src

#  prerequsite

## system requirement

sudo apt install autoconf libz-dev libbz2-dev liblzma-dev libssl-dev

### zlib2

wget http://zlib.net/zlib-1.2.11.tar.gz

tar -zxvf zlib-1.2.11.tar.gz && cd zlib-1.2.11 && make && sudo make install && cd .. && rm -rf zlib-1.2.11

### bzip2

wget http://bzip.org/1.0.6/bzip2-1.0.6.tar.gz

tar -zxvf bzip2-1.0.6.tar.gz && cd bzip2-1.0.6 && make && sudo make install && cd .. && rm -rf  bzip2-1.0.6

### curses

sudo apt-get install libncurses5-dev

### htslib

git clone https://github.com/samtools/htslib.git

cd htslib

autoreconf

# building samtools

git clone https://github.com/samtools/samtools.git

cd samtools

autoconf -Wno-syntax

./configure

make && make install prefix=$HOME/biosoft/samtools

## add PATH

sed  '/^PATH/s/\(.*\)/\1:~\/biosoft\/samtools\/bin/' .bashrc -i

source ~/.bashrc

samtools --help

顺便安装bcftoolscd src

git clone https://github.com/samtools/bcftools.git

make && make install prefix=$HOME/biosoft/bcftools

make clean

sed  '/^PATH/s/\(.*\)/\1:~\/biosoft\/bcftools\/bin/' .bashrc -i

source ~/.bashrce

bcftools -h

因为用的是github,所以以后更新就用下面命令cd htslib; git pull

cd ../bcftools; git pull

make clean

make

吐槽: 编译的时候需要安装好多前置包,真麻烦!

HISAT2

功能: 将测序结果比对到参考基因组上

网站: http://ccb.jhu.edu/software/hisat2/index.shtml

安装:cd src

wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.1.0-source.zip

unzip hisat2-2.1.0-source.zip

# 编译hisat2

cd hisat2-2.1.0

make

rm -f *.h *.cpp

cd ../

mv hisat2-2.1.0 ~/biosoft/hisat2

# add to PATH

sed  '/^PATH/s/\(.*\)/\1:~\/biosoft\/hisat2/' ~/.bashrc -i

source ~/.bashrc

# test

hisat2 -h

吐槽: 居然没有make install !!!

拓展:HISAT2支持--sra-acc ,也就是可以集成SRATOOLS的,但是需要安装额外包,可以看文章自己折腾。

HTSeq

功能: 根据比对结果统计基因count# prerequsites

sudo apt-get install python-pip

pip install --upgrade pip

sudo apt-get install build-essential python2.7-dev python-numpy python-matplotlib

## 验证, 保证无报错

python -V

## python

python

>>> import numpy

>>> import matplotlib

## install HTSeq

pip install htseq

## 验证

python

>>> import HTSeq

教程:http://www-huber.embl.de/users/anders/HTSeq/doc/tour.html#tour

推荐:推荐安装一个ipython,学习ipython如何使用

将软件包安装到当前用户目录下pip install --user xxx

R

Ubuntu 14.04的自带R版本跟不上时代的变化,然后自己编译的坑有太多,所以先用Linux处理数据,然后在Windows下分析数据。这样就很轻松了。一些需要编译的软件包,还可以用RTools。

R:https://cran.r-project.org/

Rstudio: https://www.rstudio.com/

二进制版本: R官方提供了Ubuntu最新版本更新方法,如下# 添加Secure APT

sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E084DAB9

# 添加deb到source.list

vi source.list

deb https://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu xenial/

deb https://mirrors.ustc.edu.cn/ubuntu/ xenial-backports main restricted universe

# 更新并安装

sudo apt-get update

sudo apt-get install r-base

# (optional)如果要自己编译R

sudo apt-get install r-base-dev

# 测试

which R

/usr/bin/R

安装之后建议修改一下R包镜像源,提高下载速度。vi ~/.Rprofile

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")

编译部分:新手阶段不要轻易尝试,如果你能顺利搞定,你的Linux能力已经过关了

如何处理./configure中出现的问题:configure: error: No F77 compiler foundsudo apt-get install gfortran

configure: error: —with-readline=yes (default) and headers/libs are not available# 其实可以--with-readlines=no, 但是还是把东西装了吧

install libreadline-dev

configure: error: —with-x=yes (default) and X11 headers/libs are not available# 因为是CLI模式,不需要GUI

./configure --with-x=no

configure: error: pcre >= 8.20 library and headers are requiredsudo apt-get install libpcre3 libpcre3-dev

注: 上面安装其他软件时用到的包,其实也有一部分是R所需要的,如果出错的话,也是谷歌+必应+百度一个一个解决。./configure --with-x=no --prefix=$HOME/biosoft/R3.4.1

最后配置成功后会出现如下结果:R is now configured for x86_64-pc-linux-gnu

Source directory:          .

Installation directory:    /usr/local

C compiler:                gcc  -g -O2

Fortran 77 compiler:       f95  -g -O2

Default C++ compiler:      g++   -g -O2

C++98 compiler:            g++  -g -O2

C++11 compiler:            g++ -std=gnu++11 -g -O2

C++14 compiler:            g++ -std=gnu++14 -g -O2

C++17 compiler:

Fortran 90/95 compiler:    gfortran -g -O2

Obj-C compiler:

Interfaces supported:

External libraries:        readline, curl

Additional capabilities:   NLS

Options enabled:           shared BLAS, R profiling

Capabilities skipped:      PNG, JPEG, TIFF, cairo, ICU

Options not enabled:       memory profiling

Recommended packages:      yes

configure: WARNING: you cannot build info or HTML versions of the R manuals

configure: WARNING: you cannot build PDF versions of the R manuals

configure: WARNING: you cannot build PDF versions of vignettes and help pages

这些警告无伤大雅,毕竟CLI看不了PDF。make

然后我发现一个错误error: jni.h: No such file or directory

原因是之前的openjdk-9-jre-headless无头, 不完整,所以需要重新安装一个完整的# 先卸载

sudo apt-get remove openjdk-9-jre-headless

# 后安装最完整java环境

sudo apt-get install openjdk-9-jdk

然后重新make && make install

我以为自己不会遇到问题了,结果installing doc ...

/usr/bin/install: 无法获取'NEWS.pdf' 的文件状态(stat): 没有那个文件或目录

/usr/bin/install: 无法获取'NEWS.pdf' 的文件状态(stat): 没有那个文件或目录

Makefile:121: recipe for target 'install-sources2' failed

MDZZ!本来就没有考虑到x11模块,不能搞pdf,你和我说报错!于是我默默去百度一下,给出的方法是忽略错误make install -i

谢天谢地,终于通过了!!!添加环境变量测试一下吧sed '/^PATH/s/\(.*\)/\1:~\/biosoft\/R-3\.4\.1\/bin\//' .bashrc -i

R

> .libPath()

[1] "/home/xzg/biosoft/R-3.4.1/lib/R/library"

# 安装Hadley大神的包压压惊

install.packages("tidyverse")

真麻烦!我要去Y叔的小密圈问下,看看他有没有其他更好的方法

一点经验

以后在Ubuntu安装软件之前,先保证如下被安装了。## build-essential

sudo apt-get install build-essential

## java

sudo apt install  openjdk-9-jdk

## 各种包

sudo apt install autoconf libz-dev libbz2-dev liblzma-dev libssl-dev

### zlib2

wget http://zlib.net/zlib-1.2.11.tar.gz

tar -zxvf zlib-1.2.11.tar.gz && cd zlib-1.2.11 && make && sudo make install && cd .. && rm -rf zlib-1.2.11

### bzip2

wget http://bzip.org/1.0.6/bzip2-1.0.6.tar.gz

tar -zxvf bzip2-1.0.6.tar.gz && cd bzip2-1.0.6 && make && sudo make install && cd .. && rm -rf  bzip2-1.0.6

### curses

sudo apt-get install libncurses5-devR编译需要的Java必须是完全体,所以必须是 openjdk-9-jdk,不然无限报错

make -i 可以忽略系统报错,继续走下去,很多时候一点小错是没有关系的

如果./configure --prefix=/path/to/where写错了,然后最后安装的地方错了, 不能简单的把软件包挪个位置就行了,至少要把目录内的R-3.4.1/bin/R和R-3.4.1/lib/R/bin/R的路径进行修改。

make得要好好学习,有些时候不能./configure && make && make install prefix=/path/to/where一套走下来,有点作者可能没有定义install

我们遇到的问题基本上无数前人已经填坑了,所以谷歌百度必应总能找到, 如果你想偷懒,那你可以加入我的小密圈,向我提问。

Linux yest2图形安装ftp,(伪)从零开始学转录组:软件安装相关推荐

  1. 从零开始学黑苹果-基础安装教程(10.11.6)

    [本文转载自]蒋古申 本文目录: 1. Hackintosh 简介与心得 2. U盘安装原版 OS X 10.11.6步骤 安装U盘的制作 Clover 引导安装 3. macOS 的安装 4. 驱动 ...

  2. 【Linux Mint 深度学习开发环境搭建】开发软件安装

    系列文章目录 第一章 Linux mint 深度学习开发环境搭建之Nvidia显卡相关软件安装 第二章 Linux mint 深度学习开发环境搭建之开发软件安装 第三章 Linux mint 深度学习 ...

  3. navicat怎么安装mysql数据库_【20170825】从零开始学SQL数据库 安装mysql与navicat,开始练习...

    封面已经说明一切.左边mysql确实很酷炫,时时刻刻感觉自己像个程序猿,但是还是右边的navicat美化过后的界面更友好一些. 网上关于如何安装这两个软件已经有很多教程了,我选择了一个比较新的,且非常 ...

  4. 【CyberSecurityLearning 29】Linux下命令帮助、压缩、vim、软件安装

    目录 linux初识 打开终端后的提示 先了解当前系统信息 硬盘大小 内存大小 cpu型号 关机和重启命令 Linux操作系统树状结构 安装VMtools 快捷键的应用 Linux系统中如何分辨文件类 ...

  5. 中华云盒M1刷Linux教程,N1 盒子刷最新版 armbian 及软件安装

    N1 盒子刷最新版 armbian 及软件安装 2019-12-22 16:02:10 79点赞 754收藏 71评论 写在前面 前段时间关注了#如何玩转NAS 后,玩性大发,各路值友们分享的好玩东西 ...

  6. 【Linux入门到精通系列讲解】Centos 7软件安装的三种方式

    centos 软件安装的三种方式 Linux下面安装软件的常见方法: 一.yum 替你下载软件 替你安装 替你解决依赖关系 点外卖 缺少的东西 外卖解决 1.方便 简单 2.没有办法深入修改 yum ...

  7. 浅谈Ubuntu 18.04.1 LTS x86_64安装,美化配置及常用软件安装配置的历程

    浅谈Ubuntu 18.04.1 LTS x86_64安装,美化及常用软件安装配置的历程 这几天入坑Ubuntu,本着双系统来的却不小心把Windows玩崩了.期间各种问题各种坑,查阅了很多文章来解决 ...

  8. 4广联达4代锁安装6.0_Aspen Plus 8.4 软件安装教程

    Aspen Plus 8.4 软件安装教程 01 Aspen Plus 8.4 软件安装教程 软件介绍 Aspen 提供最新资产性能管理.工程.制造和供应链软件版本.更好地提高产能,提高利润,降低成本 ...

  9. Ubuntu22.04安装、配置、美化、软件安装、配置开发环境

    一.Ubuntu.Windows11(10)双系统安装 因为ubuntu的安装网上的教程特别多了,所以这里不做赘述,推荐使用小破站这个up主的教程:Windows 和 Ubuntu 双系统从安装到卸载 ...

  10. 安装仅限于用于sharepoint_PDF DC2018软件安装教程

    软件简介: adobe reader dc是一款免费的PDF阅读器软件,它能够查看.打印和批注PDF文档,还可以打开各种PDF内容并且还能与之交互,其中包括表单和多媒体,功能也是免费版中比较强大且实用 ...

最新文章

  1. 转载 C#中使用结构来传递多个参数
  2. pythongui界面实例带注释_python GUI库图形界面开发之PyQt5状态栏控件QStatusBar详细使用方法实例...
  3. 【linux】tc命令使用总结
  4. 冯怡:我想给大家展示一种可能性(图灵访谈)
  5. 【用故事解读 MobX源码(一)】 autorun
  6. 利用FRIDA攻击Android应用程序(一)
  7. libsvm 训练后,模型参数详解
  8. 【ECharts学习】—实现我的第一个图表
  9. 在逍遥模拟器下安装XPOSED框架
  10. HTML点击头像修改页面,头像修改页.html
  11. tampermonkey这玩意如何替换flash播放器为h5播放器?
  12. 用友文件输出在服务器电脑,用友软件电脑怎么远程连接服务器
  13. 关于智能家居、360wifi、wifi开关,以及wifi芯片的选择
  14. 日常随笔——m1 macbook安装和配置qt
  15. 不知哪位仁兄有该软件,csdn好像不提供下载了哦
  16. PHP的一些常用算法
  17. 意法半导体 STM32F102C4 芯片解密 芯片特性
  18. 防火墙系列(二)-----防火墙的主要技术之包过滤技术,状态检测技术
  19. 淘宝开放平台API接口,接入方案如下
  20. zabbix监控-企业微信webhook告警并使用markdown格式

热门文章

  1. 在英特尔硬件上部署深度学习模型的无代码方法 关于OpenVINO深度学习工作台的三部分系列 第二部
  2. android 刷机原理,分区。
  3. ZUCC_计算机网络实验_实验01 实验一RJ45原理与制作
  4. 【VBA编程】Sub过程
  5. 选定目标和非功利性学习
  6. 用dw给html动态时间代码,dw中如何制作时间动态代码
  7. matlab fitctree 原理,电力窃漏电用户自动识别.PDF
  8. SaltStack常用模块之file
  9. 如何看待 AI 方向 PhD 申请竞争过于激烈的现象?
  10. python脚本名_python获取类名函数名、脚本路径