1 Conda安装

1.1 Conda介绍

Conda是一种开源的软件包和环境管理软件,用于安装和转换不同版本的软件包及环境。其专为Python设计,可用于Mac、Linux和Windows系统。

Conda有两个主要的版本,Anaconda和Miniconda,前者包含一些常用软件包,后者是精简版,根据需要安装软件包。考虑到用于生信工作一些常用包反而可能并不常用,我个人建议下载精简版。而实际上也确实如此,在下载Anaconda之后,其默认环境中的包对我目前的代码运行明显不足。

Miniconda下载地址:https://conda.io/miniconda.html

1.2 Conda下载与安装

选择最新的Windows64位版本的Miniconda进行下载和安装,并完成注册。过程无注意事项。

2 软件安装

2.1 以Python环境进行测试

在功能上,Conda可以提供不同版本的python环境,因此可以取代单独下载安装的Python环境,辅以PyCharm等IDE即可。

Conda闪退,无法打开,怀疑与本电脑已安装的Python3.9有关。(实际上是conda.exe并非打开conda的正确方式,将在第三部分解释)

在系统环境变量中找到对应之前安装Python的路径并删除,再直接将原先安装的整个Python文件夹拷贝到envs的目录下。

依旧无法运行,选择重新安装Anaconda 3。在清华镜像中选择目前最新的Anaconda 3 Windows64位版本镜像,下载并安装。由于上一次安装未添加其为系统变量,这次在安装时注意添加。

通过Anaconda Navigator.exe成功运行,同时在已下载的PyCharm社区版上添加Conda编译器。

在cmd中输入代码准备Python 3.8.7虚拟环境,env名称为py:

conda create -n py python=3.8.7

发现Anaconda 3中没有提供该版本的Python:

通过查阅Anaconda Navigator提供的Python环境列表也可发现没有该版本:

根据cmd返回的内容进入anaconda.org进行检索,依旧没有可用结果。

直接使用系统配置的Python 3.9.7进行安装。(后续发现较新版本Python和很多未更新的包兼容性较差,故使用3.7.11版本.

2.2 批量安装python包

首先安装常见的blast, mafft, bwa, tophat, tophat2。

conda install blast
conda install mafft
conda install bwa
conda install tophat
conda install tophat2

由于上述软件全部没有提供给win64平台的版本,略去。建议长期从事生信分析的同学尽快更换Linux系统,不要使用虚拟机。

blast是常用的序列比对搜索工具,mafft用于多序列比对分析,后三者是主要的RNA序列分析工具。

然后安装一些本实验室目前使用的一些包。

如数据库构建:scrapy, mysqlclient, pymongo;

文本挖掘和深度学习:TensorFlow、SciKit-learn, Theano, Keras;

其中SciKit-learn需要先下载SciPy才可使用。

其中mysqlclient包需要3.8以下的某些版本才可安装,故而统一使用3.7.11。

        考虑到需要安装包比较多,每个需要的时间各有不同,如果每安装一个就输入一次代码非常麻烦,我决定采用代码方法批量下载。

在requirements_conda.txt文件中分行输入所需下载的Python包。

以如下代码转换路径,并以文件中包含的包名称进行下载。

(base) C:\Users\RxnFinder>d:(base) D:\>cd D:\package(base) D:\package>conda install --file=requirements_conda.txt

安装并不顺利,有大量报错。可能需要手动安装避免出现的版本、证书等错误。

在手动安装后发现,其中部分包已经被anaconda 3自动安装,同时anaconda也不再报告冲突错误。这体现出目前采用的批量安装方法存在一种可能的问题,将于下一部分中讨论。

3 心得体会

  1. 认真阅读conda官网提供的说明文档。_conda.exe不是打开conda的正确方式,应当使用anaconda navigator、anaconda prompt以及cmd等进行操作。
  2. 在不添加系统变量的情况下,是无法在cmd中使用conda的。在安装过程中勾选添加conda环境变量的选项即可,不建议安装后手动操作。
  3. 虚拟机操作Linux系统时,一个典型的问题就是慢,作为前期练手或许是合理的,但如果进入实际操作环节,需要长期进行生信分析还是建议直接使用Linux系统。
  4. 对于先前出现的批量安装错误问题,我的看法是,不应当在同一环境下安装过多的包,根据实际需求进行取舍。可以看到科学计算相关的包因为经常更新,和部分数据库管理等不常更新类型的包经常出现冲突这也体现出许多python项目以多个文件组合的合理性,不同部分使用不同环境,避免不同包之间的冲突。

举例而言,爬虫相关的包放一个环境。数据库管理放一个环境。科学计算放一个环境。一般而言共同实现某种功能,且比较常用的包应当不太容易出现冲突问题,这是我在实践中产生的感知。

根据实践中发现的问题,mysqlclient包需要3.8以下版本的Python,其他包都能够在3.9.7版本下安装。

我将在python 3.7.11环境下,安装mysql相关的包,用于关系数据库管理。为便于使用,也将pymongo安装。

用于爬虫的主要几种包,在实际操作中没有出现冲突,便放入3.9.7环境,安装selenium,scrapy,requests和beautifulsoap4四个包。

Conda及常用生信软件安装相关推荐

  1. 终极奥义! 生信软件安装神器~ conda 从入门到精通

    前言 生物信息学分析常常需要用到许多不同的软件,常见安装方式有三种: 源码安装,要求安装者对包有较充分的认识,适用于开发者或深入学习和挑战者: 预编译版本安装,一般安装者将其拷贝到目录下即可运行: 第 ...

  2. 生信软件c语言,科学网—[转载]没有docker我真的不想动这样的生信软件 - 张成岗的博文...

    没有docker我真的不想动这样的生信软件 2020-03-26阅读 2620 C语言源代码需要编译的软件 最开始开发者都是C语言流派, 所以标准的源代码安装三部曲即可,即使 configure+ma ...

  3. 生信软件 | FastQC(质量控制,查看测序质量)

    生信软件 | FastQC 介绍 高通量测序数据的高级质控工具 输入FastQ,SAM,BAM文件,输出对测序数据评估的网页报告 安装 conda install fastqc 这里需要安装Conda ...

  4. 生信软件4 - 拷贝数变异CNV分析软件 WisecondorX

    使用wisecondorX可进行拷贝数变异CNV的分析,作者在论文中对比了多种软件的使用效果,可自行根据自己的项目需要,判断是否使用. wisecondrX安装 # conda安装 conda ins ...

  5. C#,生信软件实践(01)——DNA序列数据库FASTA文件合并工具的源代码

    1 生物信息学简介 生物信息学(BioInformatics)是研究生物信息的采集.处理.存储.传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的 ...

  6. 生信软件2 - 下游比对数据的统计工具 picard

    下游比对数据的统计工具 picard Picard是一组命令行工具,用于处理高通量排序数据和格式,如sam/ bam/ cran和vcf文件. 安装 在Linux系统目录下执行以下命令下载软件 wge ...

  7. 生信软件5 - RIdeogram包绘制染色体密度图

    该R包在全基因组测序WGS中可以通过用于描述突变位点在染色体上的分布,在转录组测序RNA-Seq中可用于描述差异表达基因在染色体上的分布,在WGBS中可用于描述DNA甲基化在染色体上的分布等. R包软 ...

  8. Windows10安装Linux子系统Ubuntu 20.04LTS,轻松使用生信软件,效率秒杀虚拟机

    很多优秀的生物信息学软件,如QIIME.QIIME 2.LEfSe等没有Windows版,而使用VirutalBox虚拟机不仅效率低,而且挂载外部硬盘和使用中也经常遇到各种问题,配置和使用详见 - 扩 ...

  9. Windows10/11安装Linux子系统Ubuntu 20.04LTS,轻松使用生信软件,效率秒杀虚拟机

    很多优秀的生物信息学软件,如QIIME.QIIME 2.LEfSe等没有Windows版,而使用VirutalBox虚拟机不仅效率低,而且挂载外部硬盘和使用中也经常遇到各种问题,配置和使用详见 - 扩 ...

最新文章

  1. Xcode bug: imageNamed:方法返回nil
  2. python的程序结构有哪几种_python异常处理结构有哪几种形式
  3. 《漫画算法》源码整理-7
  4. C++:C++语言入门级基础知识考察点回顾之函数、结构体和类
  5. cpu飙升 死循环_java排查一个线上死循环cpu暴涨的过程分析
  6. python输入input数组_Python学习——实现简单的交互raw_input的使用
  7. 【NOI2013】树的计数【树的遍历】【期望】
  8. Linux编译dhcpd,linux中搭建dhcpd服务器
  9. ASP在 Web.config 中创建数据库连接字符串
  10. thinkphp ajax 无刷新分页效果的实现
  11. 计算机毕业设计中JAVA 23种开发模式详解(代码举例)
  12. win7安装python3.6_Win7 64位下python3.6.5安装配置图文教程
  13. 安装java错误_安装JAVA JDK错误提示正在进行另一JAVA安装解决方法
  14. 打开虚拟机电脑就重启和虚拟机不兼容hyper - v无法开启的解决方案。
  15. Amazon SageMaker助力德比软件提高酒店房态查询准确率
  16. base64图片上传解析不了问题
  17. 如何解决商品秒杀超卖问题
  18. 在QT框架下进行仿照PS图像调整功能设计(亮度对比度,色相饱和度及明度)
  19. NEW RDSP MODE I
  20. 机房网络服务器维修图片,机房机柜尾纤布线图片 机房布线维护整理

热门文章

  1. 专家剖析“绿色IT”和“绿色距离”
  2. OpenCV捕获摄像头并进行录像、截图等功能的实现
  3. 厨子与大厨:伊隆·马斯克的独家配方(上)
  4. 中国软件:10个人 20年坎坷路(转载)
  5. Unity3D教程之Light光源
  6. c语言和python不同_c语言和python的区别是什么?
  7. iOS自动化--Spaceship使用实践
  8. 解决vue中textarea不换行
  9. 【数据结构】常见的排序方法的实现以及性能对比
  10. halcon 将数据保存到excel_用C#操作Excel文件,实现与Sqlserver数据库进行导入与导出的操作。...