做生信分析平台需要什么配置的服务器?生信分析平台服务器配置建议
做生信分析平台需要什么配置的服务器?
- 1、CPU
- 2、内存
- 3、硬盘
- 4、显卡
- 5、不间断电源UPS
- 6、其它
生物信息学主要研究方向:DNA/RNA/蛋白质测序,序列比对,基因发现,基因组组装,药物设计,药物发现,蛋白质结构比对和预测,通过使用计算密集型技术(用于模式识别,数据挖掘,机器学习算法和可视化)来加深对生物过程的理解。因此需要配备先进的计算设备和丰富专业的分析软件,今天飞飞将和你分享做生信分析需要的服务器配置,希望对你有帮助~
1、CPU
CPU是计算机的大脑,计算机的计算主要就是靠CPU来完成,所以CPU非常重要,CPU的计算速度决定了计算机的计算能力。也就是水桶效应中最上面的那块木板。比如序列拼接这个工作,需要将测序的reads切成更小的片段,那么这些片段有数百万至数千万,需要非常大的计算量。如果数据复杂,计算量就更大了。
另外,CPU还需要支持多核心,CPU就是大脑,一个核心就是一个心眼儿,我们都知道心眼越多的人越聪明,多核心就可以进行并行计算。在生物信息分析中,有些工作,可以进行并行计算,相当于原来一个人的工作,现在由100个同样的人来做,理论上速度快了100倍。因此,在硬件配置中,选择CPU是非常重要的。
2、内存
内存是CPU和硬盘之间数据交流的媒介,计算机需要将存储在硬盘上的数据读取到内存中,CPU才能用来计算,而CPU不能直接读取硬盘上的数据,必须通过内存这个缓冲区。举个例子,CPU是大脑,内存是脖子,脖子以下是硬盘,内存往往就是我们常说的“瓶颈”。
假设一个人的全基因组测序数据,采用二代测序的方法,人的基因组3G,10倍数据30G,那么这30G的碱基,再切成更小的kmer,假设数据增加到了100G,这不算存储序列的一些其它信息,序列拼接的时候必须完成一次将所有数据同时存入内存,如果内存达不到100G,拼接根本无法完成。
3、硬盘
硬盘其实是计算机硬件配置中非常重要的一环,但是硬盘往往容易被大家忽略掉,认为硬盘用来存储数据,只要足够大就行了,这是不对的。
首先大存储量是必须的,因为生物数据往往都称为生物大数据,非常消耗存储空间,包括原始的数据存储,中间分析结果,最终结果,数据备份等,尤其是在样品量大的时候,就会非常占据存储空间,一般都是以T为单位的。
其次,硬盘的读写速度,这个也是非常重要的因素,因为目前CPU计算速度和内存已经足够大了,这样的条件下,硬盘称为限制计算机整体性能的因素。因此使用SSD硬盘会明显改善计算机性能。由于目前SSD过于昂贵,可以选择SSD+机械硬盘的方案,硬盘要做成RAID提高读写速度和数据安全性。
4、显卡
可以选配显卡,但显卡并不是必须的,因为很多分析工作都是文本操作,显卡适合于图形计算,例如计算蛋白质空间结构,构建系统网络等,可以选择配置显卡。
5、不间断电源UPS
UPS相当于一个大的移动电源,为了防止突然断电,导致数据丢失。UPS还是非常重要的。有些生物计算需要持续很长时间,例如拼接一个大的基因组,构建一个大的系统发育数等可能数十天时间,一旦断电,损失非常大,不要心存侥幸心理,灾难往往就发生在那些心存侥幸心理的人身上。
6、其它
冷却系统,如果是大型计算系统,设备会产生大量热量,需要建设冷却系统。
以上就是关于生信分析服务器配置的建议,感谢您的阅读,加个关注不迷路~
做生信分析平台需要什么配置的服务器?生信分析平台服务器配置建议相关推荐
- 搭建分发平台需要什么配置的服务器
搭建分发平台需要什么配置的服务器 因为 app 开发的时候需要进行测试,每次频繁的拷贝发送:iOS 的企业包上传到分发平台无法通过,有限制等等.一部分开发者出于数据安全的考虑,更倾向于使用自有服务器部 ...
- 阿里物联网平台(IOT)——业务服务器获取阿里iot平台接入设备的实时设备采集数据
基于HTTP/2通道的服务端订阅-设备状态和数据 一.服务端订阅 服务端订阅流程 在IoT场景,有时候我们期望业务服务器能接收到设备状态和设备采集的数据,而不是通过云产品中转, 这时我们可以开启服务端 ...
- 路由虚拟端口配置dhcp服务器,h3c 路由器 设置dhcp服务器配置
h3c 路由器 设置dhcp服务器配置 内容精选 换一换 kubernetes除了必要的支撑组件以外,其他的组件都是以插件的形式运行,如Kubernetes DNS,Kubernetes Dashbo ...
- 2022HZWA比武题 服务器集群分析
2022HZWA比武题 服务器集群分析 文章目录 2022HZWA比武题 服务器集群分析 仿真 server.E01 46.通过对小型集群服务器分析,该服务器系统类型是? 47.通过对小型集群服务器分 ...
- 基因测序、生物信息分析平台工作站硬件配置推荐2020
(一)了解生物信息学 生物信息学(Bioinformatics)利用应用数学.信息学.统计学和计算机科学的方法研究生物学的问题.生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机, ...
- 生物信息学软件_基因测序、生物信息分析平台工作站硬件配置探讨2020
一)(一)了解生物信息学 生物信息学(Bioinformatics)利用应用数学.信息学.统计学和计算机科学的方法研究生物学的问题.生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算 ...
- 生存分析系列教程(一)使用生信人工具盒进行生存分析
生信人工具盒是生信人团队的开发的一款软件,非常方便.下面我将演示一下如何通过这款软件进行生存分析.为了方便大家理解,形式依然是 数据结构-操作-结果解读. 1. 表达矩阵与生存信息矩阵 表达矩阵依然 ...
- 直播平台开发经验分享——直播平台搭建环境配置详解及分析...
直播平台开发完成后,接下来就会面临着直播平台搭建的问题.那么直播平台搭建的具体流程是怎样的呢?通常需要遵循以下几个环节:搭建环境配置(LNMP).Redis配置.创建数据库.web站点搭建.node. ...
- Sms多平台短信服务商系统~完成阿里云短信服务发送可自行配置
1.项目中引入Maven 阿里云地址 不同编程语言都有对应的SDK,你们下载自己需要的即可. pom.xml中添加maven坐标 <!--阿里云短信服务--><dependency& ...
最新文章
- 2014.4新版uboot启动流程分析
- 五年之内博士会开始内卷吗?
- 主机甲和主机乙之间已建立一个TCP连接,TCP最大段长为1000B。若主机甲的当前拥塞窗口为4000B,在主机甲向主机乙连续发送两个最大段后,成功收到主机乙发送的第一个段的确认段,确认段中通告的接收窗
- ASP.NET Core on K8S学习初探(1)
- circlegan_【源码解读】cycleGAN(二) :训练
- java在线查看pdf文件,java 实现所有文件的在线查看(其他类型转pdf后用pdf.js显示)...
- Object.create()和new object()和{}的区别
- Flutter实战一Flutter聊天应用(一)
- C++语言对C语言的扩展(二)
- win10系统 DNS服务器,dns出错?Win10系统dns服务器未响应的修复方法
- html隐藏safari地址栏,怎么隐藏 iOS Safari 打开网页时的地址栏和工具栏探索
- android怎么安装exe软件,安卓手机如何打开.exe文件?
- 企业微信后台应用配置步骤
- 【Docker容器镜像加速器~阿里云镜像加速器】
- 如何制作自己的网页html,如何制作自己的网页
- 【c语言】printf和scanf中* # %g的作用
- kafka集群如何内外网均可访问
- Android中使用SAX方式解析XML文件
- 怎么证明未显式定义构造方法时,编译器会自动生成无参的构造方法?
- 使用Perl编写协议分析脚本
热门文章
- 三星服务器nvme固态硬盘,强弱之差是否悬殊?五款NVMe M.2 SSD横评
- go 调用winapi_Go调用Window SendARP() 方法
- 绿盟科技软件测试招聘,【绿盟科技软件测试面试】面试官很随和-看准网
- 业余人士必备上网工具- 3721 上网助手 2005
- [CE3]CryEngine3的开源版本下载地址
- 头条,评论,发布和回复评论
- maven 之 Spring Cloud Starter Alibaba Nacos Discovery
- kali破解pdf密码
- 完美国际修改服务器经验倍率,吧主勿删,代码修改教程
- 如何检测是否安装了.NET 2.0和.NET 3.0