7月28日更新 :原链接失效了,已经更新。

上次回答的时候基因课的视频教程还是个人兴趣,业余时间录的,免费放到网上。

今年辞职全职做这个事情了,所以收费。只有收费才能保证内容精良和持续输出。每门课程也只有几十块钱。

收费的另一个原因是,很多同学没有 Linux 服务器,没法练习,我们为大家购买了云服务器供练习。

————————————————————————————

1. 基础语言

1.1 Linux

操作系统,是基础。

生物信息对Linux的要求其实并不高,并不是要做系统开发者或管理员,只需要会用就行。复制粘贴、处理数据、安装软件等。

软件安装绝对是一个大坑,很多时候信誓旦旦说下午要把数据分析完,结果半夜了软件还没装上,各种报错。

1.2 perl或python

处理个性化问题、软件之间的对接等。

这两门语言至少应该熟练掌握一门自己写程序用,另外一门要能看得懂。写点小脚本感觉差别不大,但是perl写大程序不合适。很多人认为python是趋势,但至少截止目前更多生信软件是用perl写的。

所以,如果刚开始学,建议主打python, 看懂perl。

python视频17年再录。

1.3 R

数据处理、统计、绘图、数据分析。

R语言的数据结构跟其他语言差异较大、而且总感觉语法比较散,不好记。但是R的软件包却异常强大。数据处理的reshape2, dplyr;绘图的ggplot2;还有Bioconductor里的几千个包。不得不会。

R自带的画图命令用起来感觉浑身难受,ggplot2是R的一个包,学会了感觉自己是艺术家

2 基本工具

2.1 数据过滤和质控

拿到测序数据之后,先看看数据质量咋样,把不合格的扔掉

质控软件fastqc

过滤软件Trimmomatic

测序数据过滤和质控学习视频链接,

不过写回答的时候还没有录完。

2.2 常用软件

太多了,比如blast,seqkit,MEGA等。

3 做什么

生物信息做的最多的就是基因组、转录组、重测序,每一类都有套路,每一步主流软件也就那么几个,没有太多选择

3.1 一个物种的基因组

基因组denovo的套路就是组装->注释->比较基因组分析->。。。

Genome assembly: SOAPdenovo, ALLPATH-LG等

Genome annotation: 结构注释推荐用maker,学习视频

注释完成之后,可以搭建个JBrowse基因组浏览器看看,后面分析也用得上,有精力可以做手工注释。

后面比较基因组内容很多,推荐一个工具MCScanX,能实现大部分基因组之间的比较。

3.2 重测序、变异检测、群体分析

重测序的套路是 测序reads比对到参考基因组->各种变异检测->。。。

DNA比对软件最主流的就是bwa, 比对完了生成一种叫sam/bam的比对格式,这个格式够你研究一下午的。

变异检测包括SNP、indel和结构变异SV,拷贝数变异CNV等。SNP和indel最主流的软件就是GATK,变异检测生成一种VCF的文件格式.

得到的VCF通常需要做一些处理,比如过滤掉质量低不可靠的变异位点。顺手的工具是vcftools。

完成变异检测之后,你可能想知道,这些变异都对基因功能产生了什么影响,这就是变异的注释。最主流的软件之一是SnpEff。

如果做的是群体重测序,要算一下PI,LD,Fst等,vcftools 也可以搞定。

3.3 多个样品的转录组

转录组是做的人最多,价格最最便宜,但其实也是信息分析最复杂的。为什么呢?因为转录组即包含了类似基因组denovo的拼接、类似重测序的比对和变异检测,而且分析起来更为复杂。

如果没有参考基因组,就需要进行拼接,应该95%以上的都是用trinity软件拼接得到转录本序列,然后使用bowtie2比对到转录本序列上的到sam格式比对文件。然后根据比对结果使用RSEM软件进行表达定量。

如果有参考基因组,直接使用 hisat2(替代tophat)或STAT将测序结果比对到基因组上,结合基因注释就可以计算出每个基因的表达。

拿到表达数据之后,最常做的是差异表达基因的鉴定。记住两款软件DESeq2和edgeR,根据一些测评文章,这两款是大多数情况下最靠谱的,cuffdiff哪些就不要用了。

暂时就写这么多吧。

推荐一个网站,生物信息软件大全啊,omictools

生物信息学python常用脚本_生物信息学一些基本的常用软件有哪些?相关推荐

  1. python大数据运维常用脚本_大数据岗位要求之大数据运维

    继续介绍大数据系列岗位要求,大数据运维可能是"技术含量最高"的职位之一,这里说的大数据运维主要是指hadoop生态体系方面的运维,在一些小公司或者传统行业的大公司也会使用oracl ...

  2. python sql脚本_使用Python SQL脚本进行数据采样

    python sql脚本 介绍 (Introduction) The Python programming language is object oriented, easy to use and, ...

  3. mysql常用的tamper脚本_总结一些sqlmap的常用tamper脚本释义

    要想成为一名合格的"脚本小子",我们首先需要一个强大的工具,然后利用好他的脚本.但是脚本也不能乱用,首先就是要了解一下SqlMap的常用的脚本,然后分清楚场合进行利用.(好的,看开 ...

  4. python中控脚本_[宜配屋]听图阁

    由于考勤机与OA对接,OA会在每天定时取考勤机数据,但是需要考勤机是连接状态,所以搜索了下相关教程,写了个脚本自动连接.完全是个Python小白,代码烂,仅作为笔记. 理论上支持所有程序的每天自动开启 ...

  5. python嵌入式脚本_基于Python的嵌入式脚本研究

    基于Python的嵌入式脚本研究 王国强;张贝克 [期刊名称]<计算机应用与软件> [年(卷),期]2010(027)003 [摘要]嵌入脚本语言到应用程序当中在用户自动化和个性化定制方面 ...

  6. 常用的python测试脚本_详解Python的单元测试

    如果你听说过"测试驱动开发"(TDD:Test-Driven Development),单元测试就不陌生. 单元测试是用来对一个模块.一个函数或者一个类来进行正确性检验的测试工作. ...

  7. 生物信息学python书籍推荐_求一份学习生物信息学的书单?

    看起来你们组不做种群,不做进化,不做系统生物学,可能只是用组学手段为实验方法打打基础. 关于编程,推荐四本书: python学习手册(最基本,不用多说) 编写高质量代码 改善Python程序的91个建 ...

  8. python30个常用脚本_超实用的 30 段 Python 案例

    Python是目前最流行的语言之一,它在数据科学.机器学习.web开发.脚本编写.自动化方面被许多人广泛使用. 它的简单和易用性造就了它如此流行的原因. 如果你正在阅读本文,那么你或多或少已经使用过P ...

  9. 什么是python扩展库_什么是目前比较常用的Python扩展库管理工具

    展开全部 在Python环境中已经有很多成熟的包,可以通过安装这些包来扩展我们的程序. 例如,很32313133353236313431303231363533e4b893e5b19e31333365 ...

最新文章

  1. 用python解析word文件(段落篇(paragraph) 表格篇(table) 样式篇(style))
  2. python程序员工作怎样-python程序员怎样在面试过程中展现自己的基本功
  3. Sql Server 清除日志的存储过程 Procedure of cleaning sql server's log
  4. TensorFlow 安装protoc
  5. [转]TCP(HTTP)长连接和短连接区别和怎样维护长连接
  6. 【大话存储】多CPU架构变迁, SMP,NUMA,MPP
  7. python 打开txt_python编程之文件操作
  8. PreferenceScreen 偏好显示类 的使用
  9. PDCA循环管理全面解析(含操作指南、案例应用)
  10. [Python]通过有道词典API获取单词发音MP3
  11. 罗格斯的计算机科学博士奖学金,本科直博如何“牛”转乾坤斩获全奖博士录取,师兄制胜申请经历大揭秘!...
  12. ElasticSearch读流程
  13. 制作标准1寸和2寸照片方法
  14. PHP curl的DNS解析问题(PHP下curl很慢)
  15. 百度开源两款句法分析应用工具,提升文本处理任务效果
  16. 2022年成都市中等职业学校师生技能大赛【真题】
  17. Win10 安装软件报错:管理员已阻止你运行此应用
  18. JS 定时器整点定时刷新
  19. php中进制转换,php的进制转换
  20. 互联网大佬学历背景大揭秘,看有没有你校友

热门文章

  1. VS--安装VS2010出现VC9.0 Runtime问题的解决方法
  2. SQLZOO(SQL语句练习)
  3. SG函数和SG定理【详解】
  4. 静态测试 vs 动态测试
  5. ora-600汇总Ora-00600 错误的代码含义及常用查询
  6. PyTorch 简介
  7. Python:计算欧氏距离的三种写法
  8. 2020美赛E题解题方法
  9. 跨考没有计算机二级,计算机二级可以跨学校报名吗 计算机二级可以跨校报考吗?...
  10. 入手评测 华为擎云 L410怎么样