python基因差异分析_Biopython基因组分析
基因组是完整的DNA集合,包括其所有基因。基因组分析是指研究单个基因及其在遗传中的作用。
1. 基因组图
基因组图将遗传信息表示为图表。Biopython使用Bio.Graphics.GenomeDiagram模块表示GenomeDiagram。GenomeDiagram模块需要安装ReportLab。
创建图的步骤
创建图的过程通常遵循以下简单模式-
创建图的步骤
创建图的过程通常遵循以下简单模式-
为显示的每个单独的功能集创建一个FeatureSet,然后向其中添加Bio.SeqFeature对象。
为显示的每个图形创建一个GraphSet,然后向其中添加图形数据。
在图上创建轨道,然后将GraphSet和FeatureSet添加到所需的轨道。
创建一个图,并将轨道添加到其中。
告诉图表绘制图像。
将图像写入文件。
下面我们以输入GenBank文件为例-
首先导入所有模块,如下所示 -
>>> from reportlab.lib import colors
>>> from reportlab.lib.units import cm
>>> from Bio.Graphics import GenomeDiagram
现在,导入SeqIO模块以读取数据 -
>>> from Bio import SeqIO
record = SeqIO.read("example.gb", "genbank")
在这里,记录从genbank文件中读取序列。创建一个空图以添加轨迹和功能特性集 -
>>> diagram = GenomeDiagram.Diagram(
"Yersinia pestis biovar Microtus plasmid pPCP1")
>>> track = diagram.new_track(1, name="Annotated Features")
>>> feature = track.new_set()
我们可以使用从绿色到灰色的替代颜色来应用颜色主题更改,如下所示:
>>> for feature in record.features:
>>> if feature.type != "gene":
>>> continue
>>> if len(feature) % 2 == 0:
>>> color = colors.blue
>>> else:
>>> color = colors.red
>>>
>>> feature.add_feature(feature, color=color, label=True)
现在可以在屏幕上看到以下响应输出结果 -
将以上输入记录绘制一个图表-
>>> diagram.draw(
format = "linear", orientation = "landscape", pagesize = 'A4',
... fragments = 4, start = 0, end = len(record))
>>> diagram.write("orchid.pdf", "PDF")
>>> diagram.write("orchid.eps", "EPS")
>>> diagram.write("orchid.svg", "SVG")
>>> diagram.write("orchid.png", "PNG")
执行完上述命令后,可以看到以下图像保存在Biopython目录中。
** Result **
genome.png
还可以通过进行以下更改以圆形格式绘制图像-
>>> diagram.draw(
format = "circular", circular = True, pagesize = (20*cm,20*cm),
... start = 0, end = len(record), circle_core = 0.7)
>>> diagram.write("circular.pdf", "PDF")
2. 染色体概述
DNA分子被包装成称为染色体的线状结构。每个染色体都是由围绕着支持其结构的称为组蛋白的蛋白质紧密缠绕多次的DNA组成。
当细胞不分裂时,染色体在细胞核中不可见,甚至在显微镜下也不可见。但是,构成染色体的DNA在细胞分裂过程中变得更加紧密,然后在显微镜下可见。
在人类中,每个细胞通常包含23对染色体,共46条染色体。其中二十二对染色体(称为常染色体)在雄性和雌性中看起来都是相同的。男女之间的第23对是性染色体。女性具有X染色体的两个副本,而男性具有X和Y染色体的一个副本。
¥ 我要打赏
纠错/补充
收藏
加QQ群啦,易百教程官方技术学习群
注意:建议每个人选自己的技术方向加群,同一个QQ最多限加 3 个群。
python基因差异分析_Biopython基因组分析相关推荐
- python基因差异分析_差异基因
以前是没有想过用这个软件的,直到有一个我的htseq无法对比对的bam文件进行基因计数(后来我才发现htseq无法计数的原因是gtf版本不同导致坐标不同,而且gtf对染色体编号没有加上chr),我简单 ...
- python基因差异分析_TCGA的差异基因分析
在分析TCGA数据库里的RNA-seq数据之前,先了解一下TCGA样本的id名称里的小秘密:参考文章:TCGA的样本id里藏着分组信息 根据文章里的内容,我查看了前一篇文章里我下载的count文件(利 ...
- python基因差异分析_玉米RNA-seq测序数据差异基因分析
原标题:玉米RNA-seq测序数据差异基因分析 huanying今天给大家分享一个非常棒的玉米转录组的流程分析.原文作者是cxge,首发于omicshare论坛,阅读原文可跳转至本文的帖子哦~ 软件及 ...
- python基因差异分析_R语言之生信②差异基因分析2
目录 R语言之生信②差异基因分析2 样品的无监督聚类 检查基因表达分析最重要的探索性策略之一是多维定标(MDS)图或类似的图.该图以无监督的方式显示了样本之间的相似性和不相似性,以便人们可以了解在进行 ...
- python基因差异分析_差异表达基因的分析(2)
应学生及个别博友的要求,尽管专业博文点击率和反应均很差,但在去San Diego参加PAG会议之前,还是抽时间给出[R高级教程]的第二专题.专题一给出了聚类分析的示例,本专题主要谈在表达谱芯片分析中如 ...
- R语言 DESeq2 基因差异分析 简单备注版 火山图
RT #加载数据 linba代表淋巴 lnc <- read.csv("K0.csv") #保证ID的唯一性,删除重复 table(duplicated(lnc$id)) i ...
- 利用TCGA癌症基因进行差异分析
TCGA癌症基因差异分析步骤 文章目录 TCGA癌症基因差异分析步骤 1. 数据库下载 2. 将分散的文件转化为矩阵 3. 将矩阵id转化为基因名 4. 进行差异表达分析 1. 数据库下载 进入TCG ...
- python怎么搜索文献_python论文参考文献有哪些
展开全部 关于python外文参考文献举例如下: 1.A Python script for adaptive layout optimization of trusses. 翻译:用于桁架的自适32 ...
- 基于TCGA数据库的差异基因分析实现
1.数据下载 1.1 网页下载 1.2 TCGABiolinks下载 setwd("D:\Bioinformatics data analysis") if (!requireNa ...
最新文章
- leetcode--括号生成--python
- 70佳精美的PSD素材免费下载(上篇)
- matlab生产正弦mif文件
- NLP:基于snownlp库对文本实现提取文本关键词和文本摘要
- Linux 服务器高并发调优实战
- 【Spring注解系列12】@Value与@PropertySource注解
- matlab 十六进制数组,【MATLAB】MATLAB中读取二进制数据文件并加入到矩阵中
- Algorithm:贪心策略之区间覆盖问题
- ROS学习(十七)安装ARDUINO IDE使用rosserial
- 重构代码花 1 年!程序员血泪史:千万不要重写代码!
- MySQL Password Expired
- Revit中视图隐藏部分轴号字符及控制视图类别【隐藏/显示】
- 平面几何----蝴蝶定理的证明
- 网易经典评论(一)创业
- C/S与P2P的主要区别以及相同点
- 切换无线网卡失败服务器提示,无线网卡切换为AP模式时提示ICS启动失败的解决方法...
- 阴历阳历的相互转换(支持1900~2100年) 1
- latex tex studio 表格大小 整体缩小 过长 过宽 跨栏 跨页
- c语言消消乐字母游戏代码,基于pygame的小游戏———数字消消乐
- 大写日期(大写日期10月前要写0吗)