linux统计单拷贝基因家族,为什么所有病毒基因都是单拷贝
第一章 基因的结构
第一节 基因和基因组
一、基因(gene)是合成一种功能蛋白或RNA分子所必须的全部DNA序列.
一个典型的真核基因包括
①编码序列—外显子(exon)
②插入外显子之间的非编码序列—内合子(intron)
③5'-端和3'-端非翻译区(UTR)
④调控序列(可位于上述三种序列中) 绝大多数真核基因是断裂基因(split-gene),外显子不连续。
二、基因组(genome) 一特定生物体的整套(单倍体)遗传物质的总和,基因组的大小用全部DNA的碱基对总数表示。人基因组3X1 09(30亿bp),共编码约10万个基因。每种真核生物的单倍体基因组中的全部DNA量称为C值,与进化的复杂性并不一致(C-value Paradox)。
人类基因组计划(human genome project, HGP) 基因组学(genomics),结构基因组学(structural genomics)和功能基因组学(functional genomics)。 蛋白质组(proteome)和蛋白质组学(proteomics)
第二节 真核生物基因组
一、真核生物基因组的特点:①真核基因组DNA在细胞核内处于以核小体为基本单位的染色体结构中.②真核基因组中,编码序列只占整个基因组的很小部分(2—3%),
二、真核基因组中DNA序列的分类 •
(一)高度重复序列(重复次数>lO5)卫星DNA(Satellite DNA)
(二)中度重复序列
1.中度重复序列的特点
①重复单位序列相似,但不完全一样,
②散在分布于基因组中.
③序列的长度和拷贝数非常不均一,
④中度重复序列一般具有种属特异性,可作为DNA标记.
⑤中度重复序列可能是转座元件(返座子),
2.中度重复序列的分类
①长散在重复序列(long interspersed repeated segments.) LINES
②短散在重复序列(Short interspersed repeated segments) SINES
SINES:长度<500bp,拷贝数>105.如人Alu序列
LINEs:长度>1000bp(可达7Kb),拷贝数104-105,如人LINEl
(三)单拷贝序列(Unique Sequence)
包括大多数编码蛋白质的结构基因和基因间间隔序列,
三、基因家族(gene family)一组功能相似且核苷酸序列具有同源性的基因.可能由某一共同祖先基因(ancestral gene)经重复(duplication)和突变产生。
基因家族的特点:①基因家族的成员可以串联排列在一起,形成基因簇(gene cluster)或串联重复基因(tandemly repeated genes),如rRNA、tRNA和组蛋白的基因;②有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;③有些成员不产生有功能的基因产物,这种基因称为假基因 (Pseudogene).Ψa1表示与a1相似的假基因.假基因分类。加工过的假基因(processed pseudogene)。
典型的基因家族
1.tRNA基因 单倍体人基因组中1300个tRNA基因,tRNA基因簇.
2.rRNA基因 >l00copy.rRNA基因簇(重复单元28S、18S、5.8s-rRNA)
3.组蛋白基因30-40copy.定位:7q32-q36 组蛋白基因簇(重复单位:H1,H2A,H2B,H3、H4)特点:无intron,Poly(A)- RNA.
4.珠蛋白基因
α类:16p13,基因簇(24Kb):5’—ζ—Ψζ—Ψα1—α2—α1—3’
β类:11p15,基因簇(60Kb):5’— ζ—Gr—Ar—Ψβ—δ—β—3’
四、超基因家族(Supergene family ,Superfamily)
由基因家族和单基因组成的大基因家族,结构上有程度不等的同源性,但功能不同.
五、人类基因组中的重复序列标记
1、A1u序列
单倍体人基因组50万-100万拷贝,平均每隔3-6Kb就有一个Alu序列,
人A1u序列长300bp:
2X130bp重复序列;
+31bp间隔序列(中间);
两侧7-21bp正向重复(direct repeats),返座子?
Alu序列广泛散布于人基因组,约90%巳克隆的人基因合有Alu序列
Alu序列标志。
2、可变数串联重复 • , •
Variable number tamdem repeat, VNTR.
又称小卫星DNA(minisatellite DNA)
由短重复单位(6-40bp)串联重复(6-100次以上)而成,多位于基因的非编码区,广泛分布。
VNTR多态性—分子标记—DNA指纹图(fingerprint).
小卫星DNA突变与肿瘤,H-Ras。
3、短串联重复(short tandem repeat,STR)
又称微卫星DNA(microstallite DNA)
2-6个核苷酸组成的重复单位串联重复(10-60次),两侧为特异的单拷贝序列,人基因组中每l0kb DNA序列至少一个STR序列。
{CA)n,50,000-100,000拷贝.
新一代遗传标记,人类基因组研究,肿瘤,遗传病.
第三节 线粒体基因组
人线粒体基因组的特点:
1、人线粒体基因组为16,569bp的双链闭环分子,一条链为重链(H链),一条链为轻链(L链),两条链均有编码功能,每个mtDNA分于编码13种蛋白质和24种结构RNA(22rRNA,2tRNA).
2、线粒体DNA为母系遗传.
3、结构基因不含内含子,部分区域有基因重叠,因此病理性mtDNA突变更易发生.
4、mtDNA突变频率更高.
5、线粒体DNA突变的表型表达与核DNA不同。
第四节 细菌和病毒基因组
一、细菌基因组的特点。
1.功能相关的几个结构基因往往串联在—起,受它们上游的共同调控区控制,形成操纵子结构,
2.结构基因中没有内含子,也无重叠现象。
3.细菌DNA大部分为编码序列。
二、病毒基因组的特点
1.每种病毒只有一种核酸,或者DNA,或者RNA;
2.病毒核酸大小差别很大,3X103一3X106bp;
3.除逆病毒外,所有病毒基因都是单拷贝的。
4.大部份病毒核酸是由一条双链或单链分子(RNA或DNA),仅少数RNA病毒由几个核酸片段组成.
5.真核病毒基因有内含子,而噬菌体(感染细菌的病毒)基因中无内含子.
6.有重叠基因.
第五节 染色质和染色体
细胞分裂间期—染色质(chromatin)
分裂期—染色体(chromosome)
一、染色质的基本单位—核小体
(一)核小体(nucleosome)结构
DNA绕在组蛋白八聚体(H2A、H2B、H3、H4各一对)核心外1.8周(146bp),形成核小体核心颗粒。
两个核小体核心颗粒之间有Linker DNA(0-80bp),
核小体核心颗粒+Linker=核小体(长180-210bp)
核小 体DNA Ladder.
(二)组蛋白(histone):一类小的带有丰富正电荷
组蛋白分类:
1.核小体核心组蛋白,H2A,H2B,H3,H4。分子量较小(102-135aa)
作用:盘绕DNA形成核小体 。
2.H1组蛋白:较大(220aa),作用:与Linker DNA结合后利于核小体稳定和更高级结构的形成• 。
二、染色质的高级结构
1、30nm染色质纤丝 ,
2、袢环结构(looped domain) 。
3、细胞分裂期染色体
分裂期染色体=一对姐妹染色单体(Chromatid)
有丝分裂中期46条染色体按大小和形状排列的的光学显微镜图像称为人的染色体核型(Karyotype)
三、染色体的结构要素 。
(一).着丝粒(centromere):细胞分裂时染色体与仿锤丝相连结的部位,为染色体的正常分离所必需。
(二).端粒(telomere):真核生物线状染色体分子末端的DNA区域
端粒DNA的特点:
1、由富含G的简单串联重复序列组成(长达数kb).
人的端粒DNA重复序列:TTAGGC。
2、端粒的末端都有一条12-16碱基的单链3’端突出。
端粒的作用:防止DNA末端降解,保证染色体的稳定性和功能
(三)、复制原点
◆◆
评论读取中....
请登录后再发表评论!
◆◆
修改失败,请稍后尝试
linux统计单拷贝基因家族,为什么所有病毒基因都是单拷贝相关推荐
- linux统计单拷贝基因家族,为什么要进行基因家族分析?
原标题:为什么要进行基因家族分析? 某物种基因组被测序后,大部分课题组都会发表一些基因家族分析的文章,此举常常被误解为"灌水",其实不然,理清基因组内基因家族成员分类组成,是挖掘和 ...
- Linux系统文件名字体不同的颜色都代表什么
Linux系统文件名字体不同的颜色都代表什么 2013-01-24 0个评论 作者:认准就去做 收藏 我要投稿 Linux系统文件名字体不同的颜色都代表什么 在Linux中,文件的 ...
- linux和windows和鸿蒙,linux很好,但为何大家都用Win,鸿蒙系统站错阵营了吗?
原标题:linux很好,但为何大家都用Win,鸿蒙系统站错阵营了吗? 由目前已知信息可知,华为"鸿蒙系统"很可能基于linux开源程序搭建,这个特点与苹果微软由很大不同.苹果手机目 ...
- linux 统计目录大小并按大小排序
linux 统计目录大小并按大小排序 统计目录大小命令 du -sh dir 统计当前目录下所有文件夹的大小并大小降序 du -sh * |sort -rh
- linux关闭io统计,linux 统计每个进程所占用的io数
linux 统计每个进程所占用的io数 (2012-06-29 19:44:49) 标签: it 在新版本的内核,可以用iotop来实时的看到io的情况.但是在老版本的内核没有此工具,怎么办呢从网上搜 ...
- linux传送多个文件大小,linux统计多个文件大小总和
首先:查看当前文件夹大小的命令是: [root@host1 test]# du -sh 39M. 查看当前文件夹下所有文件的大小: [root@host1 test]# du -sh * 108Kco ...
- Linux 统计一段时间内的文件大小
Linux 统计一段时间内的文件大小 There is no nutrition in the blog content. After reading it, you will not only su ...
- linux命令统计文件行数据库,wc命令--Linux统计文件行数
语法:wc [选项] 文件- 说明:该命令统计给定文件中的字节数.字数.行数.如果没有给出文件名,则从标准输入读取.wc同时也给出所有指定文件的总统计数.字是由空格字符区分开的最大字符串. 该命令各选 ...
- 【Linux 统计文件行数】
Linux 统计文件行数 语法:wc [选项] 文件- 说明:该命令统计给定文件中的字节数.字数.行数.如果没有给出文件名,则从标准输入读取.wc 同时也给出所有指定文件的总统计数.字是由空格字符区分 ...
- linux统计单拷贝基因家族,基因家族收缩和扩张分析
1相关介绍 在介绍基因家族收缩和扩张之前,有一个概念是绕不过去的,就是基因家族. 基因家族(gene family),是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因, ...
最新文章
- 2014025687《嵌入式系统程序设计》第七周学习总结
- WSGI 是什么?和nginx有什么关系?
- 017_SpringBoot异常处理方式-自定义错误页面
- FPGA+CPU助力数据中心实现图像处理应用体验与服务成本新平衡
- 安卓虚拟机启动后报错: 类似 SDK Manager] Error: Error parsing .....devices.xml 解决方案...
- Python21天打卡Day15-21 函数+参数
- Hibenate连接mysql错误_hibernate连接数据库问题,注意是表名的大小写
- 深度学习1-tensorflow2.0自定义操作与建模方式
- Python成员修饰符,metaclass,异常,反射,单例
- BP神经网络及其设计的一般原则
- 小程序将页面转为图片--Wxml2Canvas
- 一站式文本标注工具doccano(你值得拥有)
- 一分钟让你知道Hadoop是什么
- 子网掩码、IP和默认网关
- Java 12 / JDK 12 正式发布
- discuz mysql data_终于找到Discuz! Database Error终极解决办法了!
- 浅谈HEVC中的CTU CU PU TU
- php线下支付,Paypal线下支付模块,附下载地址_PHP教程
- html5移动页面自适应手机屏幕大小,页面完美自适应移动端屏幕的方法
- Towards Multi-Modal Intention Interfaces for Human-Robot Co-Manipulation