Transposable elements(TE)即一段DNA序列能够插入到基因组一个地方,是一段可移动的DNA,转座元件在真核生物基因组中非常常见,小麦基因组更是含有高达85%的转座元件或重复序列。转座元件在玉米中第一次被发现,开始认为转座元件是基因组的垃圾,不行使功能,随着研究的深入,转座元件在基因组进化、基因表达表达调控方面具有重要作用。
  上篇博文中提到一篇paper发现基因启动子区域(包括5’非翻译区)MITE插入可以影响基因表达。这篇paper给我打开了一个神秘的大门,让我连续追踪了几篇转座元件研究的文章,以前研究中碰到这类转座元件都是绕着走,主要认为没有什么功能。下面我们就说说基因组中那些年的垃圾。
  转座子分为两类:RNA介导的反转录转座子和以DNA-DNA转座的转座子。反转录转座子主要包括三类LTR(长末端重复反转录转座子)、LINE(长散在重复反转录转座子,或者non-LTR)、SINE(短散在重复反转录转座子)。反转录转座子通过复制-粘贴的方式在基因组中扩展。DNA转座子又可以分为自主转座子和非自主转座子,非自主转座子只有在自主转座子存在时才可以转座。该类转座子的转座过程则是通过“剪切-粘贴”的机制进行。

MITE相关知识

  上文中提到的MITE转座子就是DNA转座子,其结构与非自主原件相似,具有TIR或者TSD结构,但是又具有反转录转座子的高拷贝性。MITE广泛分布在植物和动物的基因组中,并且多存在于基因富集区,推测其对基因组进化和基因表达具有较大的影响。MITE的长度较短,一般为60-700bp,不能编码转座酶。它具有末端倒转重复序列(terminal inverted repeats, TIRs)和靶位点重复(target site duplication, TSD),并且能够形成稳定的发夹式的二级结构。MITE倾向于插入到基因的内含子区域或基因的5’和3’末端,但是很少插入基因的编码区,有的也能形成巢式结构。不同的MITE家族具有不同的TIRs和TSD。根据TSD序列的保守性,植物中的MITE被分为Tourist(具有3bp的TSD,TAA或TTA)和Stowaway(2bp的TSD,TA)两大类。
  我还是对这种MITE比较感兴趣,接着说,正如前面小麦那篇paper中所说,MITE插入编码区上游可以影响基因的表达。我们可以猜测MITE可能提供了基因表达所需的顺式作用元件。Santiago等分析151个Emigrant(MITE)插入位点的侧翼序列,表明10%的MITE元件位于预测基因的内部(7%在内含子,3%在外显子),68%位于开放阅读框的侧翼区域(24%与ORF的距离少于500bp, 23%位于500-1000bp之间,21%超过1000bp),13%位于重复序列区域。该结果也表明MITE元件多插入在基因的附近,推测将对基因的表达产生一定影响。有些MITE元件插入基因的3`区,能够改变基因的PolyA信号。Hbr元件插入玉米抗病基因hm的3’UTR区后,使该基因失去活性。很多研究显示,MITE总是位于基因的上游,启动子是基因转录中重要的调控元件,决定基因表达的时空特异性,这些MITE元件可能影响启动子的活性、RNA拼接、转录终止、RNA的稳定性以及基因的编码能力。
  
  At the transcriptional level, a TE (shown in brown) inserted upstream of a gene may (i) insert promoter sequences and introduce an alternative transcription start site, (ii) disrupt existing cis-regulatory element(s), or (iii) introduce a new cis element such as a transcription factor binding site. In addition, a TE inserted within an intron may drive antisense transcription and potentially interfere with sense transcription. Finally, a TE may serve as a nucleation center for the formation of heterochromatin potentially silencing the transcription of adjacent gene(s). At the posttranscriptional level, a TE inserted in the 3′ UTR of a gene may introduce an alternative polyadenylation site, a binding site for a microRNA or for RNA-binding protein (not shown). A TE inserted within an intron can interfere with the normal splicing pattern of a pre-mRNA, provoking various forms of alternative splicing (intron retention, exon skipping…etc). A TE inserted within an intron containing cryptic splice sites may be incorporated (‘exonized’) as an alternative exon. This may result in the translation of a new protein isoform, or in the destabilization or degradation of the mRNA via the nonsense mediated decay (NMD) pathway, especially if the exonized TE introduces a premature stop codon (asterisk).
  上述关于MITE的描述很大部分参考温小杰2008年发表在中国农业科学上的文章《MITE转座元件在植物中的研究进展》
  进一步了解MITE,参见 Evolutionary Genomics of Miniature Inverted-Repeat Transposable Elements (MITEs) in Plants.

植物MITE数据库

DNA transposon activity is associated with increased mutation rates in genes of rice and other grasses

说说基因组的垃圾DNA-Transposable elements相关推荐

  1. 转座子 垃圾DNA是指DNA中不编码蛋白质序列的片段,是DNA中最神秘的部分之一。

    什麼是「垃圾DNA」? | GeneOnline News 垃圾dna与转座子 基因组重复序列分类 转座子 - 组学大讲堂问答社区 (omicsclass.com) (122条消息) 说说基因组的垃圾 ...

  2. signature=cc0735b80de74e294c47d2b8d527fd10,Fungal Transposable Elements

    摘要: Transposable elements (TEs) are mobile and mostly repetitive genetic elements, which are ubiquit ...

  3. DeeCamp 2021冠军用“垃圾DNA”预测癌症,李开复:医疗是AI的下一个突破点

    博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 5位学生2个月做出来的AI项目,能走到哪一步? 不仅能通过目标基因查询对应药物,还能查询癌症相关药物的具体基因,包括靶向的基因和通路: 像这 ...

  4. 易基因:全基因组DNA甲基化和小RNA分析揭示甘蓝型油菜种子的基因组不对称性 | 植物发育

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 多倍体是被子植物基因组进化中的一种持续现象,有助于现存开花植物的多样性.甘蓝型油菜(Brassica napus)是世界上最重要的被子植 ...

  5. dna编码库_Nature |DNA元件百科全书(ENCODE)计划, 全面注释基因组元件

    原创 mumu 图灵基因 今天 来自专辑 前沿生物大数据分析 撰文:mumu IF=42.778 推荐度:⭐⭐⭐⭐⭐ 亮点: 1.研究了小鼠胚胎全组织.单细胞分辨率水平.不同组织和器官中.随时间变化的 ...

  6. 易基因|RRBS单碱基绘制580种动物的基因组规模DNA甲基化谱:Nature子刊

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 2023年01月16日,奥地利科学院分子医学研究中心(CeMM)研究团队在<Nat Commun>杂志发表了题为" ...

  7. Transformer 和卷积神经网络在跨物种基因组DNA N6甲基腺嘌呤位点识别中的应用

    期刊名:<METHODS> JCR分区:Q2 代码地址:https://github.com/khanhlee/bert-dna 文章地址:https://linkinghub.elsev ...

  8. 《全基因组测序WGS数据分析——1.DNA测序技术》学习笔记

    WGS(Whole Genome Sequencing) 指将物种细胞里面完整的基因组序列全部DNA,检测并排列,此技术几乎能够鉴定出基因组上任何类型的突变. 对于人类来说,全基因组测序的价值是极大的 ...

  9. 易基因 | 文献速递:全面的表观基因组图谱揭示了DNA甲基化调节骨骼肌发育的机制

    大家好,易基因文献科普栏目又来啦!今天要分享解读一篇发表于Nucleic Acids Research(IF16.971)的DNA甲基化研究文章,本文通过WGBS-seq和RNA-seq描述了猪骨骼肌 ...

  10. 遗传:细菌、真菌和动植物的泛基因组研究进展

    泛基因组:高质量参考基因组的新标准 边培培,张禹,姜雨 西北农林科技大学动物科技学院,杨凌 712100 摘要: 随着三代测序组装的高质量参考基因组的陆续发布,以及大规模重测序和群体遗传学分析的广泛进 ...

最新文章

  1. 自己写的内存池Slabs
  2. workbench提示工作负载高度不平衡_搞CAE分析的孩子不容易,麻烦您,非线性,请收敛...
  3. vbs的任务提醒程序
  4. 黑客窃取思科、IBM与甲骨文认证管理系统内的敏感数据
  5. 16位无符号比较器设计
  6. UE3 关卡优化指南
  7. visio2013复制到word有多余白边_Visio虚线复制到word中变为实线的解决办法
  8. 【讨论】测试工程师能否作为一份终生职业?30岁+怎么办?
  9. Eclipse断点种类
  10. 呆瓜半小时入门python数据分析
  11. uplift 模型开源包(causalml)尝试
  12. avr单片机流水灯程序c语言,动手学AVR单片机流水灯实验电路和程序实现.doc
  13. AMOS分析技术:验证性因子分析介绍;信度与效度指标详解
  14. 支付宝小程序人脸识别认证
  15. 公司/组织苹果开发者账号申请流程
  16. 模仿“百度”页面的html代码
  17. 社交网络中基于位置的影响力最大化 CIKM2015 译文
  18. java 爬取评论,Java基于WebMagic爬取某豆瓣电影评论的实现
  19. php solr,PHP: Solr - Manual
  20. 黑客动态播报 | 一封假offer,盗取6.25亿美元

热门文章

  1. 计算机团队霸气名称大全,最霸气最潮的团队名字
  2. python处理图片像素_Python 处理图片像素点的实例
  3. 2.4g和5g要不要合并_路由器2.4g和5g要不要合并?
  4. 【渝粤题库】陕西师范大学200391 初等几何研究 作业(专升本)
  5. 【信息系统项目管理师】第十二十三章 项目采购合同管理(考点汇总篇)
  6. 《黑马》——C++核心编程
  7. Python编写时钟表turtle
  8. 一周信创舆情观察(2.1~2.7)
  9. hadoop完全分布式搭建以及试运行
  10. CSGO中最新骗术!新老玩家须知-CSGO防骗指南