[生物信息学] 寻找开放阅读框(Open Reading Frame)

前情提要:

-[生物信息学] 分子生物学的核心法则

并不是生物的所有 DNA 都是有意义并且可以直接转换成氨基酸,对于一串基因来说,它需要找到 起始密码子(start codon)终止密码子(end codon) 才可以找到有效的 编码区(coding region),并将对应的 DNA 翻译成氨基酸。

ORF 示意如下:

图像资料来源于: https://www.genome.gov/genetics-glossary/Open-Reading-Frame

上面这一段是 ORF,是完整的 DNA 链条中的一小部分,但是该片段有 起始密码子(start codon)终止密码子(end codon),因此可以被转录成对应的氨基酸。

ORF 的阅读方法有六种,以 CGCTACGTCTTACGCTGGAGCTCTCATGGATCGGTTCGGTAGGGCTCGATCACATCGCTAGCCAT 为例:

原本的序列为: GCGATGCAGAATGCGACCTCGAGAGTACCTAGCCAAGCCATCCCGAGCTAGTGTAGCGATCGGTA,对应的反向互补为:ATGGCTAGCGATGTGATCGAGCCCTACCGAACCGATCCATGAGAGCTCCAGCGTAAGACGTAGCG

  • +1 的阅读方式为:

    CGC TAC GTC TTA CGC TGG AGC TCT CAT GGA TCG GTT CGG TAG GGC TCG ATC ACA TCG CTA GCC AT

  • +2 的阅读方式为:

    C GCT ACG TCT TAC GCT GGA GCT CTC ATG GAT CGG TTC GGT AGG GCT CGA TCA CAT CGC TAG CCA T

  • +3 的阅读方式为:

    CG CTA CGT CTT ACG CTG GAG CTC TCA TGG ATC GGT TCG GTA GGG CTC GAT CAC ATC GCT AGC CAT

  • -1 的阅读方式为:

    ATG GCT AGC GAT GTG ATC GAG CCC TAC CGA ACC GAT CCA TGA GAG CTC CAG CGT AAG ACG TAG CG

  • -2 的阅读方式为:

    A TGG CTA GCG ATG TGA TCG AGC CCT ACC GAA CCG ATC CAT GAG AGC TCC AGC GTA AGA CGT AGC G

  • -3 的阅读方式为:

    AT GGC TAG CGA TGT GAT CGA GCC CTA CCG AAC CGA TCC ATG AGA GCT CCA GCG TAA GAC GTA GCG

DNA 资料来源于: https://vlab.amrita.edu/?sub=3&brch=273&sim=1432&cnt=1

+- 指的是方向,+ 为原本的 RNA 方向,- 为 DNA 的反向互补阅读方向。1,2,3 则是分别对应所取 DNA 阅读的起始点——氨基酸以 3 个 DNA 为一组,所以开始点可以从索引 0,索引 1,索引 2 开始。

随后只需要找到对应的 起始密码子(start codon)终止密码子(end codon),就可以找到对应的 ORF。

[生物信息学] 寻找开放阅读框(Open Reading Frame)相关推荐

  1. 小肽相关1~peptidomic discovery of short open reading frame–encoded peptides in human cells

    小肽相关文章分析 peptidomic discovery of short open reading frame–encoded peptides in human cells SEP来自非编码RN ...

  2. 反向非归零编码_(宏)基因组编码基因预测

    基因预测是指通过对组装的基因组序列进行分析,根据已知生物的基因结构知识或数据库序列来识别其所包含的基因等功能区域.编码基因预测,就是识别基因组序列上所包含的蛋白质编码区域(Coding sequenc ...

  3. 全基因组关联分析(GWAS)

    全基因组关联分析是一种在人类或动植物全基因组中寻找变异序列的方法,全英文名为Genome-wide association study,缩写名为GWAS. 2005年,Science杂志报道了第一篇G ...

  4. 小白的基因测序学习之路——#001有关基因的那些事

    什么是基因? 基因是控制性状的基本遗传单位,决定着人的生老病死,是健康.靓丽.长寿之因,是生命的操纵者和调控者.人类约有两万至两万五千个基因. 首先,我们应该了解一下染色体,DNA,RNA,基因之间的 ...

  5. 基因工程-3-基因工程载体

    导读 把目的基因导入到受体细胞中的工具叫做基因工程载体. 基因工程载体包括克隆载体和表达载体两大类. 克隆载体包括:质粒载体.噬菌体载体.黏粒载体和人工染色体载体. 表达载体包括:原核表达载体.酵母表 ...

  6. 【学习笔记】山东大学生物信息学-01 生物数据库

    课程地址:山东大学生物信息学 文章目录 一.生物数据库 1.1 PubMed 文献数据库 1.2 一级核酸数据库 1.2.1 INSDC = Genbank + ENA + DDBJ 1.2.2 基因 ...

  7. 生物信息学算法之Python实现|Rosalind刷题笔记:011 DNA六框翻译

    开放阅读框(Open Reading Frame, ORF)是由起始密码子开始,直到终止密码子结束,中间不含有其他终止密码子的核酸序列.由于 DNA 是双链结构,任何一条链都可以作为模板合成 RNA: ...

  8. (五)R语言入门生物信息学——ORF和序列分析

    注:本博客旨在分享个人学习心得,有不规范之处请多多包涵! 目录 概念介绍 找ORF的代码实现 结束语 概念介绍 在人体内,为了表达DNA上的基因,这个基因包含的DNA在被转录为pre-mRNA后经过进 ...

  9. Rosalind Java|Open Reading Frames

    Rosalind编程问题之读取开放阅读框. Open Reading Frames Problem Either strand of a DNA double helix can serve as t ...

最新文章

  1. SpringBoot中yml文件报错:org.yaml.snakeyaml.scanner.ScannerException:mapping values are not allowe here...
  2. Ubuntu常用APT命令参数
  3. 陆鲸接入云信,司机与货主高效沟通
  4. 在Linux执行命令报错”Arg list too long”的原因分析
  5. 服务器压力测试_魔兽世界怀旧服:美服18日开放安其拉开门测试,P5阶段即将来临...
  6. boot spring 获取请求端口浩_Spring精华问答 | 如何集成Spring Boot?
  7. 学习进度条 20171202
  8. python字符类型
  9. Windows Phone开发(12):认识一下独具个性的磁贴 转:http://blog.csdn.net/tcjiaan/article/details/7313866...
  10. 数字信号处理——DFT
  11. 机器学习之------信号处理(入门原理)
  12. iOS 5 故事板入门(2)
  13. 使用缓存django、redis
  14. 移动硬盘使用什么文件系统格式
  15. 通用的web系统数据导出功能设计实现(导出excel2003/2007 word pdf zip等)
  16. 建立一个植物毒性分类器:数据准备和清理
  17. 白色恋人--18首扣人心弦的经典情歌
  18. 三维空间到四维空间的距离遐想
  19. 腾讯与NBA锁定五年独家合作
  20. 以股票weekday和涨幅关系为例创建dataframe交叉表与透视表

热门文章

  1. 职场萌新提升工作效率,就用这7款!
  2. 【满分】【华为OD机试真题2023 JAVAJS】云短信平台优惠活动
  3. git解决enter passphrase for key
  4. Select2(4.0.6)城市搜索
  5. 2022年驾驶员考试压路机驾驶员考试模拟试题卷及答案
  6. 数据通信基础 - 数据编码(曼彻斯特编码 和 差分曼彻斯特编码)
  7. mysql skewed_hive mysql Table 'hive.tbls' doesn't exist
  8. CSS3属性之text-shadow和box-shadow(立体效果的实现)
  9. 关于SVN,Git,GitHub的总结
  10. 《财富》公布2023年美国500强榜单:沃尔玛连续11年居榜首,苹果盈利能力最强 | 美通社头条...