一共20种编码氨基酸,除去3个终止密码子,一共61个密码子。也就是说61个密码子编码20种氨基酸。会出现每个氨基酸对应几个密码子的现象,这些编码同一个氨基酸的密码子叫同义密码子。但是这些密码子不是平均使用,而是有一定的使用倾向性。

也就是说,某一物种或某一基因通常倾向于使用一种或几种特定的统一密码子,并且这种现象不是随机的,这些最常用的密码子称为最优密码子,这种现象称为密码子使用偏好性。

这种偏好性的产生与基因的表达水平,翻译起始效应,基因的碱基组成, GC含量,基因长度,tRNA丰度等很多因素相关。

所以,分析密码子偏好性有重要的生物学意义。

code degeneracy

最广泛使用的密码子偏好性软件是CodonW,目前没有界面版本,有Windows,max和linux命令行版本。还是以linux为例

可以用conda安装,省却很多麻烦。

conda install codonW

安装完成

$ codonw

Welcome to CodonW for Help type h

Initial Menu

Option

(1) Load sequence file

( )

(3) Change defaults

(4) Codon usage indices

(5) Correspondence analysis

( )

(7) Teach yourself codon usage

(8) Change the output written to file

(9) About C-codons

(R) Run C-codons

(Q) Quit

Select a menu choice, (Q)uit or (H)elp ->

用法和别的不太一样,属于命令行的交互版

具体来讲:

输入1,载入要分析的序列文件,这里我载入官方网站的示例数据

中间的选项可以自行设置,只需要输入相应的序号即可

比如第4个选项

Codon usage indices

Options

( 1) Codon Adaptation Index (CAI)

( 2) Frequency of OPtimal codons (Fop)

( 3) Codon bias index (CBI)

( 4) Effective Number of Codons (ENc)

( 5) GC content of gene (G+C)

( 6) GC of silent 3rd codon posit.(GC3s)

( 7) Silent base composition

( 8) Number of synonymous codons (L_sym)

( 9) Total number of amino acids (L_aa )

(10) Hydrophobicity of protein (Hydro)

(11) Aromaticity of protein (Aromo)

(12) Select all

(X) Return to previous menu

这里,我选择了12,select all 设置好后,运行“R”选项,

结果如下

$ head -20 kkout

title T3s C3s A3s G3s CAI CBI Fop Nc GC3s GC L_sym L_aa Gravy Aromo

YCG9_Probable__________13 0.4337 0.2347 0.3588 0.1852 0.177 -0.083 0.360 54.09 0.335 0.394 439 458 0.610699 0.122271

YCG8________573_residues_ 0.2876 0.3595 0.4222 0.1875 0.156 -0.036 0.372 52.46 0.439 0.446 180 190 -0.211579 0.084211

ALPHA2________633_residue 0.3636 0.2273 0.4939 0.2177 0.153 -0.108 0.353 58.73 0.328 0.351 204 210 -0.667143 0.052381

ALPHA1________528_residue 0.4361 0.2180 0.4228 0.2589 0.231 0.018 0.446 58.29 0.345 0.379 168 175 -0.522857 0.148571

CHA1_________1083_residue 0.4399 0.2337 0.3927 0.1958 0.214 0.000 0.425 50.30 0.328 0.394 351 360 -0.046667 0.075000

KRR1__________951_residue 0.4045 0.2409 0.4310 0.2591 0.193 -0.092 0.364 45.99 0.364 0.384 302 316 -0.762658 0.079114

PRD1_________2139_residue 0.4180 0.2757 0.3244 0.3169 0.263 0.052 0.456 53.19 0.430 0.397 684 712 -0.481742 0.117978

KAR4_________1008_residue 0.3931 0.2328 0.4412 0.2512 0.206 -0.011 0.413 50.47 0.354 0.383 322 335 -0.554030 0.089552

PBN1_________1251_residue 0.4102 0.2156 0.4419 0.2210 0.196 -0.039 0.392 53.53 0.330 0.386 403 416 -0.462260 0.098558

LRE1_________1761_residue 0.4072 0.2278 0.4202 0.2250 0.189 -0.126 0.358 52.23 0.347 0.419 570 586 -0.848123 0.061433

APA1__________966_residue 0.3975 0.3156 0.4043 0.1972 0.274 0.110 0.485 42.55 0.385 0.395 309 321 -0.439252 0.093458

YCE9__________939_residue 0.4041 0.3061 0.3440 0.2244 0.263 0.012 0.437 58.49 0.410 0.433 295 312 -0.452885 0.125000

YCE8_________1392_residue 0.3850 0.2460 0.3835 0.3014 0.204 -0.012 0.407 49.11 0.396 0.370 454 463 -0.123974 0.073434

YCE7__________777_residue 0.3861 0.2277 0.4022 0.3118 0.183 -0.084 0.363 58.22 0.394 0.391 251 258 -0.201938 0.104651

YCE5_________2283_residue 0.4197 0.2705 0.3664 0.2416 0.224 -0.036 0.393 53.53 0.383 0.386 732 760 -0.225000 0.102632

YCE6__________324_residue 0.3733 0.1867 0.3810 0.3291 0.227 -0.046 0.410 61.00 0.400 0.417 100 107 -0.404673 0.074766

YCE4_________1254_residue 0.3441 0.3765 0.3099 0.2098 0.204 0.068 0.450 54.53 0.468 0.453 402 417 -0.442686 0.083933

PDI1_________1569_residue 0.3243 0.4840 0.2541 0.2493 0.334 0.181 0.532 34.31 0.556 0.474 509 522 -0.248276 0.107280

GLK1_________1503_residue 0.2775 0.3650 0.2402 0.3792 0.227 0.053 0.446 51.32 0.581 0.497 484 500 -0.220000 0.068000

还有一个blk文件

$ head -20 kkblk

Phe UUU 27 1.38 Ser UCU 4 0.71 Tyr UAU 6 1.00 Cys UGU 4 1.14

UUC 12 0.62 UCC 8 1.41 UAC 6 1.00 UGC 3 0.86

Leu UUA 12 1.24 UCA 7 1.24 TER UAA 0 0.00 TER UGA 0 0.00

UUG 9 0.93 UCG 4 0.71 UAG 1 3.00 Trp UGG 5 1.00

CUU 19 1.97 Pro CCU 5 1.43 His CAU 3 1.00 Arg CGU 3 1.50

CUC 7 0.72 CCC 0 0.00 CAC 3 1.00 CGC 0 0.00

CUA 9 0.93 CCA 7 2.00 Gln CAA 11 1.69 CGA 1 0.50

CUG 2 0.21 CCG 2 0.57 CAG 2 0.31 CGG 0 0.00

Ile AUU 19 1.33 Thr ACU 5 0.71 Asn AAU 12 1.20 Ser AGU 8 1.41

AUC 10 0.70 ACC 8 1.14 AAC 8 0.80 AGC 3 0.53

AUA 14 0.98 ACA 10 1.43 Lys AAA 13 1.08 Arg AGA 5 2.50

Met AUG 14 1.00 ACG 5 0.71 AAG 11 0.92 AGG 3 1.50

Val GUU 16 2.00 Ala GCU 10 1.33 Asp GAU 8 1.07 Gly GGU 21 2.00

GUC 5 0.62 GCC 9 1.20 GAC 7 0.93 GGC 3 0.29

GUA 7 0.88 GCA 9 1.20 Glu GAA 7 1.40 GGA 10 0.95

GUG 4 0.50 GCG 2 0.27 GAG 3 0.60 GGG 8 0.76

序列特征分析 AND linux,4️⃣ 核酸序列特征分析(6):密码子使用模式的分析相关推荐

  1. cd-hit linux,使用cd-hit对蛋白质或核酸序列进行聚类

    2018.9.7 星期四 多云 biolearn cd-hit 是用于蛋白质序列或核酸序列聚类的工具,根据序列的相似度对序列进行聚类以去除冗余的序列,一般用于构建非冗余的数据集用于后续的实验分析. c ...

  2. RDKit | 基于RDKit的肽和核酸序列转换分子Mol对象

    RDKit文档中MolFromHELM(),从HELM字符串构建分子(当前仅支持肽) ".另一方面,正如GitHub问题中指出的那样,除了肽之外,实际上还可以从核酸序列创建Mol对象. 导入 ...

  3. linux提取基因名称和序列,一种批量提取基因组基因信息并翻译比对分析序列的方法与流程...

    技术特征: 1.一种批量提取基因组基因信息并翻译比对分析序列的方法,其特征在于,将某一物种的转录本id或者基因id,依据供试基因组cds文件.蛋白质文件.gff文件和染色体fasta文件信息,通过6个 ...

  4. 使用NCBI数据库查询并使用BLAST比对新冠病毒及九种变种的核酸序列

    一.实验目的 学会使用NCBI这一常见生物数据库 学会使用比对分析工具BLAST分析核酸或氨基酸序列. 二.实验内容 登录NCBI生物信息站点,查找新冠病毒(COVID-19)和其他几个变种的核酸序列 ...

  5. 拼接两条有重叠区域的核酸序列

    目的 27F 和 1492R 是细菌 16S 核糖体基因的一对通用引物.利用这对引物扩增DNA提取物,然后进行Sanger法测序,能获得两条长度约为 800+ 的 DNA 序列.根据正链(+)和负链( ...

  6. c语言双序列全局比对,基于动态规划进行双序列全局比对

    说明 核酸序列打分算法脚本,基于动态规划进行双序列全局比对,得到两条DNA序列的相似度并打分,但程序还有一些问题,在匹配长序列的时候还不够完善. 环境 Linux.Python3.6 实例 comma ...

  7. 多位点序列分型_多位点序列分型(MLST)及其应用.pdf

    iseaseSurveillan 塑 生 -旦箜23鲞箜 ~-]D- - - - ce,0ct.3, ,Vool一.23,No.10 DOh10.3784~.issn.1003-9961.2008.1 ...

  8. oracle两表链接序列跳序,Oracle学习之 序列(Sequence)

    Oracle学习之 序列(Sequence) [Oracle学习]之 序列(Sequence) oracle文档:https://docs.oracle.com/cd/B28359_01/server ...

  9. 栈 - 关于出栈序列,判断合法的出栈序列

    文章目录 1 引例 2 做题方法 3 原因 3.1 选项D(4 3 1 2)的模拟 1 引例 (例)设栈的入栈序列是 1 2 3 4,则下列不可能是其出栈序列的是( ). A. 1 2 4 3 B. ...

最新文章

  1. winhttp get 实例_实例|CASS的绘制的航道断面,怎么多了两个边沟? 135
  2. ArcGIS API for Silverlight 点沿着线流动
  3. Python json pickle模块
  4. CTFshow php特性 web135
  5. UT斯达康XV6700应用及常见问题
  6. 音视频技术开发周刊 | 185
  7. 西南交通大学计算机组成原理,西南交通大学计算机组成原理课程设计报告
  8. Linux和windows下多线程的区别
  9. java keytool 工具
  10. C语言哈希表uthash的使用方法详解(附下载链接)
  11. tlsf算法-概念、原理、内存碎片问题分析
  12. Abaqus Ncode振动疲劳分析教程
  13. 微信:一个必须研究的产品
  14. Mac下解压.bin文件
  15. 21 个人所得税计算
  16. 二进制换算成八进制、十进制、十六进制
  17. 微信电话显示对方忙是为什么 微信电话显示对方忙是什么意思
  18. JqGrid知识总结
  19. 利用Python 回归分析,四步预测广告收入 (附数据集与代码)
  20. 8行python代码展示程序员从入门到大神(或跑路)的全部状态

热门文章

  1. 基于SpringBoot+Vue的学生成绩管理系统
  2. 域名注册需要哪些条件?需要提交哪些材料?
  3. (挺好)最详细的Yolov3边框预测分析
  4. 5Gwifi搜不到?一文搞懂怎么开电脑5GHz频段
  5. python3--日期时间处理最近n个自然周计算
  6. 判断身份证号码的正确性源码
  7. 关于”echarts-JSON请求数据”一文读者反映chart无法显示数据的分析
  8. FAST迅捷FW150US无线网卡安装说明
  9. jdk和jre(jdk和jre的关系)
  10. bilibili注册页面编码HTML码,哔哩哔哩bilibili新人邀请码在哪填写 B站怎么绑定输入邀请码方法...