Ka/Ks分析是生物信息学中最常见的分析之一,它在研究核酸分子进化方面有重要应用,如果你还不知道的话——咳咳!注意听讲了!

01

“什么是Ka/Ks?”

在遗传学中,Ka/Ks表示的是两个蛋白编码基因的非同义替换率(Ka)和同义替换率(Ks)之间的比例。这个比例可以判断是否有选择压力作用于这个蛋白质编码基因。

让我们从最基本的道理开始讲起。如果你手头有两个不同物种的同一个基因的序列,比如人和小鼠的p53基因,然后把这两个基因的序列进行比对,你会发现这两段序列有差异(进化!)。再仔细观察,你会发现有些碱基的变化导致了编码氨基酸的变化(非同义替换),有些没有导致编码氨基酸的变化(同义替换)。这是由密码子的简并性造成的,因为3个碱基决定1个氨基酸,所以64种碱基组合决定20种氨基酸,会有冗余出现。一般情况下,第三个碱基变化会造成同义替换,而第一二个碱基的变化会造成非同义替换。

Ka和Ks的计算公式:

Ka=发生非同义替换的SNP数/非同义替换位点数

Ks=发生同义替换的SNP数/同义替换位点数

其中非同义替换位点数就是会造成氨基酸变化的位点数的总和,比如编码丝氨酸(ser)的第一二位碱基。而同义替换位点数就是不会造成氨基酸变化的位点数的总和,比如编码丝氨酸的第三位碱基。对于像第一个方框里面的苯丙氨酸(phe)和亮氨酸(leu)这种情况,第三位碱基的变化只是有可能造成氨基酸的变化,也就是两种不同的氨基酸各占了两个碱基的位点,则在计算非同义替换位点数和同义替换位点数时,各加上1/2,相当于两者平分了这个位点。另外,计算Ka/Ks时,不考虑start codon和stop codon。现在我们回到上面的人和小鼠的p53基因的例子。我们只需要数一下两个序列发生(非)同义替换的SNP位点数,再除以(非)同义替换位点数,就得到了Ka和Ks值,然后就可以计算Ka/Ks ratio。

上面的计算方法并没有考虑不同碱基之间发生替换的速率的不同,比如,嘌呤之间替换的概率(A=>G)要高于嘌呤替换为嘧啶的概率(A=>C或T),也就是说转换(transition,嘌呤变嘌呤,嘧啶变嘧啶)发生的概率要高于颠换(transversion,嘌呤变嘧啶,嘧啶变嘌呤)发生的概率。很多计算方法都会考虑到这些替换发生概率的不同。

另外,两个物种分化时间的长短也会影响到Ka/Ks的比值。比如有一个位点,原来是A,后来变成了T,再后来又变成了C,虽然发生了两次替换,但最后仅有一次替换被用于计算替换率。再比如有一个位点,原来是A,后来变成T,但同时与它相对应的另一个序列的位点,也发生了A到T的替换,那么我们也是无法用上面的方法来计算替换率。对于这种复杂的情况,我们可以用最大可能性算法来计算最可能的替换率,这里不再详述。

02

“那么Ka/Ks和进化有什么关系?”

细心的小伙伴可能已经看出来了,在上面的密码子表中,同义替换位点比较少。实际上一个基因中大概只有25%的位点是同义替换位点。假设这个基因没有受到自然选择压力,那么根据中性选择理论,非同义替换率和同义替换率应该是相同的。

一般来讲,因为非同义替换会造成氨基酸变化,可能会改变蛋白质的构象和功能,因此会造成适应性的变化,从而带来自然选择的优势或劣势(一般是劣势)。而同义替换没有改变蛋白质的组成,因此不受自然选择的影响(当然这里我们忽略密码子偏好性的影响),那么Ks就能反映进化过程的背景碱基替换率。Ka/Ks的比值就能说明这个基因是受到了何种选择。

长颈鹿的长脖子基因肯定是受到了正选择...........

一般情况下,在某个个体中偶然发生的一个碱基替换(突变),如果没有额外的好处或者坏处的话,慢慢地也就消失了。但是自然选择中会有很多巧合,某些突变就是很幸运地被保留了下来,并且被固定了(突变频率由极小变为100%)。一个这样的突变在一个二倍体种群中被固定的可能性为1/2N,其中N是种群大小。

对于一个没有受到自然选择压力的基因来说,我们可以计算得到这样的结果:Ka/Ks=1。但实际情况下,这个比值都是远小于1的:Ka/Ks<<1,因为一般非同义替换带来的都是有害的性状,只有极少数情况下会造成进化上的优势。

小鼠和大鼠的835个直系同源基因的Ka/Ks比值分布,横坐标的数值代表每个分类区间的中间值,如0.05代表0-0.1的区间。

于是,我们有了下面的分类:

Ka>>Ks或者Ka/Ks >> 1,基因受正选择(positive selection)

Ka=Ks或者Ka/Ks=1,基因中性进化(neutral evolution)

Ka<

03

"Ka/Ks能用来做啥?"

人和黑猩猩的基因组差异只有约1.09%,染色体的数目及形态也几乎没有变化,但是仔细去看的话,会发现很多染色体片段的重排,也就是重新洗牌。2003年发表在Science的一篇研究发现,发生重排部位的基因,其Ka/Ks>1的比例,即受到正选择的比例要显著高于没有发生重排部位的基因。这说明染色体重排与基因功能的分化密切相关,与人和黑猩猩的分化密切相关。

人和黑猩猩染色体非重排部位(上图)和重排部位(下图)基因的Ka/Ks分布,红色线条为Ka/Ks=1的分界线。重排部位受到正选择的基因比例更高。

当Ka/Ks>>1时,基因受到强烈正选择,这样的基因即为近期正在快速进化的基因,对于物种的进化有着非常重要的意义。我们可以根据Ka/Ks ratio筛选部分基因,然后做后期的功能研究,这种方法已经普遍的被应用到分子进化领域,已有多篇文章在Nature,Science等杂志发表。

除了查找快速进化基因,Ka/Ks还能检测基因的功能性,因为假基因(pseudogene)的Ka/Ks比值通常比功能基因更高(大家想想为什么?)。此外,Ks代表了进化过程的背景碱基替换率,因此可以用Ks来反推事件发生的时间,如全基因组多倍化的时间,这在探究物种起源方面有重要应用。在以后的高级篇中,我们会深入探讨这些问题。

Hurst L D. The Ka/Ks ratio: diagnosing the form of sequence evolution[J]. TRENDS in Genetics, 2002, 18(9): 486-487.

Navarro A, Barton N H. Chromosomal speciation and molecular divergence--accelerated evolution in rearranged chromosomes[J]. Science, 2003, 300(5617): 321-324.

北大教授顾红雅老师的公开课:生物演化http://www.chinesemooc.org/live/611219

更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

虚拟机附加dnds服务器,kaks和dnds是什么?相关推荐

  1. 虚拟机链接ftp服务器,linux虚拟机连接ftp服务器

    linux虚拟机连接ftp服务器 内容精选 换一换 本章节以Linux操作系统为例,指导您通过弹性云服务器内网方式连接GaussDB(for Influx)实例.目标实例必须与弹性云服务器在同一个虚拟 ...

  2. 虚拟机登服务器,用虚拟机登录云服务器

    用虚拟机登录云服务器 内容精选 换一换 只有运行中的云服务器才允许用户登录.Windows操作系统用户名"Administrator".忘记密码,请先通过"重置密码&qu ...

  3. 虚拟机当作设置服务器,虚拟机当作设置服务器

    虚拟机当作设置服务器 内容精选 换一换 如果客户端工具的运行环境为Linux环境,您需要准备一台和CloudTable集群在相同虚拟私有云的Linux弹性云服务器作为客户端主机.例如,使用以下客户端工 ...

  4. 详情页用虚拟机还是云服务器,详情页用虚拟机还是云服务器

    详情页用虚拟机还是云服务器 内容精选 换一换 单独购买的云硬盘为数据盘,可以在云硬盘列表中看到磁盘属性为"数据盘",磁盘状态为"可用".此时需要将该数据盘挂载给 ...

  5. 如何在服务器上安装虚拟机呢?服务器虚拟机安装教程

    如何在服务器上安装虚拟机呢?服务器虚拟机安装教程 虚拟机(Virtual Machine)指通过软件模拟的具有完整硬件系统功能的.运行在一个完全隔离环境中的完整计算机系统.在实体计算机中能够完成的工作 ...

  6. 几个连接虚拟机和云服务器的软件

    我经常使用的连接虚拟机和云服务器的三个工具 SecureCRT:SecureCRT是一款支持SSH(SSH1和SSH2)的终端仿真程序,简单地说是Windows下登录UNIX或Linux服务器主机的软 ...

  7. 虚拟机配置DNS服务器

    虚拟机配置DNS服务 DNS简介 下面演示如何通过虚拟机安装DNS服务器 windows2003(DNS服务端) 安装DNS服务 xp客户端做相应配置 回到windows2003 切换到xp客户端 D ...

  8. Centos7虚拟机的DNS服务器的配置和测试

    Centos7虚拟机配置DNS服务器和验证(包含windows宿主机验证) 概述 本文实现了Centos7虚拟机上的DNS服务器的配置,主要是用户配置区文件的配置,并且在宿主机windows上的验证[ ...

  9. 虚拟机客户端怎么连接服务器,虚拟机客户端连接服务器

    虚拟机客户端连接服务器 内容精选 换一换 本章节指导您使用MongoDB客户端和Robo 3T工具,通过公网连接集群实例.通过MongoDB客户端和Robo 3T工具连接实例的方式有普通连接和SSL连 ...

最新文章

  1. access导出MySQL表格_如何将Access数据库里的表内容导出到Excel
  2. Linux学习笔记13:把网卡名字都修改成eth*
  3. mysql 分页排序
  4. os_mbox.c(全)
  5. h5-plus.webview
  6. 一个IT时代的终结:109岁的IBM将分拆为两家公司
  7. python apply_async执行不了_python – Django Celery apply_async不起作用
  8. mysql中清空数据库,并重置主键为1
  9. java代码输出1到100的质数
  10. 如何使用 Secret?- 每天5分钟玩转 Docker 容器技术(108)
  11. 网易云音乐最新免费下载音乐的方法----update2019/09/17
  12. 原生js模仿京东图片放大镜效果
  13. 有屋(东莞)搬家啦~ Sketchup草图大师设计拆单 有屋拆单 全屋定制拆单 衣柜橱柜拆单
  14. 电脑蓝牙耳机,蓝牙耳机能连笔记本吗_笔记本电脑怎么接蓝牙耳机吗-win7之家
  15. 计算机无法安装cad,AutoCAD 2022不能安装是为什么?安装AutoCAD Electrical 2022时显示“无法安装:此计算机不满足最低要求”...
  16. C++源文件的编译流程简介
  17. 130 余个相见恨晚的超实用网站,总有一个用得着
  18. Javascript——高级进阶
  19. 抽象语法树在 JavaScript 中的应用
  20. 10个可视化图表数据网站推荐

热门文章

  1. python-pptx替换ppt模板的文本
  2. linux版本的xmind怎么安装教程,linux安装xmind
  3. 笔记(四)Home Assistant添加小米设备
  4. 浙江大学计算机2020分数线,2021年浙江大学录取分数线(含2019-2020分数线)
  5. java8 stream collectors.joining
  6. svg实现多个元素拖拽
  7. ESXi/ESX 链路聚合
  8. 【名企面试经验-新浪-校招提前批】【数据平台研发工程师】
  9. tar命令 – 打包和备份的归档工具
  10. 最大熵阈值python_李航统计学习方法(六)----逻辑斯谛回归与最大熵模型