在分析全外数据的时候,无论是在样本鉴定还是CNV分析的过程中,都需要对样本进行性别判断,那么我们如何对WES数据进行性别判断那?

一、性别判断思路

对于WES数据,个人认为性别判断主要有三个思路:
1、根据Y/X染色体的reads比,这个最好理解,男性的Y/X染色体的reads比会显著大于女性的;
2、根据X染色体上SNP的杂合比例,由于女性有两条X染色体,所以女性X染色体SNP的杂合位点的比例会显著大于男性;
3、根据SRY基因,男性的SRY基因上有reads覆盖,而女性没有。

当然,以上的三种方法使用的前提是样本没有性染色体大片段拷贝数异常,比如患有特纳综合征或者克氏综合征的样本用到以上的一些方法可能会出现问题。

基于以上思路我们可以自己写脚本进行性别判定,如果您不会写脚本也没有关系,有很多开源的软件可以实现这个功能。

二、性别判定软件

今天给大家分享的是ngs-bits下的一个工具SampleGender,使用方法如下:

SampleGender -in test.bam -method xy
SampleGender -in test.bam -method hetx
SampleGender -in test.bam -method sry

-in:输入bam文件;
-method:性别判定的方法,xy、hetx、sry分别是基于我上面三个思路的方法,Y/Xreads比例(xy), X染色体杂合比(hetx), SRY基因 (sry);

软件的分析结果如下,该样本三种方法的判定结果都是女性:

#file     gender  reads_chry  reads_chrx  ratio_chry_chrx
test.bam  female  9010        3274631      0.0028
#file     gender  snps_usable  hom_count  het_count  het_fraction
test.bam  female  491 of 525   305        186         0.3788
#file     gender  coverage_sry
test.bam  female  0.00

有的时候我们的分析结果会处在灰区,如下:

#file     gender  reads_chry  reads_chrx  ratio_chry_chrx
test.bam  unknown (ratio in gray area)  145661  1714764  0.0849

这个时候我们可以修改该方法的阈值,比如将xy方法的男性cutoff调整为0.07,再重新判定。

SampleGender -in test.bam -method xy -min_male 0.07

结果如下,性别被判定为男性:

#file     gender  reads_chry  reads_chrx  ratio_chry_chrx
test.bam  male    145661     1714764      0.0849

对于不同方法cutoff值的选择,建议可以选择100例以上的训练样本进行训练,得到合理的cutoff值。

欢迎大家关注我的公众号

我爱学生信

我爱学生信 公众号 主要分享:CNV、转录组、全外显子和全基因组生信分析流程,欢迎各位交流与讨论!

WES数据如何判断性别?相关推荐

  1. TensorFlow练习16: 根据大脸判断性别和年龄

    本帖使用TensorFlow做一个根据脸部推断照片人物年龄和性别的练习,网上有很多类似app. 训练数据 – Adience数据集 Adience数据集来源为Flickr相册,由用户使用iPhone或 ...

  2. python识别人脸的年龄和性别_人脸识别是如何判断性别和年龄的?

    你能看出郭德纲和林志颖是同龄人吗?都是47岁,反正我看不出来. 虽说肉眼看不出来,很多人脸识别算法却可以识别出来. 在探讨人脸识别算法如何判断性别和年龄之前,需要先厘清人脸识别的原理. 我们人类记忆和 ...

  3. 编程示例:以人名为输入判断性别的函数 以查表的方式实现

    编程示例:以人名为输入判断性别的函数 以查表的方式实现 需求分析:功能是根据输入的人名,来判断人名的男女的可能性.限定条件是中国的汉族的人名. 格式如下: 输入是"孙 机    苏东海   ...

  4. 神经网络算法实战——根据姓名判断性别

    "根据姓名判断性别"实战. 1.数据读入及处理 本次实验数据取自该书提供的数据集,可自 [http://file.hankcs.com/corpus/cnname.zip] 下载 ...

  5. tensorflow证件照判断性别

    证件照判断性别 说明 本文用1000张身份证号命名的证件照作为训练数据,复现tensorflow官方教程中的图像分类例子 教程中是多分类,本文改为了二分类. 官方教程地址:https://tensor ...

  6. python 四维数据怎么看性别_四维彩超报告单怎样看胎儿性别

    自从怀孕了以后才知道,B超检查是非常多种类的,而且每一项B超检查所显示的数据都是不一样的.我最近听说,看四维彩超的报告单能看出胎儿性别哦.四维彩超报告单怎样看胎儿性别?四维彩超报告单怎么看呢? 四维彩 ...

  7. python 四维数据怎么看性别_【四维彩超脸朝外是男孩女孩】四维彩超脸朝外看男女_亲亲宝贝网...

    3 四维彩超数据看性别 以下是一些彩超数据以及相应的胎儿性别,可供准爸准妈娱乐一下,但别太当真,毕竟从彩超数据看胎儿性别是不科学的. (W代表周,是英文week的首字母;D代表天数,是day的首字母) ...

  8. python 四维数据怎么看性别_四维b超单数据怎么看男女

    四维b超也就是四维彩超,这种检查方法是目前最为先进科学的检查方法,很多孕妈妈们都比较喜欢.有一些妈妈则认为通过四维彩超数据看性别.那么,四维b超怎么看男女呢?看男女的方法有哪些呢?接下来,小编就为大家 ...

  9. python 四维数据怎么看性别_四维彩超怎么看性别?四维看男孩女孩诀窍

    女人怀孕后,为了有一个健康聪明的宝宝,经历各种体检.筛查.其实这些体检和筛查中的一些数据已经告诉了你宝宝的性别.只是我们这些门外汉看不懂罢了.最近有一些孕妈妈一直问我一个问题:四维彩超的孕囊数据可以预 ...

最新文章

  1. springboot + rabbitmq发送邮件(保证消息100%投递成功并被消费)
  2. 读《世界是数字的》有感
  3. Linux下svn新建用户,Linux下建立svn工程
  4. Qt值得学习吗?详解Qt的几种开发方式
  5. 吴恩达《机器学习》学习笔记四——单变量线性回归(梯度下降法)代码
  6. 人脸识别门禁系统在2019年会加快应用
  7. UpdateData( )
  8. poj 1088 滑雪
  9. ASP.NET MVC搭建项目后台UI框架—1、后台主框架
  10. python实现12306抢票,春节不用担心买不到票回家了
  11. 什么是云服务举例说明_云服务器与云服务有什么区别
  12. linux命令 mml,微软开源用于Spark的深度学习库MMLSpark
  13. 在EXCEL表格中如何快速换行
  14. 数据结构与算法精选面试50题(附答案)
  15. 启用Direct3D功能
  16. 计算机组成与人体组成类比
  17. websamba.com免费空间申请全功略
  18. 在计算机潮流计算的三类节点中,电力系统分析习题集.doc
  19. 日本小学生毕业典礼被全世界围观:疫情之下在《我的世界》中补办一场!
  20. 北京中科白癜风医院转姐,回家吧

热门文章

  1. #UNTF致敬我的第一篇wp——(爷的历险记Misc)
  2. XML解析、JSON解析入门
  3. es share mac 局域网 文件分享工具/软件
  4. java压测服务器_Java简单模拟设备压测服务器(Rabbitmq)
  5. mysql经纬度距离计算 按距离排序
  6. 你突然对我说,七里香的名字很美
  7. 【虚拟机-虚拟网络】使用 PsPing PaPing 进行 TCP 端口连通性测试
  8. psping|端口连通性测试工具
  9. 亚马逊云科技Amazon DynamoDB的10年之约
  10. “NetSarang的Xmanager和Xshell多种产品被植入后门事件”分析报告