欢迎关注"生信修炼手册"!

之前的文章中我们介绍了CADD软件,通过计算变异位点的打分值,来评估变异位点的有害程度。今天介绍的DANN软件,可以看作是CADD的改进版本,改进了预测的算法,效果比CADD有所提高。

CADD软件的核心是支持向量机SVM算法,这个算法在机器学习领域是一个常用的算法之一,对于具有线性关系的特征具有具有较好的性能,但是对于非线性关系的特征,其性能就相对差点。DANN采用了神经网络的算法,更容易捕获非线性关系的特征,所以效果上比CADD要好一点。

DANN相关文献发表在Bioinformatics上,在文章中,利用ROC曲线比较了不同算法之间的性能

左图为利用CADD官方提供的训练数据集的结果,右图为利用ESP和ClinVar数据集的效果,在ROC曲线中,最重要的就是曲线下的面积,叫做AUC, 哪个模型对应的AUC越大,说明这个模型的性能越好。

可以看到,两幅图中,DANN的AUC都比SVM的要大,说明DANN相比CADD确实是性能更好。

DANN软件和数据都保存在以下链接中

https://cbcl.ics.uci.edu/public_data/DANN/

data目录下保存了计算好的DANN score,详细目录如下

DANN_whole_genome_SNVs.tsv.bgz 文件就是计算好的score 值文件,这个文件比较大,有102G, 所以同时提供了tabix 建立好的索引,后缀为starch的文件是完整数据库的一个简略版本,只有26G。

这个文件和CADD score 文件的格式是完全一样的,这里就不赘述了。在实际分析中,我们通常都是利用数据库中提供好的DANN score, 对自己的数据进行一个注释,很少去自己计算DANN score值。所以我们只需要理解DANN score 的含义就可以了,DANN score 的值和CADD  score 是一样的,可以参考之前文章中对CADD score 的说明。

扫描关注微信号,更多精彩内容等着你!

DANN:利用神经网络算法评估变异位点的有害程度相关推荐

  1. 手把手实战:利用LM神经网络算法自动识别窃电用户(附代码)

    来源:数据路 本文约3000字,建议阅读7分钟. 通过本文给大家介绍利用LM神经网络算法进行电力窃漏电用户的自动识别. 背景与挖掘目标 背景 传统的防窃漏电方法主要通过定期巡检.定期校验电表.用户举报 ...

  2. Intel发布神经网络压缩库Distiller:快速利用前沿算法压缩PyTorch模型

    Intel发布神经网络压缩库Distiller:快速利用前沿算法压缩PyTorch模型 原文:https://blog.csdn.net/u011808673/article/details/8079 ...

  3. 论文解析-基于图卷积神经网络的癌症基因预测模型,利用LRP算法增加模型可解释性

    论文解析:Integration of multiomics data with graph convolutional networks to identify new cancer genes a ...

  4. CV之CNN:基于tensorflow框架采用CNN(改进的AlexNet,训练/评估/推理)卷积神经网络算法实现猫狗图像分类识别

    CV之CNN:基于tensorflow框架采用CNN(改进的AlexNet,训练/评估/推理)卷积神经网络算法实现猫狗图像分类识别 目录 基于tensorflow框架采用CNN(改进的AlexNet, ...

  5. ML之XGBoost:利用XGBoost算法对波士顿数据集回归预测(模型调参【2种方法,ShuffleSplit+GridSearchCV、TimeSeriesSplitGSCV】、模型评估)

    ML之XGBoost:利用XGBoost算法对波士顿数据集回归预测(模型调参[2种方法,ShuffleSplit+GridSearchCV.TimeSeriesSplitGSCV].模型评估) 目录 ...

  6. DL之CNN:利用卷积神经网络算法(2→2,基于Keras的API-Functional)利用MNIST(手写数字图片识别)数据集实现多分类预测

    DL之CNN:利用卷积神经网络算法(2→2,基于Keras的API-Functional)利用MNIST(手写数字图片识别)数据集实现多分类预测 目录 输出结果 设计思路 核心代码 输出结果 下边两张 ...

  7. DL之CNN:利用卷积神经网络算法(2→2,基于Keras的API-Sequential)利用MNIST(手写数字图片识别)数据集实现多分类预测

    DL之CNN:利用卷积神经网络算法(2→2,基于Keras的API-Sequential)利用MNIST(手写数字图片识别)数据集实现多分类预测 目录 输出结果 设计思路 核心代码 输出结果 1.10 ...

  8. ML之SVM:利用SVM算法(超参数组合进行多线程网格搜索+3fCrVa)对20类新闻文本数据集进行分类预测、评估

    ML之SVM:利用SVM算法(超参数组合进行多线程网格搜索+3fCrVa)对20类新闻文本数据集进行分类预测.评估 目录 输出结果 设计思路 核心代码 输出结果 Fitting 3 folds for ...

  9. ML之SVM:利用SVM算法(超参数组合进行单线程网格搜索+3fCrVa)对20类新闻文本数据集进行分类预测、评估

    ML之SVM:利用SVM算法(超参数组合进行单线程网格搜索+3fCrVa)对20类新闻文本数据集进行分类预测.评估 目录 输出结果 设计思路 核心代码 输出结果 Fitting 3 folds for ...

最新文章

  1. Exchange2003表单和OWA选项中更改密码设置
  2. [Swift]LeetCode873. 最长的斐波那契子序列的长度 | Length of Longest Fibonacci Subsequence...
  3. oracle之创建和管理表之练习题
  4. mysql 动态索引_MySQL的索引
  5. python以什么方式处理文件-Python文件修改和常用方法
  6. 响应式滑动菜单_如何创建响应式滑动菜单
  7. xml文件转为ftl_idea freemarker热部署,自动加载修改的ftl页面
  8. 如何区分真的工厂还是假的工厂
  9. 如何用深度学习 AI 美颜实现天天 P 图疯狂变脸算法? | 技术头条
  10. 为ScrollView增加圆角的三种方式,及自定义属性【在Linearlayout中新增ScrollView支持滚动 后续】...
  11. python路线图_Python路线图
  12. 关于 springboot 的自动配置
  13. 二级c语言考试改卷标准,计算机二级c语言考试技巧
  14. 8.4 单片机按键介绍
  15. 从动物纪录片中所学所得
  16. 似然函数以及最大似然估计
  17. 万达商管再闯IPO大门
  18. IC卡卡号修改软件,UID卡CUID卡物理卡号修改软件操作演示
  19. nginx配置之判断请求来源
  20. 破解密码的8种典型手段与防护建议

热门文章

  1. AGM FPGA使用答疑
  2. 初始化Linux数据盘(fdisk)
  3. OllyDBG破解入门教程[图文]教程
  4. python 单词拆音节_y在单词或音节中间的单词有哪些?
  5. 基于asp.net181艺术品在线交易系统
  6. 创新型中小企业认定条件
  7. 可怕,GPT-3论坛跟帖灌水一周无人发现!专挑热搜,秒秒钟长文
  8. Allegro学习笔记
  9. VBoxManager命令解析
  10. SSL安全证书生成及概念解释