还在学习探索的过程中,个人一些浅薄的见解,希望有不同见解的大佬指点一二

  1. 引言

    1. 该文的主要工作

      作者提出了一种通过肠道微生物组数据来预测疾病状态的技术,该技术使用了一种新的神经网络集成,结合了分层的方式先将OTU根据门分组,然后通过提出的两种新的排序方式taxoNN_dis与taxoNN_corr将OTU分别以基于聚类中心的距离或相关性来排序,随后将排序好的OTU数据给卷积神经网络训练,从每个卷积神经网络中集成特征来预测疾病状态。

      作者的数据集是使用的GEM研究数据中提供的受试者创建的,每个样本包含168个OTUs的值,作者向其中添加正态分布的随机数的噪声来创建了有10万个样本的总体。作者将70%的数据作为训练集,剩下的30%作为测试集,并且在训练集中使用了10次十折交叉验证。

      作者试验了三种类型的CNN模型。第一种是基本的卷积框架,输入的OTU按照字母排序,完全不代表生物关系;第二种是在神经网络中的每一次迭代中对输入的OTU进行洗牌;第三种便是作者提出的新的模型,作者首先将OTU按门来分成了4个聚类,在每个聚类中把OTUs按照两种特定的方法排序,第一种排序方式是基于OTU到聚类中心的欧几里得距离进行排序,第二种排序方式是基于相关性排序,使用spearman相关系数排名,给出了聚类中p个OTU的p维矩阵,然后将相关矩阵的每一行都缩减为一个相关系数,随后根据相关系数大小将OTU重新排序。

      这里使用的CNN的模型由2个卷积层、2个池化层和全连接层组成。经过两组卷积和池化后, 将得到的特征向量展开成单一向量,作者在这里使用了集成学习,将每个聚类的特征拼接合并,然后将其交给全连接层,全连接层使用softmax来预测是否患病。作者将训练好的模型对二型糖尿病和肝硬化进行测试,与传统的机器学习方法相比,获得了更加理想的结果。

    2. 该文的贡献

      提出了一种使用卷积神经网络训练OTU数据的机器学习方法,并且提出了两种OTU排序方式,可以在OTU数据中引入空间关系使其适合CNN模型训练,而且在二型糖尿病与肝硬化的预测中,取得了比其他机器学习方法更准确且更稳定的预测结果。在只添加了年龄和性别两个变量后,模型准确度便得到了提升,展现出了该方法一定的发展潜力。

    3. 创新点

      卷积神经网络已经成功的应用于各种领域,却没有被广泛应用于微生物组分析来预测疾病风险。作者提出了一种新的机器学习方式,利用了微生物组数据的复杂性以及微生物操作分类单元的层次或分类所带来的内在的关联性,结合集成学习的方法,将OTU数据给卷积神经网络进行训练。

    4. 讨论

      提起卷积神经网络,目前学到的大部分知识都是应用于人脸识别、图像识别等领域,他在捕获输入数据中的空间和时间依赖性等方面表现很好。同时,集成学习将多个神经网络组合到一起来获取更高的模型性能,并可以同时纳入多个输入。但是这两种如此优秀的方法在当时却没有广泛的应用于微生物组分析来预测疾病的风险,寻其原因得到的结果是OTU相对丰富的数据本身没有显示出可供卷积神经网络捕获的任何空间相似性。而作者提出的独特的排序方法,在OTU中引入了空间关系,使其可以顺利的被卷积神经网络训练。

      这里有一个平时学习深度学习课程容易忽略的地方,作者在进行实验之前先在NULL下做了测试,向模型中输入了与结果完全没有关联的OTU数据,得到的结果证明在OTU与疾病之间没有因果关系的情况下,疾病状态的预测是不受OTU支配的。

      作者在这篇文章中试验了三种CNN模型,前两种是基本的CNN_BASIC和CNN_Shuffle,而第三种模型又可以看作是两个方法,一种TaxoNN_dis是根据OTU到聚类中心的距离将其排序,第二种TaxoNN_corr是根据OTU的相关性将其进行排序。通过在T2D和肝硬化的预测中,可以看出,经典款的CNN的表现不尽如人意,他的表现看起来比传统的机器学习模型还要差一些,而经过了洗牌的CNN_Shuffle表现的中规中矩,但是跟SVM还有RF比,还是有些差距,反观作者提出的两种新模型,他们的在T2D和肝硬化预测上的表现遥遥领先与其他机器学习方法,其中将OTU通过相关性排序的taxoNN_corr表现的尤为出众,他在两种疾病的预测中都拿到了第一的位置,这证明了这两种新模型还是有一定优越性的。

      在文章Results部分最后,作者提到了将年龄与性别作为条件和OTU一起加入到卷积神经网络的训练中,作者在这篇论文的附加文件中也放出了一个表格,虽然我没怎么看懂这个表格,但是上面给了两种疾病分别对年龄和性别的p-value值,说明这两个条件对预测是有一定影响的,作者得到的结果也印证了这一点,卷积神经网络和传统的机器学习方法在加入这两个条件之后,AUC值都有了一定的提升。不仅如此,作者在附加文件中还利用T2D做了第二个实验,二甲双弧的p-value值表明该条件对预测结果也存在影响,他将服用二甲双弧人数的百分比加入了训练,在得到的结果中,一部分机器学习模型反而出现的退步,但是taxoNN_corr仍然提高了AUC的值,并且牢牢占据榜首。作者这里也写到了他们实验的局限性,他们运用的OTU之外的条件较少,以后也许加入更多条件后可以不断提升预测的精度与稳定性。除此之外还有别的局限性 ,该文章只在肠道微生物组上进行了实验,而人体还有很多微生物组;还有一点就是选取OTU的数量存在调整的空间,作者在文中也写出了,未来考虑不同数量的 OTU 以更好地评估模型会很有趣。

TaxoNN: ensemble of neural networks on stratified microbiome data for disease prediction阅读报告相关推荐

  1. 《Interpret Neural Networks by Identifying Critical Data Routing Paths》CDRPs总结

    论文工作 通过分析所提出的蒸馏导向路由(distillation guided routing(DGR))方法来解释神经网络: 提出了一个直接的编码方案来表示关键数据路由路径(CDRPs),它可以在网 ...

  2. A Critical Review of Recurrent Neural Networks for Sequence Learning-论文(综述)阅读笔记

    A Critical Review of Recurrent Neural Networks for Sequence Learning 阅读笔记 //2022.3.31 下午15:00开始 论文地址 ...

  3. 论文阅读:Deep convolutional neural networks for pan-specific peptide-MHC class I binding prediction

    发表年份:2017 论文地址:下载论文 1.项目背景 对特定主要组织相容性复合体(MHC)结合的候选肽进行计算机扫描,可以加快基于肽的疫苗开发.近些年基于机器学习的方法通过训练大量的实验数据取得成功, ...

  4. 神经网络,流形和拓扑Neural Networks, Manifolds, and Topology

    Recently, there's been a great deal of excitement and interest in deep neural networks because they' ...

  5. DEEPCON: protein contact prediction using dilated convolutional neural networks with dropout

    今天真的要开始正式进入科研状态了,之前一直都进入失败,咳!那就先来看一篇相关领域的论文吧 ---------------------------------------------- 题目:DEEPC ...

  6. Mapping Spiking Neural Networks的论文汇总以及思考

    首先感谢CSDN平台,发现不是我一个人在SNN Mapping方面纠结着.去年看了Mapping方面的内容后感觉想创新还是有点难度的,毕竟优化就是生物进化算法类似的套路,可是你会发现自己实现的结果就是 ...

  7. Graph Neural Networks: A Review of Methods and Applications(图神经网络:方法与应用综述)

    Graph Neural Networks: A Review of Methods and Applications 图神经网络:方法与应用综述 Jie Zhou , Ganqu Cui , Zhe ...

  8. Convolutional Neural Networks with TensorFlow

    ReadMe.md # 这是一篇"从无到有"的使用TensorFlow搭建一个卷积神经网络并使用流行的入门数据集进行训练测试的教程. # 包括了从开始到完成每一行代码的讲解,参照教 ...

  9. 2019_AAAI_Hypergraph neural networks

    [论文阅读笔记]2019_AAAI_Hypergraph neural networks 论文下载地址: https://deepai.org/publication/hypergraph-neura ...

  10. 【多标签文本分类】Ensemble Application of Convolutional and Recurrent Neural Networks for Multi-label Text

    ·阅读摘要:   本文提出基于Seq2Seq模型,提出CNN-RNN模型应用于多标签文本分类.论文表示CNN-RNN模型在大型数据集上表现的效果很好,在小数据集效果不好. ·参考文献:   [1] E ...

最新文章

  1. 函数调用过程,栈帧的一点理解
  2. Nat. Ecol. Evol.:不想当化学家的物理学家不是好的生物学家
  3. python 垃圾回收器_Python 垃圾回收机制详细
  4. 【已解决】surefire-reports for the individual test results.
  5. idea java主题_IDEA变身超级形态,需要这个酷炫主题
  6. java随机生成1到33数组,JAVA 生成随机数数组
  7. python之模块之shutil模块
  8. 深度卷积神经网络的水稻穗瘟病检测方法
  9. iOS------自动查找项目中不用的图片资源
  10. 动物称重管理系统HDX|FDX-B格式低频动物电子耳标面板式远距离读写器|识读器HX-L81100出线方式与标签识读距离
  11. 【unity】编辑模式预览Animator动作,2种实现。 其中一种 playback模式是Cinema Director用的会使Unity Crash
  12. vue 自动播放语音
  13. 一键生成App图标所有尺寸的三个酷站分享
  14. 数据分析-美国小孩英文名分析-可视化(含代码)
  15. 合宙-icool 开发板使用手册
  16. halcon第五讲:汉字识别
  17. 设计一个形状类(接口)Shape,方法:求周长和求面积
  18. HTB_Weak RSA
  19. 解决typeError: init() got an unexpected keyword argument ‘serialized_options’
  20. JQuery--事件总结

热门文章

  1. 读书笔记——戴尔·卡耐基(美)《人性的弱点》
  2. android进入微信加好友页面,Xposed-微信自动加好友功能实现2--自动跳转验证申请页面...
  3. Eclipse插件(RCP)自定义编辑器添加Dirty效果
  4. 三层交换 VLAN 互访配置
  5. opc服务器不显示目录,opc客户端搜不到opc服务器
  6. 线性分式变换(linear fractional transformation)
  7. 用于高频接收器和发射器的锁相环(PLL)——第二部分 与PLL相关的两个关键技术规格
  8. 网易的java开发_网易微专业java开发工程师2021
  9. Google Chrome for mac(谷歌浏览器)
  10. 解决:uni-app 图片加载不出来