Title:Mouse4mC-BGRU: Deep learning for predicting DNA N4-methylcytosine sites in mouse genome

期刊:Methods

分区:2区

目录

1. 摘要

2. 数据集

3. 方法

3.1 自适应模块

3.2 BiGRU

3.3 分类器

3.3.1 Max-pooling Layer.

3.3.2 Linear Classification

4. 结果

5. 结论


1. 摘要

DNA N4-甲基胞嘧啶(4mC)是一种重要的DNA修饰,在多种生物过程中起着至关重要的作用。准确的4mC位点鉴定是提高对4mC生物学功能和机制理解的基础。然而,许多识别方法局限于传统的机器学习,导致学习能力弱,特征提取过程复杂。在这里,我们提出了Mouse4mC-BGRU,这是一种先进的深度学习模型,它利用了基于双向门控递归单元(BGRU)的自适应嵌入。基准测试结果表明,在预测小鼠基因组中的4mC位点时,我们的模型比最先进的方法表现得更好。Mouse4mC-BGRU采用自适应特征提取表示,能够捕捉输入序列中潜在的生物学信息,有效地增强了模型的表示能力。此外,我们使用dim reduction工具可视化了Mouse4mC-BGRU的训练过程,并直观地展示了我们模型的有效性,表明Mouse4mC-BGRU具有成为精确识别4mC位点的强大实用工具的巨大潜力。

2. 数据集

与i4mC-Mouse相同的数据集

长度:41

training_dataset:746个阳性样本 746个阴性样本

testing_dataset:160个阳性样本 160个阴性样本

3. 方法

整体框架的流程图

3.1 自适应模块

该模型Mouse4mC-BGRU使用的是k-mer而没有用one-hot,文章中所提出来的自适应方法就是通过映射然后反向传播自适应改变任务。

3.2 BiGRU

双向门控单元与长短期记忆网络都是RNN的升级版,现在应用也比较广泛,用长距离的学习跟适应一些。

3.3 分类器

3.3.1 Max-pooling Layer.

将由双向GRU生成的每个k-mer的特征向量h馈送到最大池层,以捕捉最重要的特征来表示该k-mer信息。然后,将k-mer的所有最重要的特征连接成一个向量来表示DNA序列。

3.3.2 Linear Classification

从max- pooling层获得表示后,我们将向量输入到完全连接的层,以计算序列是否是真实的4mC DNA甲基化位点的概率。

4. 结果

不同kmer的结果

5. 结论

在这项研究中,我们开发了一个基于BGRU的网络,命名为Mouse4mC-BGRU,用于预测小鼠基因组中的4mC位点。不使用传统的手工特征作为输入,我们提出了一种新的自适应嵌入算法,它可以自动调整初始输入特征以更好地适应预测任务。特别是,我们采用了双向门控循环图2的流行和有效的网络。在基准数据集和独立测试数据集上比较Mouse4mC-BGRU与之前基于ML的方法4mCpred-EL和i4mC-Mouse的性能。图3。通过主成分分析和t-SNE对独立测试数据集上的每个样本进行降维。每个子图标题中的时期[x]表示模型的相应训练时期。0和1分别代表非4mC位点和4mC位点。(A-C)显示不同时期PCA视觉图像,以及(D-F)显示不同时期的t-SNE视觉图像。J. Jin等方法xxx (xxxx) xxx 5个单位有效地从长短距离信息中提取整个DNA序列的完整且有意义的表示。基准和独立实验表明,我们提出的Mouse4mC-BGRU在大多数指标上优于现有的基于序列的方法。最后,在独立测试数据集上训练过程的可视化直观地显示了我们的模型具有优异的预测性能,并进一步证明了DNA序列包含用于DNA甲基化预测的足够信息。

论文解读:《Mouse4mC-BGRU:用于预测小鼠基因组中DNA N4-甲基胞嘧啶位点的深度学习》相关推荐

  1. 论文解读PCT: Point Cloud Transformer(用于点云处理的Transformer)

    最近几年transformer越来越火,在NLP.CV等领域都取得了很大的成功.这篇文章作者利用了transformer能够处理无序数据的特点,将transformer应用到点云的处理上.它的想法是基 ...

  2. CVM2021| PCT: Point cloud transformer(分类+分割任务SOTA)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨paopaoslam 来源丨 泡泡机器人SLAM 标题:PCT: Point cloud tra ...

  3. PCT: Point Cloud Transformer

    PCT:点云Transformer Meng-Hao Guo Tsinghua University gmh20@mails.tsinghua.edu.cn Jun-Xiong Cai Tsinghu ...

  4. FastFormers 论文解读:可以使Transformer 在CPU上的推理速度提高233倍

    自Transformers诞生以来,紧随其后的是BERT,在几乎所有与语言相关的任务中,无论是问题回答,情感分析,文本分类还是文本生成,都占据着NLP的主导地位. 与RNN和LSTM消失的梯度问题(不 ...

  5. Point Cloud Transformer(PCT)代码实现

    Point Cloud Transformer(PCT)代码实现 目前最火热的Transformer在自然语言和图像识别中扮演了极其重要的角色,在点云数据集中也不例外,清华大学近期提出在点云中运用Tr ...

  6. 论文解读:《基于BERT和二维卷积神经网络的DNA增强子序列识别transformer结构》

    论文解读:<A transformer architecture based on BERT and 2D convolutional neural network to identify DN ...

  7. Point Cloud Transformer(PCT)阅读翻译

    PCT: Point Cloud Transformer 1. Introduction transformer是一种 encoder-decoder结构,包含了三个模块:输入词嵌入,位置(顺序)编码 ...

  8. 论文阅读 PCT:Point Cloud Transformer

    论文阅读 PCT:Point Cloud Transformer PCT 介绍 Input Embedding native 版本 enhanced 版本 Attention PCT 介绍 PCT是基 ...

  9. AI论文解读:基于Transformer的多目标跟踪方法TrackFormer

    摘要:多目标跟踪这个具有挑战性的任务需要同时完成跟踪目标的初始化.定位并构建时空上的跟踪轨迹.本文将这个任务构建为一个帧到帧的集合预测问题,并提出了一个基于transformer的端到端的多目标跟踪方 ...

  10. 论文解读:《功能基因组学transformer模型的可解释性》

    论文解读:<Explainability in transformer models for functional genomics> 1.文章概括 2.背景 3.相关工作 4.方法 4. ...

最新文章

  1. Can 't connect to local MySQL server through socket '/tmp/mysql.sock '(2)
  2. 车载360度全景监视系统
  3. asp ed什么意思 j_这部洗脑ED动画是如何创作出来的?
  4. Android RecyclerView 性能优化总结
  5. linux怎么取消文件隐藏命令,Linux基础命令:显示隐藏的文件
  6. 疯狂.NET架构通用权限后台管理工具演示版2.0下载
  7. Micrium/UCOS官网账号密码重新改问题
  8. 量子计算机概念谁提出来,目前的量子计算机从根本上来说是一个伪概念
  9. NodeJS 加密 —— crypto 模块
  10. Ubuntu已经很好用了
  11. Linux文本编辑器-vi/vim
  12. mysql架构 三级主从同步_MySQL 主从同步架构中你不知道的“坑”(完结篇)
  13. dxf转换html5,移动端CAD版本转换如何输出DXF格式-迅捷CAD转换器
  14. 电工技术(3)—电路的分析方法二
  15. 基于javaSwing、MySQL的酒店客房管理系统(附源码)
  16. Matlab用saveas函数自动编号保存图片
  17. mysql日期函数之DATEDIFF() if()用法 case when用法
  18. Proxyee-down 3.x的下载与安装
  19. 地理坐标的六边形编码(PHXIS)
  20. 服务器系统部署方案,服务器 部署方案

热门文章

  1. foreman源NO_PUBKEY 6F8600B9563278F6 1
  2. 用python获取颜色传感器TCS230返回的参数
  3. 诺亚幻想怎么在电脑上玩 诺亚幻想电脑版玩法教程
  4. 是不是发现Python越来越火了?让我来告诉你为什么
  5. 汽车加油问题 --贪心算法
  6. Pandas统计分析基础(4):DataFrame的数据分析及画图功能(case:京津冀地区的gdp和人口的关系)
  7. fortify java_Fortify SCA快速入门以及常见问题解决方法
  8. 震惊!苹果iPhone 5在华毛利润居然这么高
  9. 公司金融课程知识点记录(一) 第二、三章节——斯坦利·布洛克编著教科书
  10. JS方法中打印本方法名称