Deep-4mCW2V: A sequence-based predictor to identify N4-methylcytosine sites in Escherichia coli

期刊:Methods

中科院分区:三区

影响因子:4.647

Github:https://github.com/linDing-groups/Deep-4mCW2V

Web网站:无

发布时间:2021年7月

目录

1. 摘要

2.数据集与方法

3.独立测试结果

4.结论


1. 摘要

N4-甲基环肽(4MC)是一种DNA修饰,可以调节几种生物学进展,例如转录调控,复制和基因表达。精确识别基因组序列中的4MC位点可以提供有关其遗传作用的特定知识。这项研究旨在开发一个基于深度学习的模型,以预测大肠杆菌中的4MC位点。在模型中,DNA序列是通过单词嵌入技术“ Word2Vec”编码的。将获得的特征输入到1D卷积神经网络(CNN)中,以区分大肠杆菌基因组中非4MC位点的4MC位点。对独立数据集的检查表明,我们的模型可以产生0.861的总体准确性,比现有模型高约4.3%。

2.数据集与方法

精确且可靠的数据集对于建立预测模型至关重要[27-33]。因此,我们从Chen等人的工作[17]获得了基准培训数据集。在这项研究中,我们排除了使用60%作为序列身份临界值的类似序列[34,35]。在此消除程序之后,我们最终达到了270个正和270个负序列的基准数据集,长度为41 bp,以训练和测试模型。此外,我们还从Manavalan等人那里收集了134个正和134个负序列,[21]用于独立测试。

3.独立测试结果

与其他实验结果对比

4.结论

N4-甲基胞嘧啶是与重要遗传进展有关的DNA改变,例如基因和转录调节,细胞复制和分化。因此,对基因组中4MC位点的正确识别对于理解其遗传作用至关重要。迄今为止,已经参与了许多预测因子,以对4MC [17],4MCPRED [80],DNA4MC-LIP [20],Meta4MCpred [21],IDNA-MS [81]和DEEPTRORTS [82]等多种物种进行分类4MC位点。 ,但只有一种称为4MCCNN [22]的深度学习方法存在于大肠杆菌中。在这项研究中,建立了CNN模型,以鉴定大肠杆菌基因组中的4MC位点。在提出的模型中,使用分布式嵌入式技术“ Word2Vec”对DNA序列进行编码,并使用10倍CV测试输入到CNN分类器中,并获得了最佳模型。独立数据的估计结果表明,预计模型提供了出色的性能和过度简化。我们在https://github.com/linding-groups/ept-4mcw2v上免费提供了源代码和数据。研究人员可以通过使用我们的免费源代码来生成单词嵌入DNA序列,并识别其角色。将来,我们将发布WebServer,以使我们的预计模型更加方便地为没有数学和编程知识的用户。

论文解读:Deep-4MCW2V:基于序列的预测指标,以鉴定大肠杆菌中的N4-甲基环胞嘧啶位点相关推荐

  1. 论文解读《PScL-HDeep:基于图像的蛋白质利用集成在人体组织中的亚细胞预测定位》

    论文解读<PScL-HDeep:基于图像的蛋白质利用集成在人体组织中的亚细胞预测定位> 期刊名: BRIEFINGS IN BIOINFORMATICS 期刊名缩写:BRIEF BIOIN ...

  2. 论文解读:《基于注意力的多标签神经网络用于12种广泛存在的RNA修饰的综合预测和解释》

    论文解读:<Attention-based multi-label neural networks for integrated prediction and interpretation of ...

  3. 论文解读:4mCBERT:基于集成学习策略,通过序列和化学衍生信息识别DNA n4 -甲基胞嘧啶位点的计算工具

    Title:4mCBERT: A computing tool for the identification of DNA N4-methylcytosine sites by sequence- a ...

  4. ECCV 2018论文解读 | DeepVS:基于深度学习的视频显著性方法

    作者丨蒋铼 学校丨北京航空航天大学在校博士,大不列颠哥伦比亚大学联合培养博士 研究方向丨计算机视觉 本文概述了来自北京航空航天大学徐迈老师组 ECCV 2018 的工作 DeepVS: A Deep ...

  5. 论文解读:《基于BERT和二维卷积神经网络的DNA增强子序列识别transformer结构》

    论文解读:<A transformer architecture based on BERT and 2D convolutional neural network to identify DN ...

  6. 论文解读:《基于预先训练的DNA载体和注意机制识别增强子-启动子与神经网络的相互作用》

    论文解读:<Identifying enhancer–promoter interactions with neural network based on pre-trained DNA vec ...

  7. 【论文解读】LaneNet 基于实体分割的端到端车道线检测

    前言 这是一种端到端的车道线检测方法,包含 LanNet + H-Net 两个网络模型. LanNet 是一种多任务模型,它将 实例分割 任务拆解成"语义分割"和"对像素 ...

  8. [论文解读]Deep active learning for object detection

    Deep active learning for object detection 文章目录 Deep active learning for object detection 简介 摘要 初步 以前 ...

  9. AI顶级期刊 IEEE T-PAMI 2020最新论文解读 | Deep Partial Multi-View Learning

    点击蓝字 关注我们 <IEEE T-PAMI>全称为IEEE Transactions on Pattern Analysis and Machine Intelligence.众所周知, ...

  10. 【论文解读】关于基于视觉无人机自主降落平台的论文梳理

    关于基于视觉无人机自主降落平台的论文梳理 一 : 基于视觉导航的旋翼无人机自主降落系统 文章结构: 逐文解读: 无人机自主降落过程视觉定位方法研究 文章结构 逐文解读: 多旋翼无人机自主精准降落的控制 ...

最新文章

  1. 硬不硬你说了算!近 40 张图解被问千百遍的 TCP 三次握手和四次挥手面试题
  2. 多线程编程 - GCD
  3. python【蓝桥杯vip练习题库】BASIC-10十进制转十六进制
  4. centos 7 安装codeblocks
  5. 向量空间和计算机科学与技术,向量空间
  6. Javascript中的valueOf与toString
  7. Java黑皮书课后题第5章:*5.24(数列求和)编写程序,计算下面数列的和:1/3+3/5+5/7+7/9+……95/97+97/99
  8. MySQL——高阶语句、存储过程(下)
  9. 利用BenchmarkDotNet 测试 .Net Core API 同步和异步方法性能
  10. 百度云cdn设置州五年制大专_[百度云CDN]配置过程坑点集合
  11. Jmeter脚本增强之参数化(多方式实现)(6)
  12. Ubuntu17.04 之 systemd 设置开机启动
  13. 使用FormData对象
  14. 万亿美元软件浪潮来临,开发者是核心!
  15. QQ用户文件夹下即(user文件夹) 各个文件都是干什么的
  16. java留言板源码_jsp留言板示例源码下载(入门级)
  17. FFplay使用指南
  18. 关于java语言的基本介绍
  19. 计算机程序无法响应如何解决,电脑卡死出现应用程序未响应不可以正常工作怎么办?...
  20. 基于三周加速度传感器的计步器设计

热门文章

  1. 简单的手机html页面源代码,手机页面h5的简单demo
  2. Compose Modifier
  3. 用python画一个机器猫歌词_手把手 | 用Python语言模型和LSTM做一个Drake饶舌歌词生成器-阿里云开发者社区...
  4. 太湖之光超级计算机应用最高奖,世界最快超级计算机“神威·太湖之光”获得100多项应用成果...
  5. Recorder+人脸识别︱国内人脸识别技术趋势与识别难点、技术实践
  6. Windows徽标键(WinKey)的屏蔽和恢复
  7. 三维可视化技术在智慧电厂中的作用
  8. Android组件化开发
  9. 从基础接口工具postman开始夯实软件测试基础(一)
  10. 简单明了,彻底地理解Binder