转录组分析是一种快速有效的基因组调查、大规模功能基因和分子标记鉴定的方法[1]。相较于基因芯片等方法,基于转录组测序(RNA-sequencing, RNA-Seq)的方法不依赖基因的先验知识,能够覆盖更大的转录组范围,具有更高的分辨率并且测序成本更低[2]。已有很多学者针对RNA-Seq测序数据进行了研究[3- 4],其中不乏使用机器学习进行研究的方法[5- 6]。通过RNA-Seq得到的转录组测序数据具有样本量较少(几十或者几百个)、基因数极高(通常有上万个基因)的特点。数据高维的特点导致对其进行分析需要更大的计算资源和时间;同时,传统的统计方法往往也由于数据维度过高而失效。因此,对数据进行降维,寻找能够表示其特征空间的最优子集成为研究人员需要解决的问题。

常见的转录组分析方法主要可以分为两类:1) 根据已知的生物学领域知识和统计知识对数据进行处理,筛选出相对低维的特征空间进行后续研究,例如差异表达分析。此类方法[7- 8]能够较快速地获得特征子空间,但是无法保证子空间能够保留原始空间的全部信息,从而可能导致最终的效果不尽如意。2) 结合机器学习算法,从样本的基因全集中选择若干个基因作为特征构建学习器,并根据学习器的性能和基因在学习器中的重要性(如特征权重)筛选候选基因[5]。此类方法使用学习器的性能作为评判标准,虽然能够获得比较优秀的特征子集,但是只是针对单一特征进行评价,没有考虑到基因之间的相互作用。而基因间的相互作用也会导致表型的差异,如此选出的特征子集往往不是最优子集。

遗传算法(genetic a

融合遗传算法与XGBoost的玉米百粒重相关基因挖掘相关推荐

  1. 基于多模态成像遗传学数据来预测帕金森病相关基因和大脑区域的新型CERNNE方法

    系列文章目录 基于聚类演化随机森林的阿尔兹海默症的多模态数据分析 基于多模态成像遗传学数据来预测帕金森病相关基因和大脑区域的新型CERNNE方法 系列文章目录 前言 阅览文章之前记得一键三联哦,做文章 ...

  2. 易基因|DNA甲基化揭示应激反应影响婴儿免疫相关基因的表观遗传调控机制 | 表观发育

    易基因|DNA甲基化揭示应激反应影响婴儿免疫相关基因的表观遗传调控机制 | 表观发育 大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 2021年,<Brain, Behavior ...

  3. 夜间工作致癌的原因被发现:熬夜破坏了癌症相关基因的节律,导致DNA损伤增加、修复效率降低...

    撰文 | 王聪 编辑 | nagisha 排版 | 水成文 越来越多的证据表明,夜班工作者中癌症更为普遍,这也促使了世界卫生组织(WHO)国际癌症研究机构在2019年将夜班工作归类为"可能对 ...

  4. 基于大规模基因敲除实验揭示182个癌细胞免疫逃逸相关基因,指导肿瘤免疫治疗的研究

    2020 09/23日 报道,近期使用CRISPR-Cas9系统进行功能筛选给研究免疫逃逸的机制带来了希望. 肿瘤细胞通过表型上的变异来躲避免疫系统的识别和杀伤,而这些变异不仅能加速肿瘤细胞的扩散,还 ...

  5. 相关词挖掘-下拉词挖掘免费工具-用户都在相关搜索的关键词挖掘

    相关词挖掘,下拉词挖掘,大家都在搜索的关键词挖掘.为什么大家都要参考这些关键词呢.这些关键词是根据核心关键词拓展出来用户都爱搜索的关键词,这些关键词不仅能给我们提供用户搜索画像,还能给我们提供有流量的 ...

  6. 【SEO工具】抓取百度关键词相关关键词挖掘工具

    抓取百度关键词相关关键词挖掘工具使用的前提就是需要本地或者线上连接MySQL数据框,还有就是需要有ip代理才可以使用.因为这个脚本依旧是使用Python写的,所以你的电脑或者服务器需要有Python的 ...

  7. 【GWAS文献】基于GWAS与群体进化分析挖掘大豆相关基因

    Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improv ...

  8. 泛癌分析·找出各个癌症的预后相关基因

    泛癌分析·找出各个癌症的预后相关基因 ` 其他相关文章: 万物皆可pan分析·高分文章登山梯·for循环的熟练操作 前言 pan分析的第二篇我想写一下如何在TCGA整个基因集内实现COX单因素分析,将 ...

  9. 基于结肠腺癌脂质代谢相关基因的8基因标记和临床验证

    今天和大家分享一篇于2022年4月发表在Pharmacological Research 上的基于脂质代谢相关8基因构建预后模型预测结肠腺癌患者预后的文章"In silico develop ...

最新文章

  1. 自然语言处理(NLP)之英文单词词性还原
  2. 2018-2019-1 20165212 20165313 2016522 实验一 开发环境的熟悉
  3. 亿佰特物联网通信-智慧城市的未来城市愿景
  4. android 增加触摸范围,android seekBar 增加点击和滑动范围
  5. .net mysql数据库_.net连接MySQL数据库
  6. javascript指南_JavaScript还原方法指南
  7. 16.1117 NOIP 模拟赛
  8. eclipse下安装Tomcat
  9. 30天扣篮训练计划_明日之后:网易CH用心良苦?狼人画出“辐射高校30天计划”,绝了...
  10. 34. HTTP服务的七层架构技术解析及运用
  11. 190812每日一句
  12. 使用 com.Lowagie.itext 导出html的内容到word
  13. Tableau bug合集1:无法展示emoji表情包
  14. 计算机教研论文范文,计算机教研论文提纲格式模板 计算机教研论文提纲怎样写...
  15. keil:官网下载安装MDK5的软件包
  16. 56个民族静态字典代码创建sql语句
  17. 微机原理与接口技术实验:子程序设计实验
  18. 更换APP启动图标和名称
  19. 高质量程序设计指南C++学习总结二
  20. JS运动从入门到兴奋1

热门文章

  1. can`t resolve fs in xlsx-style
  2. Java多线程:ThreadPoolExecutor初探
  3. HTML和CSS写的简易网页
  4. python API 源码
  5. springboot项目图片转换成pdf
  6. 桌面中计算机作用,云桌面技术在计算机机房管理中的作用研究
  7. latex使用各种系统字体
  8. 弈缘围棋 v1.81 完全版 bt
  9. 财务的借方与贷方区别
  10. 网络安全盲目自学只会成为脚本小子?