许俊林博士生答辩公告

浏览次数:175日期:2021-09-06编辑:研究生秘书

学位论文简介

单细胞RNA测序 (single-cell RNA-sequencing, scRNA-seq) 技术可以更好地帮助我们从更高的分辨率和时空结构上对生命进行解码,准确的反映细胞间的异质性。人体是由多种类型的细胞组成的一个极其复杂的个体。通过单细胞测序技术可以使得我们更加清晰地对人体疾病进行研究。然而,scRNA-seq数据具有海量、维度高和噪音大等特点,使得已有的传统的机器学习算法难以有效地处理和分析scRNA-seq数据。因此,发展高效的机器学习算法,对scRNA-seq数据进行处理和分析,对我们了解人体疾病的发病机制及其治疗具有重大意义。因此,在本文中,我们对scRNA-seq数据进行了深入研究,主要研究内容和创新工作如下:

  1. scRNA-seq技术通过将一堆细胞精细到单细胞水平,为RNA-seq测序研究带来了新的领域。scRNA-seq技术提供了强大的工具,可确定成千上万个单个细胞的精确表达模式,破译细胞异质性和细胞亚群等。然而,由于各种技术噪声,例如,存在”缺失”事件 (即,过量的零计数),scRNA-seq数据分析仍然具有挑战性。通过考虑细胞和基因之间的关联,我们提出了一种新颖的基于协作矩阵分解的方法,称为CMF-Impute,用于估算给定scRNA-seq数据表达矩阵的缺失项。我们测试了CMF-Impute模型,并将其与其他五种最新方法在六个流行的不同大小的真实scRNA-seq数据集和三个模拟数据集上进行了比较。CMF-Impute在缺失估算方面优于其他方法。

  2. scRNA-seq技术是一项革命性的突破,它确定了单个细胞的精确基因表达并破译了细胞的异质性和亚群。但是,由于技术局限性,scRNA-seq数据比高通量RNA-seq数据更嘈杂,通常会导致传统的降维和可视化的方法效果不佳。在这里,我们提出了一种改进的变分自编码器方法 (称为scIVA),用于降维和scRNA-seq数据的可视化分析。scIVA不仅结合了变分自编码器和高斯混合模型,还通过引入零膨胀 (Zero-inflated, ZI) 层来明确建模“缺失”事件,以获得scRNA-seq数据变化的低维表示。我们对10个scRNA-seq数据集进行了基准比较,结果显示,scIVA的效果优于其他五种最新的方法。此外,scIVA可以准确地捕获人类植入前胚胎发育的表达动态。

  3. scRNA-seq数据分析中面临的主要挑战是日益增长的数据。在大型数据集中,鉴定细胞群体是非常困难的,因为许多现有的scRNA-seq聚类方法无法扩大规模来处理它们。此外,由于各种原因造成的批次效应 (即:批次之间系统性的基因表达差异) 也是目前迫切需要解决的问题之一。在涉及人体组织的研究中,批次效应是不可避免的,因为数据通常是在不同的时间生成的,并且批次效应可能混淆生物学差异。如果不能消除批次效应,将使下游分析复杂化并导致对结果的错误解释。因此,我们提出了一种基于图嵌入的深度聚类的scRNA-seq数据分析方法,称为scGEDC。scGEDC是一个有用的工具,可用于一系列基础分析任务,包括批次校正,可视化和聚类。实验结果表明scGEDC对每个任务实现了很高的准确性。

主要学术成果

  1. Junlin Xu,Lijun Cai,Bo Liao,Wen Zhu,and Jialiang Yang. CMF-Impute:an accurate imputation tool for single-cell RNA-seq data. Bioinformatics, vol. 36, no. 10, pp. 3139-3147, 2020.(第一作者,中科院小类一区收录,IF 2021: 6.937,Top期刊)

  2. Junlin Xu, Lijun Cai, Bo Liao, Wen Zhu, Peng Wang, Yajie Meng, Jidong Lang, Geng Tian and Jialiang Yang. Identifying Potential miRNAs–Disease Associations With Probabili ty Matrix Factorization. Frontiers in Genetics, vol. 10, 2019(第一作者,中科院SCI-3区收录,IF2021:4.599)

  3. Lijun Cai, Changcheng Lu, Junlin Xu, Yajie Meng, Peng Wang, Xiangzheng Fu, Yansen Su. Drug repositioning based on the heterogeneous information fusion graph convolutional network. Briefings in Bioinformatics. (导师一作,本人第一通讯,中科院SCI-1区,,IF2021=11.622)

  4. Junlin Xu, Wen Zhu, Lijun Cai, Bo Liao, Yajie Meng, Ju Xiang, Dawei Yuan, Geng Tian, Jialiang Yang. LRMCMDA: Predicting miRNA-disease association by integrating l ow-rank matrix completion with miRNA and disease similarity information. IEEE Access, vol. 8, pp. 80728-80738, 2020.(第一作者,中科院SCI-2区收录,IF2021:3.367)

  5. Yajie Meng, Min Jin, Xianfang Tang, Junlin Xu. Drug repositioning based on similarity constrained probabilistic matrix factorization: COVID-19 as a case study[J]. Applied soft computing, 2021, 103: 107135.(本人最后通讯,中科院升级版SCI-1区收录,IF2021:6.725,Top期刊)

  6. Xianfang Tang, Lijun Cai1, Yajie Meng, JunLin Xu, Changcheng Lu and Jialiang Yang. Indicator Regularized Non-Negative Matrix Factorization Method-Based Drug Repurposing for COVID-19[J]. Frontiers in Immunology, 2021, 11: 3824.(本人并列通讯,中科院SCI-2区收录,IF2021:7.561,Top期刊)

  7. Lihong Peng, Xiongfei Tian, Geng Tian, Junlin Xu, Xin Huang, Yanbin Weng, Jialiang Yang and Liqian Zhou. Single-cell RNA-seq clustering: datasets, models, and algorithms[J]. RNA biology, 2020, 17(6): 765-783.(第四作者,中科院SCI-2区收录,IF2021:4.652)

  8. Yuhua Yao, Binbin Ji, Sihong Shi, Junlin Xu, Xiaofang Xiao, Enchao Yu, Bo Liao,Jialiang Yang. [J]. IEEE Access, 2019, 8: 16517-16527.(第四作者,中科院SCI-2区收录,IF2021:3.367)

  9. Wen Li, Shulin Wang, Junlin Xu, Guo Mao, Geng Tian and Jialiang YangInferring Latent Disease-lncRNA Associations by Faster Matrix Completion on a Heterogeneous Network[J]. Frontiers in genetics, 2019, 10: 769.(第三作者,中科院SCI-3区收录,IF2021:4.599)

  10. Xiaofang Xiao, Wen Zhu, Bo Liao, Junlin Xu, Changlong Gu, Binbin Ji, Yuhua Yao, Lihong Peng and Jialiang Yang. BPLLDA: Predicting lncRNA-Disease Associations Based on Simple Paths With Limited Lengths in a Heterogeneous Network[J]. Frontiers in Genetics, 2018, 9:411.(第四作者,中科院SCI-3区收录,IF2021:4.599)

面向单细胞RNA-seq数据插补及聚类方法研究相关推荐

  1. CVPR 2019 | 全新缺失图像数据插补框架—CollaGAN

    在同一域下的图像和数据是符合一个整体流形分布的,一旦域中的数据缺失,能否利用已有的域中数据去还原丢失的数据呢? Collaborative GAN 提出了一种新的缺失图像数据插补框架,称为协同生成对抗 ...

  2. missforest_missforest最佳丢失数据插补算法

    missforest Missing data often plagues real-world datasets, and hence there is tremendous value in im ...

  3. python 插补数据_python 2020中缺少数据插补技术的快速指南

    python 插补数据 Most machine learning algorithms expect complete and clean noise-free datasets, unfortun ...

  4. 直线插补计算过程_【计鹏视角】风速数据插补对发电量的影响

    测风数据在插补时通常通过相关函数实现,相关函数一般采用线性方程函数,线性函数根据不同通道的风速相关性散点图来得到. 不同高度层的相关性散点图是成"带"状分布,相关系数越大,&quo ...

  5. 【R语言】Splatter,一个用于简单模拟单细胞RNA测序数据的R包

    Splatter是一个用于模拟单细胞RNA测序数据的R包,本文概述并介绍Splatter的功能 一.参数功能 名称 功能 说明 可以通过splatEstimate函数估计 备注 nGenes -> ...

  6. 数据插补—拉格朗日插值法

    数据分析 数据清洗:缺失值处理.1删除记录 2数据插补 3不处理 常见插补方法 插值法-拉格朗日插值法 根据数学知识可知,对于平面上已知的n个点(无两点在一条直线上可以找到n-1次多项式 ,使次多项式 ...

  7. 回归插补法_没有完美的数据插补法,只有最适合的

    数据缺失是数据科学家在处理数据时经常遇到的问题,本文作者基于不同的情境提供了相应的数据插补解决办法.没有完美的数据插补法,但总有一款更适合当下情况. 我在数据清理与探索性分析中遇到的最常见问题之一就是 ...

  8. em模型补缺失值_基于EM算法数据单变量缺失处理方法研究

    龙源期刊网 http://www.qikan.com.cn 基于 EM 算法数据单变量缺失处理方法研究 作者:黄铉 来源:<科技传播> 2015 年第 20 期 摘 要 数据分析方法大都针 ...

  9. 基于像素聚类的分割方法基于slic的方法_博士论文摘要 | 张荣春:数码影像与TLS点云数据融合提取地质结构面方法研究...

    <测绘学报> 构建与学术的桥梁 拉近与权威的距离 数码影像与TLS点云数据融合提取地质结构面方法研究 张荣春1,2 1.南京邮电大学地理与生物信息学院, 江苏 南京 210023;2.河海 ...

最新文章

  1. 【论文解读】MV3D-Net、AVOD-Ne用于自动驾驶的多视图3D目标检测网络
  2. PIX 525下的怪问题(需在防火墙后的同子网上激活之后才能在INTERNET上使用)?...
  3. 【C语言进阶深度学习记录】九 C语言中const的详细分析
  4. MFC中 AfxBeginThread()的函数
  5. 【干货】陆奇:新格局下的创业创新机会.pdf(附下载链接)
  6. 统计学作业4 概念
  7. [MVC学习笔记]4.使用Log4Net来进行错误日志的记录
  8. JAVA设计模式 — 生成器模式(Builder)
  9. JavaScript 设计模式之组合模式
  10. 【开发心得】微信网页应用授权登录
  11. No handler found for OPTIONS /lca/lcaplan/lcaplanprocess/list
  12. 手机连接不上电脑的移动热点?
  13. 将ui文件转换为py文件
  14. 如何跳过htpps安全连接(webservice/get/post)
  15. 程序员的算法趣题Q50: 完美洗牌
  16. python corpora.Dictionary corpus dictionary.doc2bow 词袋模型转为稀疏矩阵 词向量 不要词袋模型
  17. app同质化趋势下,如何实现差异化?
  18. MA、WMA、EMA、EXPMA区别及公式详述
  19. c++ 语法错误 : 缺少“;”(在“*”的前面)
  20. [软件人生]也谈谈支付宝五福

热门文章

  1. 100多篇论文被知网擅自收录!89岁教授维权获赔70余万!
  2. java 请求接口跨域问题
  3. PyCharm开启或关闭科学模式
  4. GRADE:联合学习演化节点和社区表示的概率生成模型
  5. Windows10下OpenCV_contrib安装配置
  6. C库函数-perror()
  7. android布局共享,布局共享(如所有ACTIVITY拥有相同的布局部分,比如ACTIONBAR,在BASEACTIVITY中写入布局)...
  8. Science Bulletin:崔杰组发表了深浅海软甲纲动物比较病毒组学分析成果
  9. 环境微生物期刊—Bioresource Technology
  10. 微生物组-扩增子16S分析研讨会(2020.1)