我们知道,构建模型后(得到权重参数),预测某个样本的得分(输出),只需要将该样本的按照模型的转化公式计算即可。但是,笔者最近看到两篇CNS的转录组学文献,采用了另一种构建样本得分的方法,使用相关性系数替代预测得分。

具体来讲,这些文献中,在求得模型的权重向量W后,对于样本X,其预测得分用  替代。而常规做法中,预测得分采用的是  。上述score与predict之间是否总是一致,一致性是否健壮?

和蔡霸对此进行了探讨,得出的大致逻辑如下:当自变量分量之和一定时,权重大的分量取值大、权重小的分量取值小时,预测值就会更大。感觉这种替代也是合理的。这些论文中采用的是全转录组学数据(全基因signature,而不是关键子集),而转录组学目前定量主要采用TPM,基本满足“自变量分量之和一定”的前提。

这种替代是否健壮,需要一定的数学证明。

杜老哥对此提出用协方差解释,思路通了。

首先,协方差的公式有如下写法:

其中:

且:E(W)与E(X)是恒定值(因为X各分量的总和是确定值)。令 

则:

再根据相关系数与协方差的转换公式,可得:

由于 是确定的,若假定 也确定,则  与  有对应关系。

若有大佬对本话题感兴趣,欢迎对此进一步探讨。

原论文:

Signatures of T cell dysfunction and exclusion predict cancer immunotherapy response 中的 T cell dysfunction score构建方法。

Machine Learning Identifies Stemness Features Associated with Oncogenic Dedifferentiation 中的OCLR得分构建方法,其中mRNAsi构建采用的是相关性系数预测,mDNAsi采用的是常规的线性预测。

相关性系数替代模型预测得分相关推荐

  1. 神经网络相关性系数r公式,神经网络预测数据

    MATLAB神经网络训练图中R是什么 谷歌人工智能写作项目:神经网络伪原创 相关系数r的计算公式是什么? 相关系数介于区间[-1,1]好文案.当相关系数为-1,表示完全负相关,表明两项资产的收益率变化 ...

  2. R语言偏相关或者部分相关性系数计算实战:使用psych包计算(Partial Correlation)偏相关系数、拟合回归模型使用两个回归模型的残差计算偏相关性系数

    R语言偏相关或者部分相关性系数计算实战:使用psych包计算(Partial Correlation)偏相关系数.拟合回归模型使用两个回归模型的残差计算偏相关性系数 目录

  3. R语言偏相关或者部分相关性系数计算实战:通过拟合两个回归模型、或者pysch包计算偏相关系数(Partial Correlation)、通过方差分析获得偏相关系数的F统计量(偏F检验、二型检验)

    R语言偏相关或者部分相关性系数计算实战:通过拟合两个回归模型.或者pysch包计算偏相关系数(Partial Correlation).通过方差分析获得偏相关系数的F统计量(偏F检验.二型检验) 目录

  4. 如何判断LSTM模型中的过拟合和欠拟合 By 机器之心2017年10月02日 11:09 判断长短期记忆模型在序列预测问题上是否表现良好可能是一件困难的事。也许你会得到一个不错的模型技术得分,但了解

    判断长短期记忆模型在序列预测问题上是否表现良好可能是一件困难的事.也许你会得到一个不错的模型技术得分,但了解模型是较好的拟合,还是欠拟合/过拟合,以及模型在不同的配置条件下能否实现更好的性能是非常重要 ...

  5. 基于原始影像数据的深度学习模型预测脑龄可获得可靠的遗传生物标志物

    基于机器学习对神经影像数据进行分析可以准确预测健康人的年龄.预测年龄与健康大脑的年龄的偏差被证明与认知障碍和疾病有关.在这里,我们基于深度学习的预测建模方法,特别是卷积神经网络(CNN),进一步测试了 ...

  6. 等时替代模型( Isotemporal Substitution Model)

    等时替代模型( Isotemporal Substitution Model) 一.等时替代模型 (一)定义 (二)特点 (三)传统ISM (四)成分ISM 1. 基础理论 1)成分数据的代数空间-- ...

  7. R语言使用ARIMA模型预测股票收益时间序列

    "预测非常困难,特别是关于未来".丹麦物理学家尼尔斯·波尔(Neils Bohr),最近我们被要求撰写关于arima的研究报告,包括一些图形和统计输出. 很多人都会看到这句名言.预 ...

  8. python用ARIMA模型预测CO2浓度时间序列实现

    全文下载链接:http://tecdat.cn/?p=20424 时间序列为预测未来数据提供了方法.根据先前的值,时间序列可用于预测经济,天气的趋势.时间序列数据的特定属性意味着通常需要专门的统计方法 ...

  9. r语言 python 股票_R语言使用ARIMA模型预测股票收益

    原文链接:http://tecdat.cn/?p=2831 "预测非常困难,特别是关于未来".丹麦物理学家尼尔斯·波尔(Neils Bohr) 很多人都会看到这句名言.预测是这篇博 ...

最新文章

  1. python的TCP编程
  2. 3.菜鸟教你一步一步开发 web service 之 axis 服务端创建
  3. epoll与select区别
  4. Python中基础数据类型(List、Tuple、Dict)的概念和用法
  5. RSA签名算法 - Java加密与安全
  6. mysql 优化表_mysql里sql优化和表结构优化
  7. 【Java】GUI界面切换的解决方案
  8. she's gone
  9. 6005.boost多线程与mavlink协议结合实现消息收发
  10. OpenCV实现基于图像内容检索--视频播放(上)
  11. KmdKit4D 0.01正式版发布了(0.02版已放出)
  12. python推箱子小游戏_python实现推箱子游戏
  13. MATLAB 绘制平行六面体
  14. 闲聊注册中心——ZK、Eureka、Sofa-Registry
  15. 基于PHP服装购物网站的设计与实现
  16. Web安全漏洞扫描神器-AWVS下载、安装及使用教程
  17. word标题和文字直接的空格
  18. SzNOI语法百题之1-10
  19. C#之Image使用
  20. 1188_什么是TVS管_瞬态抑制二极管

热门文章

  1. 孙鑫VC++深入详解笔记
  2. 为什么说石油币是一场“国家骗局”?
  3. 安装Aira2的三种方法(包括一键安装命令,epel源安装,源码安装)
  4. ANTMINER KA3 166T能否颠覆Polkadot未来
  5. 转)计算机领域的顶级会议和期刊
  6. 15、PIC32系列-输入捕捉ICAP
  7. 一些我平常用到的软件
  8. 医疗APP功能解析一微医
  9. 了解和深入行业/APP分类
  10. LAMP环境让php支持pdo_mysql