今天分享一篇2008发表于JCO的列线图综述。

翻译水平有限,如有错误,请指正!原文在文末。

本次结合自身的拒稿经历来说明构建细节的重要性。

参考文献:Iasonos A, et al. How to build and interpret a nomogram for cancer prognosis. J Clin Oncol. 2008 Mar 10; 26(8): 1364-70.

目  录

摘要

介绍

步骤1:确定患者群体

步骤2:定义结局

步骤3:识别潜在的协变量

步骤4:构建列线图

  • 选择模型

  • 选择预测因子

    a. 混杂因子/多重共线性

    b. 交互作用

    c. (变量性质) 转换

第5步:完成模型: 验证

  • 交叉验证

  • Bootstrap 验证

  • 外部验证

步骤6:解释最终的列图

步骤7:应用列线图

Go

摘要

列线图被广泛应用于癌症预后,主要是因为它们能够将预测模型量化为对事件概率的数值估计,这是针对单个患者的特点量身定制的。

然而,模型的统计学基础需要仔细检查,并且需要注意分数估算的不确定性程度。

本指南为非统计的读者提供了构建、解释和使用列线图来估计癌症预后或其他健康结果的方法学方法。

介绍

肿瘤学家和患者都希望得到针对每个患者的可靠预后信息。列线图与传统的TNM分期系统相比更有优势,因此已被提出作为一种替代或甚至是一种新的标准。列线图的个性化预测能力使其能够用于对参与临床试验的患者进行识别和分层。友好的界面和广泛的网络可用性相结合使得它们在肿瘤学家和患者中很受欢迎。

本文的目的是揭示列线图的开发过程,以便临床医生了解其统计基础。此外,我们提出了报告列线图的标准指南,以促进已出版列线图的正确使用。

步骤1:确定患者群体

数据来源:人群可以来自单中心、多个中心或基于人群的队列。来自多中心或基于人群队列的模型更具普遍性;然而,它们可能会受到缺乏一致且有用的变量,例如可以提高预后准确性的特异性肿瘤标志物。

评估数据质量:

  • 数据是唯一的吗?

  • 它能代表整个年龄谱吗?

  • 它的治疗模式有代表性吗?

这些因素必须在建模之前考虑。

【刚开始学习列线图时并未读到该文,结果在投稿后被审稿人疯狂提问 - -!,审稿意见下】

步骤2:定义结局

列线图的构建需要对主要结局精确定义。结局通常是一个事件,如恶性肿瘤的诊断或事件发生的时间,如复发或死亡的时间。

【笔记:

  • 结局定义不清容易被审稿人提问,如DFS (无病生存) 应把所有情况说明,类似还有LRRFS(无局部区域复发生存)等;

  • 再如LR(局部复发)指明部位,那里复发才算局部复发。

  • 其次,尽量不要用有包含关系的结局,例如DFS这种,它的对立事件包括了复发、转移等,有的审稿人会提议做竞争风险分析、有的会提议将结局分主次。血淋淋的教训!

  • 列线图类文章不同于一般的临床回顾性研究,它可以做预测、可以被患者使用,如果定义不清会产生很多不良后果,要谨慎对待每一步。

总的来说,在构建列线图时所有细节都有可能被提出质疑,因为这涉及到了一个预测准确性的问题。因此,我们在方法部分要仔细仔细再仔细。

刚开始投的时候被5个审稿人提了将近30个问题,但也感谢那些认真的审稿人。这让我去阅读了更多的文献,更加深刻的理解了该类型文章的行文思路与需注意的细节。

与列线图相关的审稿意见 ↓↓↓

从以上评论可以看出,几乎所有构建列线图的细节都未掌握:

研究核心目的不明;

- 人群选择受质疑;

- 协变量选择质疑;

- 缺乏外部验证;

- 列线图缺陷表述不全面。

上期文献抄读-1中所有需要注意的问题,均未注意【被拒稿了】

这位审稿专家所关注的是方法部分

人群选择与治疗信息不完善;

以及对列线图应用性的质疑。

这位审稿专家所关注的是治疗信息与结局

步骤3:识别潜在协变量

  • Prognostic parameters must be selected a priori, based on either prior research or sound clinical reasoning, so that excluding variables because of missing data is eliminated and consistent data collection is maintained

    预后参数必须基于之前的研究或合理的临床推理预先选择,这样就消除了由于缺少数据而排除变量的问题,并保持了数据收集的一致性。

  • In published nomograms, the range of variables considered is usually determined based on data availability and clinical evidence rather than on statistical significance.

    在已发表的列线图中,通常考虑的变量范围取决于数据的可用性和临床证据,而不是基于统计意义。

笔记:虽然大部分的列线图构建指南都在说变量选取基于临床意义,但大部分的研究还是基于统计学结果。

步骤4:构建列线图

1. 选择模型

一般是Cox或logistic回归。

2. 选择预测因子

2-1 研究人员首先从他们预期的可能对结果产生影响的协变量开始选择。统计检验可以确定数据是否支持这些最初的想法。

2-2 统计意义取决于结果效应的大小、样本大小和数据的差异 (方差)。

  • 大型研究可以发现微小的差异,而小型回顾性研究可能无法发现重要的临床意义。

  • 许多列图是使用回顾性或单机构数据库开发的。因此,可能没有足够的样本量来确定显著效应。

  • 因此,考虑样本大小是很重要的。

根据Harrell’s guidelines,当结局为二分类时,两个分类数目的最小值应大于预测因子数目的10倍 (the minimum value of the frequencies of the two response levels should be greater than 10 times the number of predictors)

【笔记:例感兴趣结局为死亡,那么样本中死亡的人数=10*预测因子数目】

2-3 从统计学角度看,其他因素也可能影响统计显著性,可以改变对结果的影响程度或提供错误的影响估计。

  1. 混杂因子/多重共线性

混杂因素是与结果和模型中的其他独立预测因素相关的因素,但请注意,在这种关系中没有因果。

预测因子之间的关系,也就是所谓的多重共线性,会影响模型中的β系数,从而产生奇怪的关联,并可能导致不可靠的效果估计。

选用岭回归、主成分分析等变量选择的方法,不完全依赖于P值小于0.05为标准进行处理多重共线性,但这些方法还没有被应用于临床列线图,也许应该加以考虑。

  b. 交互作用

交互作用是一种协同效应 (即两个或两个以上因素共同作用的方式)。这是一些模型尽管有很好的敏感性,但缺乏特异性的原因之一。

例如:年龄(<65 vs. >=65岁)和性别 (男vs女)有交互作用,则应为年轻和年长的男性患者以及年轻和年长的女性患者提供不同的预测。

    c. (变量性质) 转换

【笔记:当数据间呈现非线性关系时,为了使列线图得到更好的结果,常会将数据进行转换,如样条函数。

很多文章在方法部分会将连续变量处理为分类变量,其使用的方法就有非限制性三次样条(RCS)这个曲线在R语言|0. R简介及临床研究应用实例介绍过,之后会介绍如何用R代码实现,这是个挺好用的连续变量转分类变量的方法】

第5步:完成模型: 验证

一个模型区分不同结果的病人的能力被称为区分度(Discrimination)

预测与实际结果之间的距离称为校准(Calibration)。校准通常通过比较列线图预测概率图与实际概率图来评估。一个非常精确的列线图预测模型会得出这样一个图: 给定组的观察和预测概率会沿着45度线下降。概率置信区间(CI)的宽度取决于每组包含的患者数量,当组的人数越少,CI 的宽度越大。【即图中的黑线=CI】

列线图的预测精度是通过一致性指数(C-index)来衡量的,该指数量化了预测概率和发生感兴趣事件的实际机会之间的一致性水平。

【C指数≈AUC(ROC的曲线下面积),二者可互相代替。例如C指数或AUC=0.8, 列线图预测一患者5年复发可能性为70%。则C指数和AUC评估模型得出结论:该列线图有80%的把握预测该患者的5年复发率为70%。注意,70%这个值有多精确要靠校准图来判断,校准曲线越接近45°线,这个结果越可信】

交叉验证

交叉验证和Bootstrap是防止过度解释当前数据的样本重用方法

Bootstrap 验证

外部验证

交叉验证和Bootstrap不能确保列线图外部适用性。列线图是否适用于新的患者群体是一个比过度拟合更值得关注的问题。

评估指南

步骤6:解释最终的列线图

列线图的有用之处在于,它将预测的概率映射到图形中从0到100分的刻度,各协变量累积的总分数对应着患者的预测概率。它代表了最不重要的变量与最重要的变量相比较的相对重要性。

【笔记:将个协变量的亚变量量化为分数,患者所具备的各亚变量相加后的总分对应概率为预测结果。】

步骤7:应用列线图

临床医生应该理解列线图构建的方法论,这样才能恰当地进行预后评估。

应用列线图之前需要考虑的基本问题


参考文献

END

本公众号致力于打造一个实用的科研干货和临床学习资料分享平台,假如你有临床和科研上的问题或经验分享,请私信我。

感谢阅读,如有错误请指正!

预测模型| 2. Nomogram文献抄读 (2): 如何建立和解读癌症预后列线图相关推荐

  1. 读文献先读图——主成分分析 PCA 图

    上周五彩斑斓的气泡图 有让你眼花缭乱吗? 本周,化繁为简的PCA图 你值得拥有!  数据分析| 科研制图﹒PCA 图 关键词:主成分分析.降维 1665 年的鼠疫 牛顿停课在家提出了万有引力 ; 18 ...

  2. 【第 001 期 · 文献领读】——MRI专题

    第 001 期 · 文献领读 本期目录 胞外磁场标记仿生水凝胶诱导的人间充质干细胞球体与阿魏木糖醇的MRI跟踪 7t MRI蓝斑完整性与帕金森病的冷漠和认知有关 磁共振成像和计算机断层扫描在肺结节检测 ...

  3. 科研入门 | 英文文献怎么读

    我刚开始看英文文献的三大问题:英语不好看不懂,文献好长看不完,文献太难看不懂记不住. 针对这三个问题,提供几个思路. 英语不好 英语不好可以借助翻译软件一段段翻译,单词看的次数多了就认识了,熟能生巧, ...

  4. 【Day27 文献泛读】物体位置与空间关系的心理表征

    阅读文献: 赵民涛. (2006). 物体位置与空间关系的心理表征. 心理科学进展, 14(3), 321-327. 文献链接:物体位置与空间关系的心理表征 摘要 本文从参照框架.朝向特异性.组织结构 ...

  5. 【Day28 文献泛读】人类数字、时间和空间加工的关联性与独立性

    阅读文献: 陈亚林, & 刘昌. (2013). 人类数字.时间和空间加工的关联性与独立性. 科学通报, 58(25), 2622-2630. 文献链接:人类数字.时间和空间加工的关联性与独立 ...

  6. 文献简读——大肠中胰蛋白酶降解共生菌的鉴定【Identification of trypsin-degrading commensals in the large intestine】

    文章目录 闲聊 文章主要内容 标题:Identification of trypsin-degrading commensals in the large intestine Regulation o ...

  7. 【Day16 文献泛读】Do monkeys think in metaphors? Representations of space and time in monkeys and humans

    阅读文献: Merritt, D. J., et al. (2010). "Do monkeys think in metaphors? Representations of space a ...

  8. VRP文献赏读02:Optimization Approaches for the Traveling Salesman Problem with Drone

    目录 摘要赏读 符号描述 问题假设 三类节点 操作Operator 理论分析 今天分享一篇2018年发表在TS上的关于TSPD的研究论文,论文信息如下:

  9. 【Day15 文献泛读】Numerical magnitude affects temporal memories but not time encoding

    阅读文献: Cai, Z. G. and R. Wang (2014). "Numerical magnitude affects temporal memories but not tim ...

  10. 二维小波变换_【外文文献速读】实时二维水波模拟

    题目: Water surface wavelets 作者: Stefan Jeschke, TomášSkřivan, MatthiasMüller-Fischer, Nuttapong Chent ...

最新文章

  1. mysql索引底层实现原理_mysql的索引底层之实现原理
  2. tox.ConfigError: ConfigError: substitution key 'posargs' not found
  3. Android应用安全开发之浅谈加密算法的坑
  4. post传参部分数据丢失
  5. 零压力学python_《零压力学Python》 之 第一章知识点归纳
  6. netcore dapper mysql_.NET Core Dapper操作mysql数据库
  7. PHP读写操作Excel
  8. 新浪微博:大规模离线视频处理系统的架构设计
  9. 【Python CheckiO 题解】Bigger Price
  10. 继续更新,关于MFC琐碎思索
  11. echart折线图删除_用Echart创建简单的折线图
  12. 如何转换并压缩png格式图片
  13. PS完美抠取头发丝----更换证件照背景完美去白边/蓝边/红边-----超实用方法
  14. 智课雅思短语---一、be no exception
  15. mac parallels desk 网络初始化失败
  16. C. Multiples of Length 思维构造
  17. 亚马逊登陆显示服务器出错,Amazon CloudFront常见错误配置及解决方法
  18. php在线加密源代码,2019最新PHP在线云加密平台源码
  19. Abelssoft SSD Fresh Plus 2021 v10.06.31890 固态硬盘性能优化工具中文版
  20. BIM应用(VR\AR\MR)相关设备及软件——来自《中国建筑业BIM应用分析报告(2020)》

热门文章

  1. 堆栈宽度学习Stacked BLS的简单python代码实现
  2. rfc2544_tput_test脚本中增加丢包率功能
  3. SVN工具使用及常用操作命令总结
  4. ug建模和草图切换_从草图到XD,为什么我要切换
  5. linux内核oom,linux下OOM问题排查 互联网技术圈 互联网技术圈
  6. 数据介绍 | 长序列归一化植被指数NDVI
  7. 【JDK】win 10 / win 11:jdk 8 下载、安装、配置、验证
  8. Android WebView基本使用
  9. C#实现在FastReport报表中添加电子图章
  10. 分享一份适合写进简历的软件测试项目