Prediction of Graft Dysfunction in Pediatric Liver Transplantation by Logistic Regression

会议:MACISE(MATHEMATICS AND COMPUTERS IN SCIENCE AND ENGINEERING)

目录

数据情况

摘要

引言

材料和方法

A. 二分回归模型

结果与讨论


数据情况

For the purpose of our study, 31 children after LT were examined. The age of the children is between 1 month and 16 years, with 63% of them are under 1 year of age. The gender distribution is 60% female and 40% male. In a larger percentage(85%), transplants are from a living donor.

The  models  were  based  on patient’s data  at the  University  Hospital  “Lozenets”  –Sofia,  Bulgaria.

数据量:

该论文数据来自University  Hospital  “Lozenets”. 观测31个肝移植后儿童指标.(1个月~16岁, 其中63%在一岁以下, 平均年龄3.6岁. 60%女40%男, 超过85%的移植器官来自活体捐赠)

使用指标:

INR第1天(p=0.039)、INR第5天(p=0.039)、pMELD第5天(p=0.019)、pMELD第10天(p=0.017)和冷缺血(p=0.048).

使用对率回归模型原因:

可以预测并发症概率

Because of the possibility of predicting the likelihood of complication, we prefer to use the logistic regression model.

摘要

肝移植(LT)是儿童急、慢性终末期肝病的最后治疗选择。目前,移植后一年内存活率在90-95%以上,五年内存活率在70%以上。术后主要并发症(complications)与移植物功能有关。肝移植术后早期移植物失功(Graft Dysfunction)是导致术后并发症和死亡的重要原因。影响小儿肝移植术后移植物功能的因素很多。

本文目的: 找出危险因素,以帮助预防移植失败。

方法: 单变量和多变量(univariate  and  multivariate)对率回归分析,估计了肝移植术后早期移植物失功的概率。

输入指标: 对率回归模型对术后第1、2、3、5、7、10天的胆红素(bilirubin)、钠(sodium)、肌酸酐(creatinine)、血浆(blood plasma)国际标准化比率(INR)、移植后MELD评分(终末期肝病模型)和冷缺血时间(CIT, cold ischemia time). (将来工作希望加入参数: 血浆维生素D水平)

数据来源: 保加利亚索非亚的洛泽内茨大学医院获得的31名患者的数据

引言

肝移植重要性

自20世纪80年代以来,随着新的免疫抑制剂的引入和外科技术的改进,肝移植在医学界得到了越来越多的关注,肝移植是儿童急慢性终末期肝病的首选治疗方法。目前,LT的适应症已扩大。儿童活体肝移植始于1989年,到1992年已达到90%的成功率。

移植结果影响因素

供者因素(donor factors)、受者的术前状况(the preoperative condition of the recipient)、手术技术(surgical techniques)、术后并发症(postoperative complications)。

[1] J. A.  Graham,  B. Samstein, and  J. C.Emond,  “Early  graft dysfunction in living donor liver transplantation”, Curr Transpl Rep, vol. 1 (1), pp. 43-52, March 2014. 活体捐赠肝移植中的早期移植物失功

获得高质量的移植物对于确保移植后的成功结果至关重要. 术中/术后肝脏受各种潜在损害因素的影响.

移植物功能障碍

即肝功能不佳. 可导致患者死亡或在术后数天内再次移植。在移植后的失功为严重情况,其特点是肝酶升高,胆汁排出困难,以及凝血障碍(elevated  hepatic  enzymes,  difficulties in elimination of bile, and coagulopathy)。其原因通常不清楚,但对于预测结果很重要。

医学研究的目的

确定(代表受体状态stage of the recipient的)量化变量(quantitative variables)与移植肝失功关系

本研究的目的

对于儿童肝移植早期移植物失功, 通过Logistic回归确定并分析(有统计学意义的)预测因素.

材料和方法

检测对象:31名肝移植儿童

年龄分布:1个月-16岁,其中63%的儿童年龄小于1岁

性别分布:女性60%,男性40%

移植物来源:85%为活体捐赠

移植后器官功能影响因素:供体相关(器官提取过程中的冷缺血时间CIT)/受体相关

使用Logistic回归模型原因:可以预测并发症的可能性

移植物功能障碍模型的预测指标predictors (risk factors):

术后第1、2、3、5、7、10天的

血浆胆红素bilirubin (μmol/L), 钠sodium (mEq/L), 肌酐creatinine (μmol/L), prothrombin time of blood coagulation 凝血酶原时间的international normalized ratio (INR)国际标准化比值,post-transplant Model for End-Stage Liver Disease (pMELD) 终末期肝病移植后模型

热缺血和冷缺血时间(minutes)

凝血酶原时间(Prothrombin time,PT)是指凝血酶原转化为凝血酶,导致血浆凝固所需的时间,是反映血浆中凝血因子Ⅰ、Ⅱ、Ⅴ、Ⅶ、Ⅹ活性的指标

MELD评分根据血清肌酐、胆红素和INR得出一个数值,已成功地用于预测等待肝移植的患者的90天死亡率,并已被证明是一种可靠的肝脏分配(liver allocation)方法

MELD评分≥30分的肝移植受者是具有个体高危特征的特定患者亚群,需要密切监测

Liver transplant recipients with MELD score ≥ 30 are a specific subgroup of patients with an individual high- risk profile and they need close monitoring.

仔细观察MELD评分的参数,表面上客观的数据有局限性,应谨慎对待

冷缺血时间CIT(供体参数):从供体肝脏动脉阻断(cross-clamping)到从冷藏液(cold storage solution)中取出器官的时间

【热缺血时间】:器官从供体供血停止到冷灌注(冷保存)开始的这段时间。这一期间对器官的损害最为严重,一般不应超过10分钟

【冷缺血时间】:器官从冷灌注(冷保存)开始到移植后供血开始的这段时间. CIT>13小时与LT后的不良结果相关

模型基于保加利亚索非亚大学医院“Lozenets”的患者数据,数据统计建模软件STATISTICA.

A. 二分回归模型

Dichotomous regression model

对于均为独立连续(independent continuous)变量的各指标, 某并发症(疾病)现象的出现/未出现作为其函数, 该模型描述了其依赖关系.

响应或依赖的二元变量y:

$$ \begin{aligned}   y=\left\{\begin{array}{ll} 1, & 未出现症状 \\ 0, & 出现症状\end{array}\right. \end{aligned} $$

单变量Logistic分析

假设因子x的仿射(affine, 线性)函数的值决定并发症出现的概率P(y=0):

$$ d\left(x, B_{0}, B_{1}\right)=B_{0}+B_{1} x $$

其中x是因子(描述变量),通常,因子x的n个样本观察值已知(此处n=31是患者数量).

B0,B1是要由x和并发症的实验数据估计的系数(coefficient).

对于每种并发症yi,分别考虑yi对每种因素xi的依赖关系. 利用极大似然估计法得B0和B1的估计记为b0和b1. 如果响应y不依赖于(或弱依赖)x,则B1=0.

多元Logistic分析

假设出现并发症的概率P(y=0)取决于具有N个分量的向量参数的仿射函数,即d(X,B),其中:

$$ X=\left(x_{1}, x_{2}, \ldots, x_{N}\right), B=\left(B_{0}, B_{1}, \ldots, B_{N}\right) $$

X的元素是因子(独立的解释变量),由实验数据决定. 每个元素都有n个观测值.

同时考虑所有因子xi的影响, 如果输出值y不依赖(或弱依赖)因子x_K(k=1,2,…,N),则相应的系数B_K为零

用似然法统计分析得系数B_0、…、B_n的估计b0、b1、…、bn

该二分回归模型中,假设:

$$ P(X, B)=\frac{\exp (d(X, B))}{(1+\exp (d(X, B)))}\\ =\frac {e^{\boldsymbol w^{\top}\boldsymbol x+b}}{1+e^{\boldsymbol w^{\top}\boldsymbol x+b}} $$

其中exp为指数函数.

P(X,B)是向量X的Logistic函数, 参数B固定. (N=1时,点(X1,P(X1,B))形成对率曲线(Logistic curve),N=2时,点(X1,X2,P(X1,X2,P(X1,X2,B))构成对率曲面.对于N>2,对应的点集是N维变量.)

通常使用Newton-Raphson迭代获得系数B0,B1,…,Bn的似然估计。

该二分模型响应值的几率为:

$$ odds =P(d(X, B)) /(1+P(d(X, B))) $$

模型中使用Logit变换的一个重要优势为,它是解释变量的线性函数:

$$ Log ~ odds=d=B_{0}+B_{1} X_{1}+\ldots+B_{N} X_{N} $$

与多元线性回归模型系数含义不同,系数向量\( b=\left(b_{0,} b_{l}, \ldots, b_{N}\right) \):

1. 系数b1,...,bn为对数几率的估计

2. \( X_{K} \)的元素增加一个单位(unit), 则系数\( b_{K},(K=1,...,N) \)数量d增加

3. 几率估计的置信区间(confidence intervals) 计算: 取对数几率的渐近(asymptotic)置信区间的上端点和下端点的指数

关于回归参数的假设检验包括: 单参数检验, 同一回归的多参数检验, 涉及不同回归的参数的联合检验.

多元Logistic回归为第二种检验,通常采用大样本Wald检验(large sample Wald test),检验统计量近似分布为N个自由度的卡方分布, 检验时p<0.05.

单变量分析univariate analysis (当y依赖于x)重要特征-概率P=1/2时的因子x的值:

$$ x^{*}=-b_{0} / b_{1}  $$

该值对应于概率曲线的拐点.

结果与讨论

对31名患者(平均年龄3.6岁)构建的Logistic模型预测移植物功能障碍. (术后第1、2、3、5、7、10天的胆红素(bilirubin)、钠(sodium)、肌酸酐(creatinine)、血浆(blood plasma)国际标准化比率(INR)、移植后MELD评分(终末期肝病模型)和冷缺血时间(CIT, cold ischemia time))

先构建单变量Logistic模型, 选出单变量分析中有相关性高的解释变量加入多变量分析.采用Wald‘s检验进行单因素分析,筛选出5个有统计学意义的预测因子:INR第1天(p=0.039)、INR第5天(p=0.039)、pMELD第5天(p=0.019)、pMELD第10天(p=0.017)和冷缺血(p=0.048).

所得术后第1天INR的Logistic函数如图1所示:

图1: 术后第1天凝血酶原时间国际标准化比率INR因子水平(蓝点), 估计的未出现移植肾功能障碍的概率函数(红线)

术后第1天INR的负相关模型参数b1=-1.4105表明,INR越高,未出现移植物功能障碍的概率越低(INR越低越好). 如图1所示,如果INR第一天=4,则无功能障碍的概率为0.25; 对应于概率1/2的临界点横坐标为x*=4.5462/1.4105=3.223. (临界点对应于移植物功能障碍的概率1/2)

所得术后第5天INR的Logistic函数如图2所示:

图2: 术后第5天凝血酶原时间国际标准化比率INR因子水平(蓝点), 估计的未出现移植肾功能障碍的概率函数(红线)

参数b1=-5.6126<0,临界点x*=11.9916/5.6126=2.13.

术后第5天终末期肝病模型pMELD的Logistic函数估计值如图3:

图3: 术后第5天终末期肝病模型因子水平(蓝点), 估计的未出现移植肾功能障碍的概率函数(红线)

参数b1=-0.4105<0

pMELD术后第10天的概率函数形状相似,b1=-0.2623. 术后第5天的临界点为x*=6.428/0.4105=15.66,术后第10天的临界点为x*=5.8244/0.2623=22.205(见图4)

图4: 术后第10天终末期肝病模型因子水平(蓝点), 估计的未出现移植肾功能障碍的概率函数(红线)

CIT的参数b1=-0.0058<0,临界点x*=3.0626/0.0058=528min(8.8小时).

这个模型预测CIT=780min(13小时)的发生移植物失功概率:

$$ \begin{aligned} P &=\frac {e^{\boldsymbol w^{\top}\boldsymbol x+b}}{1+e^{\boldsymbol w^{\top}\boldsymbol x+b}}\\ & =\exp (3.0626-0.0058 * 780) /(1+\\ &+\exp (3.0626-0.0058 * 780))=0.1883 \end{aligned}  $$

为19%左右, 与医学文献中的其他发现一致[1-4].

这5个因素作为多因素Logistic回归分析的探索性变量, 所得参数,p-levels和相应临界点如表1:

未来打算寻找血浆维生素D水平与移植物功能障碍之间的关系。维生素D活化的第一步发生在肝脏,因此维生素D的合成与肝功能密切相关。然而,维生素D的免疫调节作用所需的血浆水平仍不清楚. 希望将其作为预测指标.

肝移植笔记1:论文阅读-对率回归预测移植物失功概率相关推荐

  1. 肝移植笔记2:论文阅读-肝移植辅助决策研究

    摘要 目标:预测分类问题 难点:肝移植的样本数据集很小而特征空间很大.机器学习方法用于小样本,特征空间很大的医疗数据集时存在着预测准确率低,精确率和召回率不高等问题 方法:对北京某医院提供的医疗数据, ...

  2. 笔记:论文阅读 Enriched Feature Guided Refinement Network for Object Detection

    面向目标检测的丰富特征引导细化网络 摘要 提出一个单阶段检测框架,该框架解决了多尺度目标检测和类不平衡的问题. 没有设计更深层网络,而是引入一种简单而有效的特征丰富化方案来生成多尺度的上下文特征. 进 ...

  3. 目标追踪与定位学习笔记10-SiamMOT论文阅读

    阅读论文SiamMOT网络 我现在的问题: 问题描述: 给定一个目标进行跟踪,注意观察到人物的遮挡.进入人群中或者视角变化等因素下 SiamMOT专注于改进局部跟踪,在轨迹不可见的情况下也能向前跟踪, ...

  4. [机械臂笔记001]论文阅读-StructDiffusion: Object-Centric Diffusion for Semantic Rearrangement of Novel Objects

    0. 资源 本篇论文的官网(包含简介和PDF文件,但代码还未上传):StructDiffusion 1. 内容和结论 简介和结论 工作环境中,机器人需要根据语义排列对象,这些对象可能是机器人不认识的 ...

  5. [论文阅读] (17)CCS2019 针对PowerShell脚本的轻量级去混淆和语义感知攻击检测(经典)

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  6. [论文阅读] (22)图神经网络及认知推理总结和普及-清华唐杰老师

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  7. 论文阅读:DuEE:A Large-Scale Dataset for Chinese Event Extraction in Real-World Scenarios(附数据集地址)

    论文阅读:DuEE:A Large-Scale Dataset for Chinese Event Extraction in Real-World Scenarios 基于现实场景的大规模中文事件抽 ...

  8. [论文阅读] (23)恶意代码作者溯源(去匿名化)经典论文阅读:二进制和源代码对比

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  9. [论文阅读] (26) 基于Excel可视化分析的论文实验图表绘制总结——以电影市场为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  10. [论文阅读] (20)USENIXSec21 DeepReflect:通过二进制重构发现恶意行为(恶意代码ROI分析经典)

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

最新文章

  1. Java中判断List中是否有重复元素
  2. linux7.0ftp,Linux(Centos7)搭建FTP服务
  3. Java 内存泄露总结
  4. 刷题向》一道逆向思维题(BZOJ1046)(NORMAL)
  5. PWN-PRACTICE-BUUCTF-17
  6. 数字电子技术课程设计之基于触发器的三位二进制同步减法计数器无效态000/110
  7. oracle util_mail,Oracle UTL_MAIL邮件包程序使用实践
  8. WebStorm笔记-配置js的webpack识别alias(别名)
  9. 理论基础 —— 队列
  10. 支付宝集五福下周一开始;iPhone 面世 13 周年;Laravel 6.10.0 发布 | 极客头条
  11. web.xml 配置 contextConfigLocation
  12. 分段式多级离心泵_D型卧式多级泵结构组成及工作原理
  13. 关于NSOperation的几个常见问题
  14. redis演练(1) 搭建redis服务
  15. 林锐——我的大学十年
  16. 法务管理项目结项了mark一下
  17. 视频教程-QT教程--入门实战视频精讲-C/C++
  18. 计算机更新后打印机无法使用,升级win10系统后无法使用HP打印机的官方解决方案...
  19. vs code python插件_vs code Python code runner配置 , 飞跃|Fly
  20. jquery表格插件jqgrid

热门文章

  1. rhel6.5 oracle12c,中标麒麟Linux6.5安装Oracle12C配置过程
  2. docker学习--数据卷
  3. 微信扫一扫下载apk 微信直接下载APK(APP)的解决方案
  4. (HG模块,简洁明了)Hourglass Module介绍
  5. 前端程序员应该理解的reduce方法,对你的js能力很有帮助
  6. SICP中关于兑换零钱的练习
  7. 排序算法--选择篇(简单选择,树形选择,堆排序)
  8. 英雄联盟服务器维护时间是多久,英雄联盟更新维护到几点今天? LOL10月15日停机维护多久几点开服...
  9. 方舟官方服务器怎么不显示伤害,方舟生存进化官服怎么显示伤害
  10. 国内有哪些小众但很有意思的网站?这6个网站值得收藏