大家好,这里是SEER数据库专栏布汉堂。
全浩文学介绍|令人惊讶的是,SEER数据还展现出“新瓶装旧酒”的“噱头”。文章开头,我们分享SEER数据【New Bottle】以及常用的统计分析方法。 【老酒】临床研究“崩盘”后会发生什么?它带来什么味道?
预后研究中的经典统计分析方法包括Kaplan-Meier 生存曲线、对数秩检验和cox 回归。用这些方法分析后,得到了积极的结果,是不是可以呢?
然而,对于医生来说,能够预测患者是否会实现特定的结果将改变许多医疗实践模式或临床决策。
例如,如果我们能够预测患者在手术过程中可能会出现大量出血,我们就会在手术过程中谨慎行事,并为患者提供足够的血液制品。
显然,上述统计分析方法已经不能满足日益增长的临床应用需求。此时,为了方便临床应用,研究人员往往对不同预测因子的值赋予不同的分数,最终的累积分数是根据特定事件的概率,即分数-概率对照表,即分数临床干预和治疗,将高危组和低危组分类是当今的临床预测模型。
临床预测模型,也称为临床预测规则、风险预测模型、预测模型或风险评分,是指使用数学公式来估计特定个体当前患有特定疾病或将出现特定结果的概率将来。未来。临床预测模型包括诊断模型和预后模型。
目前,基于SEER数据库发表的论文中,临床预后模型是主流。
预后模型关注当前的健康状况(健康或疾病)以及未来发生的特定结果(发病率、复发、死亡、残疾和并发症)的概率,并且大多出现在队列研究中。
简单来说,就是根据模型中各影响因素对结果变量的贡献(回归系数的大小),建立多因素回归模型(常用的如Cox回归),对因素进行评分。
然后将个体得分相加得到总分,最后通过总分与结果事件概率之间的函数变换关系计算出个体结果事件的预测值。
今天我们将分析将SEER 数据与临床预后模型相结合的例程。
分享发表在ADVANCES IN THERAPY 2023 (IF=3.845) 上的题为“Prognostic Nomogram for Total Survival in Students with Small Cell Lung Cancer Treated with Chemotherapy : SEER-Based Retrospective Cohort Study”的文章。--- SEER 数据库预测模型文章。
文章中宏观因素分析
正如标题所示,研究类型是“预后研究”,人群是“接受化疗的小细胞肺癌患者”,预测变量Y 是“总生存期(OS)”。
研究对象(P):2004年至2015年间诊断为病理性小细胞肺癌的患者,所有患者均接受化疗
结果指标(O):总生存期(OS)
研究类型:回顾性队列研究
研究目的:接受化疗的小细胞肺癌患者的“定制”预后列线图。
背景
小细胞肺癌(SCLC)具有临床进展快、预后差的特点。尽管对初始治疗的反应较高,但大多数SCLC 患者最终会产生耐药性,5 年生存率低于7%。
除TNM分期系统外,SCLC的分期始终遵循退伍军人管理局肺部研究组(VALG)的两阶段分期方法。分为局限性小细胞肺癌(LD-SCLC)和广泛性小细胞肺癌。广泛性疾病小细胞肺癌(ED-SCLC)。
限制性阶段:阶段I 至III(T 任意、N 任意、M0)。
扩展阶段:IV 阶段(T 全部、N 全部、M1a/b)。
研究流程图
该研究共纳入了2004 年至2015 年期间的7,865 名小细胞肺癌患者。通过设定排除标准,最终纳入4971例分期明确的小细胞肺癌患者,所有患者均接受化疗。
。由于局限期(limited stage ,LS)和广泛期(extensive-stage,ES)的小细胞癌患者诊疗模式和预后差异悬殊,该研究采用相同的研究方法分别构建了局限期(LD-SCLC)和广泛期(ED-SCLC)两个预后诺莫图(nomogram)。
纳入标准
①2004年至2015年间经病理证实的小细胞肺癌;
②接受过化疗的患者。
排除标准
①人口统计学信息不完整,如婚姻状况、年龄、性别、种族;
②临床病理信息不完整,如肿瘤大小、肿瘤分期(TNM-stage)、肿瘤分级;
③手术和放射治疗信息不完整;
④生存状态和随访数据缺失。
红色框内显示的是局限期(LD-SCLC)这一人群基线资料分布。
我们可以看到,研究纳入的变量包括:年龄、性别、种族、婚姻状态、T分期、N分期、M分期、分级、肿瘤大小、偏侧、原发肿瘤部位手术治疗(SPS)和放射治疗。
人群:4971例小细胞肺癌
以局限期(LD-SCLC)这一人群为例,和大家梳理一下文章的分析思路
分组:按7:3的比例将1759例局限期(LD-SCLC)患者随机分成训练集(n = 1232例)和验证集(n=527)。
总生存期(Overall Survival,OS):从癌症诊断之日到登记处报告的死亡日期之间的时间间隔。
训练集(Training set)
进入单变量COX比例风险回归模型的变量有:种族、年龄、性别、婚姻状况、T分期、N分期、肿瘤分级、肿瘤大小、肿瘤偏侧性、原发肿瘤部位手术治疗(SPS)和放射治疗。
下图展示的是常规Cox回归结果的森林图。主要体现了变量、病例数、HR值和P值。
比如:年龄这一变量,分成了<60岁和>=60岁两组,296例患者年龄小于<60岁,936例患者年龄>=60岁。中间竖的虚线是无效线,代表HR值等于1。
文章结果解读:
在本研究中,年龄以<60岁组作为参考(reference),>=60岁组位于无效线右侧,说明与<60岁组相比,>=60岁组有助于事件(这里特指死亡事件)发生,是预后不良因素。
多因素Cox回归分析进一步证实年龄、N分期、放射治疗是影响局限期(LD-SCLC)患者OS的独立预后因素。
基于多因素COX回归的结果,除了发现影响局限期(LD-SCLC)患者OS的独立预后因素之外,还可以用来构建临床预后模型。
这个时候需要提到COX回归结果中一个参数,即回归系数(regression coefficients,coef),有时也叫做beta值,它和风险比(hazard ratio,HR)之间的关系是:
exp(coef)=HR
coef值小于0说明HR值小于1,说明变量是预后有利因素;
coef值大于0说明HR值大于1,说明变量是预后不良因素。
临床预后模型中计算的风险评分,就是根据多因素COX回归分组中各个影响因素对结局变量的贡献程度(回归系数的大小),给每个影响因素的每个取值水平进行评分,然后再将各个评分相加得到总评分:
Risk score = coefX1×X1+coefX2×X2.....coefXn×Xn
coefX1代表第1个变量的回归系数,X1代表第一个变量的赋值,coefXn代表第n个变量的回归系数。
但是在临床应用中,诺莫图(nomogram)在实现结果可视化方面明显优于上述公式。
如下图,通过计算与每个变量相对应的评分累加得到总评分,来预测N局限期(LD-SCLC)患者1、2、3年的生存概率。
文章结果解读:
如果患者具有以下特征(图中红色圆点和红色实线):
年龄>=60岁+原发肿瘤部位接受过手术治疗(SPS:YES)+N0+放射治疗(Radiotherapy:None/unknown),总评分1.22,那么该患者生存时间<12个月的概率是32.3%,该患者生存时间<24个月的概率是58.7%,该患者生存时间<36个月的概率是70.2%。
模型评估:这篇文章建立的预测模型,从区分度、校准度、临床适用度这3个维度进行了预测模型的评估。
区分度:时间依赖性ROC
ROC曲线常用来评估某个因素/某个模型预测结局发生的准确性。
准确来说,是评估某个方法/某个模型将结局事件判别为发生/不发生的能力,也就是判别能力(区分度);
因为生存资料的结果涉及生存状态和生存时间两个变量,所有不能用常规ROC曲线。
采用时间依赖性ROC更加适合,可以评估这个模型预测不同时间点结局发生的情况。
文章结果解读:
时间依赖的ROC曲线中,LS-SCLC患者的曲线下面积(AUC)分别为1年(0.89)、2年(0.81)和3年(0.79),表明该预测模型预测1、2、3年的预后结局都具有较好的判别能力。
校准度:校准曲线(calibration plot),反映预测模型对患者OS的预测与实际观察之间的一致性
图的横坐标是预测概率:用预测模型对事件发生的可能性(Probability)进行预测,0到1表示发生事件可能性是0到100%。
纵坐标是实际概率:患者实际的事件发生率。
虚线线是拟合线,表示预测值对应的实际值。
如果预测值=实际值,则蓝色实线与参考线(虚线)完全重合;
如果预测值>实际值,即高估了风险,则蓝色实线在虚线上面;
如果预测值<实际值,即低估了风险,则蓝色实线在虚线上面;
文章结果解读:
校准曲线(calibration plot):1、2、3年总生存率校准曲线与理想的斜率为1的直线拟合良好,提示预测模型预测值和实际值之间具有较好的一致性。
临床适用度:决策曲线分析(decision curve analysis,DCA)
建立好预测模型之后,我们已经采用了时间依赖性ROC计算得到AUC,从数据上肯定了模型的判别能力。
而在临床上,还需要考虑患者通过这个模型的使用是否可以受益。因为在临床工作中,如果不用预测模型对患者的情况进行评估,那么会出现2种极端的情况。
一是,所有患者都不接受额外干预,那患者不会有额外获益,是一种自然情况;
二是,所有患者都预估为“会发生结局”,此时都接受额外的干预,那么此时医疗系统需要付出“成本”,而部分患者也会因此“获益”。
此时,决策曲线分析(decision curve analysis,DCA)将很好地评估我们使用这个预测模型的临床获益是否大于两种“极端情况”,如下图。
y 轴代表的是净收益,x轴代表的是阈值概率,在DCA中,两条实线代表了两种极端的情况,分别是:
代表Treat none黑色线条:未使用预测模型,所有患者不进行额外干预,净获益为0。
代表Treat all斜的黑色实线:未使用预测模型,所有患者都进行干预,净获益是个斜率为负值的反斜线。
当然我们也可以简单粗暴的看这张图,只要模型 A 和模型 B 在两条实线的外侧就说明这个模型在临床上是值得被应用的。
文章结果解读:
将预测模型的临床净收益与TNM分期系统进行了比较,预后诺莫图的净收益大于“全(All)”或“无(None)”以及TNM分期3个场景中的净收益。
对于2个及2个以上模型的DCA曲线比较,比如本文的TNM分期,代表预后诺莫图这条虚线离这两条实线和TNM分期这条虚线越远,说明其有应用的价值。
基于每个小细胞肺癌患者的风险评分建立风险分类系统(risk classification system),局限期(LD-SCLC)分成高危组(High risk)(n=229)和低危组(Low risk)(n=298),绘制绘制Kaplan-Meier曲线。
Kaplan-Meier曲线直观地表现出两组的生存率。因为生存数据往往都是非正态分布,因此常搭配log-rank检验进行统计推断。
两组的log-rank检验p值<0.0001,说明低危组(Low risk)相对高危组(High risk)可以减少死亡风险,提高生存时间,且差异具有显著性。
之后就采用验证集(Validation set)进行预测模型的内部验证,分析方法和上面的一致的。
通过模块的拆解,分析了临床预测模型构建和评估的最原始方式。
包含了基于多因素COX回归构建临床预测模型,诺莫图(nomogram)进行结果的可视化,接着进行预测模型评估,分别从区分度、校准度、临床适用度这3个维度进行分析。
临床预测模型已经被我们揭开了神秘的面纱,像个娇羞的花儿,那么接下来,应该?
临床预测模型:翻我,翻我牌子,快来学习~
参考文献
1.谷鸿秋, 周支瑞, 章仲恒,等. 临床预测模型:基本概念、应用场景及研究思路[J]. 中国循证心血管医学杂志, 2018, 10(12):4.
2.Gu Hongqiu, Wang Junfeng, Zhang Zhongheng,等. 临床预测模型:模型的建立[J]. 中国循证心血管医学杂志, 2019, 011(001):14-16,23.
3.Wang Junfeng, Zhang Zhongheng, Zhou Zhirui,等. 临床预测模型:模型的验证[J]. 中国循证心血管医学杂志, 2019, 11(2):4.
4.《临床预测模型构建方法学》