| 癌症生存分析
对于癌症生存率的数据以及对相关的预后的分析是评价癌症治疗程序、监测地区和国家癌症控制常用的定量工具。在本章里,将举例说明最常用的生存率方法学、定义基本的术语,并且还描述了数据收集和报告的重要部分。虽然基本的原则在癌症登记处得到的典型数据和从临床试验或者实验室试验中获得的数据上都可以适用,但讨论的焦点会集中在基于前者的描述数据的生存率分析而不是基于后者的研究数据的分析。统计学原理和方法学的讨论将会有所限制。对统计学基础或者研究应用感兴趣的人可以参考教科书来详细地钻研这些题目(Cox and Oakes,1984; Fleming and Harrington, 1991; Kalbfleisch and Pentice, 1980; Kleinbaum, 1996; Lee, 1992)。
基本概念
生存率是一个统计学指标,概括了一组患者在一个特定时间点上的特定预后的可能发生频率。生存曲线是生存率随时间变化的概要形式。基本的概念很简单。例如,对某一类别的患者,可能有人会问在经过一段时间,例如,五年后还可能生存的比例。生存的比例越大,方法就越有效。但是,生存分析比其第一次出现时略有些复杂。对于选定的患者组中的每个患者,如果要计算诊断到死亡之间的时间长度,或者记录从上次观察以后的生活情况,必须引入描述组内生存的量,即一段时间后调查得到的生存比例。但是,这个简单的计算只有在所有患者观察相同的时间长度时才是有意义的。
在大多数实际情况中,不是组内的每个成员都经过相同时间的观察。在研究期末诊断的患者在最后一次随访时更可能存活,随访的时间相比那些较早诊断的患者较短。即使对于这些患者不可能像其他人随访那么长时间,他们最终的生存率也证实可能会更长。另外一个问题就是在开始时通常不可能知道组中所有患者的预后情况。搬家或者改变姓名的人都会失随。这些人有些可能已经死亡,有些可能还活着。因此,如果要用生存率准确地描述全组的预后情况,必须有一些方法来解决组内不同的人观察时间长短不同的情况,以及在分析时不清楚他们生存的情况。在生存分析的术语中,一直随访到达观察终点(例如死亡)的那些人叫做未经审查的病例,生存期超过随访期或者在某一时间点上失随的人被定义为经过检查的病例。
能够确定整个组的生存(包括未经审查的和经过检查的病例)情况的两个基本方法为生存量表法(Berkson和Gage,1950)和Kaplan-Meier法(Kaplan和Meier,1958)。生存量表法是第一种广泛用来描述癌症生存结果的方法,由于保险公司中的保险统计师所做的工作与之有相似性,所以它一直被认为是一种保险统计方法。特定的计算方法,指生存量表法或者Kaplan-Meier法,应该经常注意避免因为较少使用精确术语而造成的混淆。不同方法计算的率不能直接比较,当把不同患者群的生存经验进行比较时,不同的率必须使用相同的方法计算。
本章中的图示所用数据是由国立癌症研究所流行病学和最终结果(SEER)项目监管局的公用文件中获得的。病例的选择是从选定的地方和诊断的年度的总病例数中随机抽样1%。这些患者的随访持续到1999年底。因此,对于早期的患者,可以有长达16年的随访,但是对于在研究末期诊断的患者,可能只有1年的随访期。这些数据都被使用,因为它们都是真实的,是符合实际的生存率情况的,而且包括一部分可能在单独的肿瘤登记处许多年才可以看见的病例。图表只是用于举例说明方法学。从1973~1997年的SEER的结果在其他地方有更详细的记录(Ries et al.,2000),这些图示不应该被认为是对美国乳腺癌或者肺癌生存总数或当前数目的合适说明。
生存量表法
生存量表法涉及到把观察组的总周期按固定间隔划分,通常以月或年划分。对于每个时间间隔,到间隔末期的生存比例以间隔内到达终点(指死亡)的数值为基数计算,在间期开始时估计有危险的数目。对于随后的每个间期,计算累计的生存率。累计生存率是最近的间期的生存概率乘以所有在此之前的间期的生存概率。因此,如果第一个间期患者生存的百分比为90%,并且第二个和第三个间期内都相同,那么累计生存百分比为72.9%(0.9×0.9×0.9=0.729)。
用生存量表法计算乳腺癌生存率的结果见图2.1所示。在1983~1998年之间诊断的患者有2819例,并随访到1999年。诊断后的每一年都使用生存量表法计算,一年生存率为95.6%,五年累计生存率为76.8%,10年累计生存率为61.0%。肺癌的数据显示的生存情况则有很大不同(图2.2)。诊断后一年的生存率只有41.8%,5年生存率则降到了12.0%,只有6.8%的患者在诊断10年后可以生存。肺癌患者的中位生存期为10.0个月。中位生存期是半数患者经历终点事件,另一半患者没有事件发生所需的时间。如果累计生存率没有下降到50%以下,那么就不可能从数据总估计中位生存期,这正如乳腺癌数据的实例所示。
在乳腺癌的例子中,10年生存率是很重要的,因为很大比例的患者在诊断5年后仍然存活。肺癌患者的10年生存率就没有那么大的意义了,因为还没有经过那么长时间大部分的患者就已经死亡了。
所有的生存率统计方法的一个重要前提就是经过检查的病例与未经审查的病例没有任何可能影响其生存情况的系统差别。例如,如果图2.1中诊断较近的病例(即那些最可能还没有死亡的病例)比未经审查的病例趋向于检测出更早期的疾病;或者如果经过不同的治疗后,检查和未检查病例将不符合比较的前提,并且整个组的结果会不准确。因此,对于包括在生存量表分析内的患者,很重要的一点就是必须有足够的理由确信可得到的生存信息的差别不会引起生存情况的改变。
Kaplan-Meier法
可以使用KAPLAN-MEIER法(Kaplan和Meier,1958)对相同的数据进行分析。它与生存量表法类似,但是可以在死亡发生的每个时间点计算生存比例,而不是在固定的时间间期内。生存曲线的主要区别是累计生存率在诊断时间的横轴上独立的间期内呈阶梯式改变。
患者、疾病和治疗的特异性的生存
虽然整个组的生存率是知道的,但是两组患者的总体生存率比较经常被其差别(他们的肿瘤或者接受的治疗)所混淆。例如,用图2.1表示的总体生存率与其他诊断为更晚期的乳腺癌患者(生存期可能更短)进行对比可能会使人误解。计算组间可能存在的差别的最简单的方法是提供患者、疾病或者治疗等可能影响结果的特异性生存结果。在大多数癌症应用中,细分生存结果的最重要的可变量为疾病的分期。图2.3显示的是前面提到的特定分期的相同的乳腺癌患者的5年生存曲线。这些数据显示乳腺癌患者的生存期根据其诊断时疾病的分期有显著差异。
几乎任何变量都可以对生存率进行细分,但是有一些更有意义的变量。例如,我们可以提供诊断季节特异性(即春、夏、秋、冬)的生存率,但是诊断的季节可能与乳腺癌患者的生存期长短没有生物学上的关联性。另一方面,图2.4和图2.5显示的人种特异性和分期特异性的生存率说明这些变量都与乳腺癌的生存期相关。白种人的发病率最高,非洲裔美国人最低。在年龄方面的数据显示只有最老的患者的生存期较短,考虑到岁数较大的患者的其他死亡因素,相应做些调整是有帮助的。
虽然影响每种癌症生存率的因素可能是单一的,但是对于特定的癌症类型,生存情况的基本描述需包括期别、年龄以及种族特异性生存结果已经成为常规。治疗是一种通常用来细分生存结果的因素,但是必须谨记:治疗的选择通常与其他影响生存的因素相关。例如,癌症治疗的选择通常依赖于疾病的分期。
调整生存率
图示的生存率包括所有死亡,而没有考虑死因。这即为观测生存率。虽然观测生存率是患者群总体死亡率的真实反应,但是我们感兴趣的只是归于所研究疾病的死亡率。调整生存率是除外特殊原因(即癌症)死亡的患者占最初的患者群的比例(如果没有其他死因)。无论何时,当有可靠的信息证明死亡原因时,可以对所研究疾病之外的死因做出调整。在观察治疗的患者中,由其他疾病死亡的患者要完成调整。
如果调整生存率是根据肺癌计算出的,这个生存率模式在观察生存率和调整生存率之间的差别很小,因为肺癌常常是确诊患者的直接死因。如果疾病有着很好的生存模式,比如乳腺癌,患者可以长期存活,从而可以死于各种其他死因,在这种情况下,调整生存率将高于观察生存率,并将给出更清晰的在研究中诊断的特定效应。调整生存率可以由生存量表或Kaplan-Meier结果得出。
相对生存率
导致死亡的原因的信息有时是不可知的或是不可靠的。在这样一个形势下,不可能去计算一个调整生存率。但是,在研究中是可以部分地调整死于其他危险因素而非疾病本身的差异的,这由所谓的相对生存率可以完成,即针对一个普通人群,观察生存率与与其生存率的比值,与具有相似的种族、性别和年龄特征的患者人群是相似的。这个相对生存率的计算方法由Ederer、Axtell以及Cutler(1961)等人描述的。
相对生存率代表了这样一种可能性,即患者有时并不在某个特定时期死于他先前所被诊断的癌症相关的因素。它往往大于相同的患者群体的观察生存率。如果这个群体足够的大,以致能大致地代表总的美国人群(考虑种族、性别和年龄),那么相对生存率对于估计研究中未死于特定癌症的概率是颇为有用的。但是,如果导致死因的确切信息不可知,那么就须优先使用调整生存率。如果这个组比较小,或者患者大部分是从总人群中一个特定的社会经济学部分中选出的话,这将尤其正确。相对生存率可以由生存量表或Kaplan-Meier结果得出。
回归方法
对特定患者、疾病和治疗类别进行分析,是关于生存率的多因素研究的最简单的一种方法。然而这个方法的局限性在于人群的因素分类可以是非常广泛的。这个方法使得它不能在一个可变范围衡量这些不同因素的效果。在癌症研究中有很多区间变量的例子,比如,阳性淋巴结的数目、细胞计数以及实验室标记值。如果这个患者人群在每个值域上进行划分,那么在这些分析中,将只有很少一部分是有意义的。另外,如果考虑了多个因素的话,那么,研究结果的曲线图表就提供了太多的比较,使得说明这些因素的效果时非常困难。
传统的多因素回归分析调查了多个可变因素在单个输出上的效果关联,但是它不能处理。因为这个原因,又发展了其他的一些统计方法,用以评估在生存时间与多个同时效的变量之间的关系。其中最为普遍应用的就是Cox几率均衡回归模型(Cox,1972)。这个模型提供了对生存分布的多重共变因素,包括观察检测的影响的评估。共变性是与生存率相关的多因素研究。在Cox几率均衡回归模型中,共变性可能分为类别差异如种族、测量区间如年龄,或者实验室检查的值。
这些方法的一些特殊类型就超出了这个章节的范围。幸运的是,计算机上应用的很多软件包,使得统计学家们可以方便地使用这些方法。尽管从生存率的多元分析中可以获得很多有用的信息,但是它们往往也需要对生存率曲线的形状以及共变性的效应进行很多附加的假设。我们必须要经常进行检查相对于这个假设而定的模型的正确性。
生存率的标准误
生存率的这个概念原本是用以描述患者这样一种特殊的群体的,但现在也经常在大样本人群的描述中使用。这个真实人群的生存率亦被提及,而且作为一个大样本人群的一个抽样样本进行研究。如果计算来自同个母体样本的另一个抽样样本的生存率,那么这个结果不太可能是一样的,则这两个样本之间的差别称之为抽样变异(机会变异或样本误差)。而标准误则是衡量抽样变异对于生存率的计算结果的影响程度。在相同的观察条件下进行重复观察,则真实生存率或者总体生存率将有95%的概率是落在我们计算出的生存率的两个标准误区间内的。该区间称之为95%的可信区间。
比较患者群体的生存率
在比较两个患者群体的生存率时,观察到的统计显著差异是颇为有趣的。最基本的一个问题就是:所观察到的差异有多大的概率是偶然发生的。而标准误则很简单地回答了这个问题。如果在95%的可信区间内,两个生存率并不重复,那么,所得到的差异通常是有统计学上的显著差异的,也就是说,不太可能是偶然发生的。
有时会发生这样一种情况,即两个群体在每个随访期的生存率比较中,并无显著差异,但是当考虑其整体的生存率曲线时,则每个时期的不显著的差异将汇总成一个显著的差异。对于整体差异的一个最为普遍的统计学检验就是时序检验(log rank test)。这个检验均等地衡量了整个随访期的差异效应,在大多数情况下是一个合适的选择。而其他的一些检验,其衡量差异是根据处于不同的时刻的危险因素下的人数而定的,根据其在随访期间死亡的发生更早或更晚而有不同。
在解释检验的统计学显著差异时必须要予以注意。比如,在比较两个治疗组时,患者和疾病的特征存在差异时,那么在生存率上的显著差异,很有可能反映的是这两组患者特征的差异,而不是治疗方法的有效性的差异。更为精确的方法是进行随机对照的临床试验进行治疗的评估,从而确保量治疗组的患者特征和疾病特征具有可比性。
确定研究开始的时间
决定患者生存期的开始时间取决于研究的目的。比如,在研究一个特定癌症的自然进程时,定义研究的开始时间会参考首发症状的出现时间。在评估治疗的效果时,可采用不同的参考时期。这些日期包括:(1)诊断日期;(2)首次就诊日期;(3)入院日期;(4)首次治疗日期。如果要研究肿瘤完全缓解期到再度复发的时间,则将肿瘤的缓解起始时间作为研究的开始时间。而特殊的参考时间则将在每份报告中加以清楚的指明。
治疗的起始时间可以作为评估治疗的开始时间。对于未经治疗的患者,最具可比性的日期为给予与肿瘤不直接相关的治疗的日期。对所有治疗的和未经治疗的患者,根据上述时间所计算的生存率,均符合癌症的起始分期。
生存信息
在任何给定的时间,每位患者的存活状态均被定义为存活、死亡及未知(或失访)。而其研究的终末点则分为:(1)指定的终止事件如死亡;(2)存活至研究结束;(3)失访。在每种情况下,观察随访的时间为从研究开始日期到终止事件、研究终点或失访日期。在观察随访中,在研究终末点时,应该更进一步地描述患者的状况,如:
存活,无瘤,无复发
存活,无瘤,复发后
存活,有持续的、复发的或转移的病灶
存活,带瘤(原发灶)
死亡,带瘤(原发、复发或转移)
死亡,术后
未知,失访
在任何生存率试验的研究中,随访的结束都是非常重要的,因为即使是一小部分的患者的失访,也会导致结果的不准确或偏差。如果假定那些失访者在研究结束时都存活的话,则在计算时便得到最大的生存率。而如果假定这些失访者在研究结束时都死亡的话,那么,计算得到的将是最小生存率。
时间间隔
总的生存时间经常以周、月和年作为单元来计算。根据这些时间间隔绘制的生存率曲线,反映了特定时期的生存率的动态变化。时间间隔的选择一般是通过考虑了疾病自然进程后再行确定的。如果疾病有个很长的自然病史,那么,研究的持续时间一般选择5~20年,而以6~12个月作为时间间隔,则也可为动态生存率曲线提供足够的描述了。但如果研究对象的预后相当差(如食管癌和胰腺癌),那么总的研究持续时间可能只有2~3年,则生存间隔采用的时间间隔应该是1~3个月。在说明生存率时,我们必须要考虑处于存活时间间隔的个体数目。
概要
本章节回顾了生存率分析的基本原理,这些原理经常应用于癌症的登记数据。而更复杂的数据分析和研究假设的探索,则需要远多于此处所涉及的知识和专业技能。现在,在很多不同的数据登记管理机构,都能自动地进行生存分析,统计分析项目可以在个人计算机上进行。对那些允许进入该研究项目的人员,我们鼓励他们从不同的方面入手,根据生存分析提供的癌症登记数据进行研究,以证实他们自己的见解。
|