关键词:
生存分析
医疗成本
核函数
多项式回归
变系数
摘要:
在医疗费用研究中,研究者需要使用适当的方法来评估一个病人一生中的平均医疗费用,由于删失机制,生存函数通常是不可识别的.除了删失机制,数据通常包括纵向结果、时间相关/无关的协变量和事件时间.在纵向研究中,受试者在一组不同的时间点重复观察,直到终端事件时间点为止.
联合模型包含一个纵向子模型用来表示随时间变化的协变量对纵向测量的影响,以及一个生存子模型,来表达生存函数与纵向部分的关联.与时间无关的协变量由于没有重复测量,通常存在于生存子模型中.目标数据包括变量Y(t),X(t),Z(t),W,T,C和δ.T为终端事件时间,C为删失事件时间,δ为删失指示器,{Y(t),t≥0}为患者的状态历史过程,它依赖于时间相关协变量向量X(t)、Z(t)和时间无关协变量向量W.对任意的i=1,...,m,Ti、Ci,i=1,...,m表示第i个观测对象的真实事件时间.yi(t),zi(t),xi(t),ωi表示第i个观测对象在时间点t对Y(t),Z(t),X(t),W,i=1,2,...,m的观测值.经典的联合模型一般可以描述为(?)其中β是固定效应系数向量,α是纵向结果到危险事件的效应,h0(t)是基线危险函数,εi(t)是随机误差,且εi(t)~N(0,σ2).
然而纵向子模型中采用的固定参数回归方法通常假设协变量与患者的状态函数之间是线性关系,且协变量的效应回归系数是固定的.在本论文中,我们使用不同的联合模型,提出了四种新的用来估计医疗费用的方法.分别为:联合模型的半参数估计、时变系数联合模型的核光滑估计、时变系数联合模型的多项式逼近估计和联合模型的参数族估计.
对于联合模型的半参数估计,我们修改了联合模型的一个半参数估计的均值,引入含时间变量的医疗费用函数,使其能够描述纵向变量与时间单位之间的非线性关系,从而使它能够描述纵向变量和观测时间点之间的潜在关系.半参数模型描述为(?)用多项式逼近方法模拟含时间变量的医疗费用函数,可得出纵向过程中的参数和非参部分的函数的估计值,采用Kaplan-Meier方法估计生存子模型,可以得到一个光滑的医疗费用均值函数.理论证明提出的医疗费用均值函数具有相合性.数值模拟与实证分析表明,与传统的联合模型相比,非参数部分描述了医疗成本的自然对数与时间单位的动态关系,且精确地给出了随时间变化的医疗成本的自然对数的变化轨迹.
时变效应系数模型扩展了参数方法,捕捉随时间变化的协变量效应的动态轨迹,从而得到医疗费用随时间变化的精确过程.现有的研究中,有学者在纵向过程中考虑基于核函数光滑的时变效应系数.然而在联合模型中采用核光滑方法估计医疗费用不仅需要考虑数据的删失,更要将连续的纵向过程与生存子模型结合得到时间无关协变量效应系数和关联效应系数.时变系数模型描述为(?)其中β(t)是时变效应系数.基于核函数光滑的时变系数联合模型估计方法将核方法与逆概率加权法相结合,对不同观测时间点的纵向数据进行加权,可以得到医疗费用的光滑函数.得到的时变效应系数具有渐近正态性,且提出的均值医疗费用函数估计量具有相合性.数值模拟表明,时变系数模型中的时变效应系数估计量接近真实值,且均值状态函数v(t)以及累积均值变量μ(t)的真实曲线和拟合曲线几乎重合.真实数据集分析的结果表明,变系数模型的参数更准确地描述了协变量随时间变化对状态函数的影响,例如来自多中心自动除颤器植入实验的数据集中β5(t)的估计量显示,早期阶段社区服务会影响医疗费用的状态函数,但在某个时间点之后,社区服务不产生医疗费用.与传统的联合模型估计和半参数联合模型估计相比,基于时变效应系数模型方法得到的累积均值医疗费用拟合点的结果表现出相似的趋势,然而均值状态函数的估计不再只是一条具有可观测斜率的直线,而是显示了更多随时间的波动,详细地显示了累积均值函数随时间的变化.
与核光滑方法相比,时变系数联合模型的多项式近似估计用一系列幂基函数的线性组合来拟合β(t),它简化了计算.假设β(t)=ηB(t),其中η=(η0,…,η(k+K)),B(t)=[1,t,…,tk,(t-т1)+k,…,(t-тK)+k]T.数值模拟结果表明,当β(t)设置为幂函数的线性组合时,多项式回归方法并不明显区别于核函数光滑法.然而,当β(t)被设置为三角函数时,多项式回归方法不适用于β(t)的估计.因此,局部多项式回归方法适用于在信息已知时变效应系数是幂基函数的情况下,可以简化计算.而核光滑方法则适用于拟合其他复杂的函数.
参数化族的联合模型假设对于每个给定的t∈R,g(t,xi(t))用有限参数个数的参数函数族g(t,x(t)|β)近似.当模型有过去的经验作为参考时,选择适当的参数函数可以使模型效率更高.数值模拟结果表明,使用参数化族的联合模型得到的时间无关协变量系数的估计结果优于传统的