搜索
您的当前位置:首页具有一致相关的纵向数据模型中方差和相关系数的齐性检验下

具有一致相关的纵向数据模型中方差和相关系数的齐性检验下

来源:小侦探旅游网
具有一致相关的纵向数据模型中方差和相关系数的齐性检验(下)

范俊花 林金官 韦博成

2013-1-14 16:46:18 来源:《应用概率统计》(沪)2009年1期第12~26页

(三)相关系数和方差齐性的联合检验

现在考虑一般情形,一致相关系数和方差都有可能是变异的,因此可将它们联合参数化为(7)和(11)。正如Zhang and Weiss[19]所述,为避免参数繁冗,我们假定γ作为所有异方差或非齐相关系数的共同参数,即在(7)和(11)中采用同样的参数γ。于是,与前两小节情形一样,方差齐性和相关系数齐性的联合检验亦可化为假设检验问题(8)。

四、相关性和方差齐性的联合检验

正如Tsai[13]指出的,在时间序列数据中,相关性和异方差性可能同时发生,因此有必要同时检验模型的一致相关和异方差的存

在性,即检验是否有。Tsai[13]讨论了非重复测量数据的线性回归模型的异方差和自相关的存在性检验;韦博成和胡跃

清[14]将Tsai[13]的结论推广到非线性回归模型;林金官和韦博成[1]将其推广到误差为一阶自相关的非线性纵向数据模型。本节将其推广到具有一致相关

五、应用实例

葡萄糖数据葡萄糖数据是由美国科罗拉多州医疗中心大学小儿科临床研究病房提供,Zerbe[15]将其作为成长曲线数据讨论其随机化检验,Chi and Reisel[16]为此数据建立具有AR(1)误差的随机效应纵向数据模型,Pan and Fang[17]将数据作为成长曲线数据建立模型并进行了诊断分析。该数据通过对13个控制病人和20个肥胖病人测试其标准葡萄糖忍耐力。实验过程为:让这33个病人服用葡萄糖,分别在0,0.5,1,1.5,2,3,4,5小时后测试其血样。这是一个典型的与时间有关的纵向数据,实验目的是为研究比较控制组的病人和肥胖组的病人是否有显著区别。我们采用其13个控制病人的数据来进行研究,对于此数据集,应用下列线性纵向数据模型进行拟合与分析:

表1情形(1)和(4)的参数估计及其标准误

表2情形(2),(3)和(5)的参数估计及其标准误

利用前述结果,计算出各检验的score统计量的值,列于表3。

由表3可知,葡萄糖数据具有明显的一致相关结构,且方差和一致相关系数具有显著齐性。

根据Vonesh and Chinchilli[8],在正态假设下,模型的选择可用AIC(Akaike's information criterion)和SBC(Schwarz's Basesian information criterion)来判断。我们各自计算出它们的AIC和SBC,其结果列在表4中。从该表中,可以看出情形(1)和(4)协方差结构的AIC和SBC是最小的;因此,情形(1)和(4)之协方差结构是五种协方差结构中较好的协方差结构,这与前面的诊断结果是相当一致的。

表3异方差或自相关系数的齐性检验

表4葡萄糖数据的AIC和SBC

六、功效模拟

本节研究下列情形的模拟功效:(1)方差齐性时的一致相关系数的存在性检验;(2)一致相关系数齐性时方基齐性的检验;(3)方差齐性和一致相关系数存在性的联合检验;(4)方差和一致相关系数齐性的联合检验。为此我们考虑下列具有一致相关协方差结构的线性纵向数据模型:

(5)选择若干m和n,对每一个γ值;重复模拟1000次。

图2为一致相关系数齐性时异方差检验的功效模拟图;图3为一致相关系数和方差齐性的联合检验功效模拟图。从图中可看出,在原假设

成立时,检验的功效在0.05附近,说明检验是好的。当,|γ|增加时,检验功效迅速增加。图形关于γ几乎是

对称的。还可以看出检验(2)和(4)在中小样本时,即可得到理想功效。

图2一致相关系数齐性时异方差检验的功效模拟图

图3一致相关系数和方差齐性检验的功效模拟图

(三)情形(3)具体模拟过程

表5自相关性和异方差同时检验的模拟结果

七、结论及进一步的问题

对于一致相关系数和异方差的检验问题,由于score检验只需计算原假设条件下的估计,所以被广泛使用。在前面几节,关于一致相关协方差结构我们推导出检验一致相关系数和异方差的五个score检验统计量。通过实例说明这些检验与以前的其它方法(比如AIC和SBC)可保持统一。随机模拟又说明检验与样本量大小密切相关,我们所作模拟均在中样本时就有比较好的模拟功效,到大样本

时效果更加好。本文理论均可推广到非线性情形。

参考文献:

[1]林金官,韦博成.非线性纵向数据模型中方差和自相关系数的齐性检验.应用数学学报,27(3)(2004),466-480.

[2]Diggle, P. J., Heagerty, P., Liang, K. -Y. and Zeger, S. L.. Analysis of Longitudinal data, New York, Oxford University Press, 2002.

[3]Pinheiro, J. C. and Bates, D. M., Mixed-Effcts Models in S and S-PLUS, New York, Springer-Verlag,2000.

[4]Laird, N. M. and Ware, J. H., Random-effects models for longitudinal data, Biometrics, 38 (4)(1982),963-974.

[5]林金官,韦博成.非线性纵向数据模型中自相关性和随机效应的存在性检验.应用数学,17(1)(2004),42-48.

[6]林金官,韦博成.非线性随机效应模型的异方差性检验.系统科学与数学,22(2)(2002),245-256.

[7]Wolfinger, R. D., Heterogeneous variance-covriance structures for repeated measures, Journal of Agricultural, Biological and Enviromental Statistics, 1 (2) (1995), 205-230.

[8]Cook, R. D. and Weisberg, S., Diagnostic for heteroscedastidty in regression, Biometrika, 70 (1983), 1-10. [9]

[10]Cox, D. R. and Hinldey D. V., TheoreticalStatisties, London, Chapman and Hall, 1974.

[11]韦博成,鲁国斌,史建清.统计诊断引论,南京,东南大学出版社,1991.

[12]Vonesh, E. F. and Carter, R. L., Mixed-effects nonlinear models regression for unbalanced repeated measures,

, V. and Zimmerman, D. L., Modelling nonstationary longitudinal data, Biometrics, 56 (2000),699-705.

Biometrics, 48 (1992), 1-17.

[13]Tsai, C. L., Score test for the first-order autoregressive model with heteroscedasticity, Biometrika, 73 (1986),455-460.

[14]韦博成,胡跃清.非线性回归模型相关性和异方差性的检验.工程数学学报,4(1994),1-12.

[15]Zerbe, G. O., Randomization analysis of the completely randomized design extended to growth and response curves, Journal of the American Statistical Association, 74 (1979), 215-221.

[16]Chi, E. M. and Reinsel, G. C., Models for longitudinal data with random effects and AR (1) errors, Journal of the American Statistical Association, 84 (1989), 452-459.

[17]Pan, J. X. and Fang, K. T., Growth Curve Models and Statistical Diagnostics, New York, Springer-Vedeg,2002.

[18]Vonesh, E. F. and Chinchilli, V. M., Linear and Nonlinear Models for the Analysis of Repeated Measurements, New York: Marcal Dekker, Inc., 1997, 262-264.

[19]Zhang F. and Weiss, R. E., Diagnosing explainable heterogeneity of variance in random-effects models, Canad. J. Statust, 28 (2000), 3-18.

因篇幅问题不能全部显示,请点此查看更多更全内容

Top