中国卫生统计
中國衛生統計
중국위생통계
CHINESE JOURNAL OF HEALTH STATISTICS
2010年
6期
562-566
,共5页
logistic回归模型%共线性%偏最小二乘%主成分
logistic迴歸模型%共線性%偏最小二乘%主成分
logistic회귀모형%공선성%편최소이승%주성분
目的 logistic回归模型中解释变量存在共线性的情形下,比较联合式偏最小二乘logistic回归(IPLSLR),耦合式偏最小二乘logistic回归(CPLSLR)和主成分logistic回归(PCLR)三种降维方法所得到的回归系数估计的偏差和稳定性.方法 运用Monte Carlo随机法,采用SAS软件编程,模拟估算不同共线性情形下三种降维方法所得到的回归系数估计均值及标准差.结果 简单共线性情形下,IPLSLR与CPLSLR回归系数估计的偏差较小,PCLR估计则相对稳定.多重共线性情形下,当样本量较大时,若共线性较高,IPLSLR,CPLSLR和PCLR均获得偏差较小、稳定性较好的回归系数估计;若共线性较低,PCLR且回归系数估计的偏差明显大于IPLSLR和CPLSLR.当样本量较小时,IPLSLR与CPLSLR在回归系数估计偏差和稳定性方面互有优劣.结论 应根据共线性的程度和样本量的大小决定使用相应的降维方法用于处理logistic回归模型中共线性情况.通过对三种降维方法不足的分析,提出了进一步改进的原则.
目的 logistic迴歸模型中解釋變量存在共線性的情形下,比較聯閤式偏最小二乘logistic迴歸(IPLSLR),耦閤式偏最小二乘logistic迴歸(CPLSLR)和主成分logistic迴歸(PCLR)三種降維方法所得到的迴歸繫數估計的偏差和穩定性.方法 運用Monte Carlo隨機法,採用SAS軟件編程,模擬估算不同共線性情形下三種降維方法所得到的迴歸繫數估計均值及標準差.結果 簡單共線性情形下,IPLSLR與CPLSLR迴歸繫數估計的偏差較小,PCLR估計則相對穩定.多重共線性情形下,噹樣本量較大時,若共線性較高,IPLSLR,CPLSLR和PCLR均穫得偏差較小、穩定性較好的迴歸繫數估計;若共線性較低,PCLR且迴歸繫數估計的偏差明顯大于IPLSLR和CPLSLR.噹樣本量較小時,IPLSLR與CPLSLR在迴歸繫數估計偏差和穩定性方麵互有優劣.結論 應根據共線性的程度和樣本量的大小決定使用相應的降維方法用于處理logistic迴歸模型中共線性情況.通過對三種降維方法不足的分析,提齣瞭進一步改進的原則.
목적 logistic회귀모형중해석변량존재공선성적정형하,비교연합식편최소이승logistic회귀(IPLSLR),우합식편최소이승logistic회귀(CPLSLR)화주성분logistic회귀(PCLR)삼충강유방법소득도적회귀계수고계적편차화은정성.방법 운용Monte Carlo수궤법,채용SAS연건편정,모의고산불동공선성정형하삼충강유방법소득도적회귀계수고계균치급표준차.결과 간단공선성정형하,IPLSLR여CPLSLR회귀계수고계적편차교소,PCLR고계칙상대은정.다중공선성정형하,당양본량교대시,약공선성교고,IPLSLR,CPLSLR화PCLR균획득편차교소、은정성교호적회귀계수고계;약공선성교저,PCLR차회귀계수고계적편차명현대우IPLSLR화CPLSLR.당양본량교소시,IPLSLR여CPLSLR재회귀계수고계편차화은정성방면호유우렬.결론 응근거공선성적정도화양본량적대소결정사용상응적강유방법용우처리logistic회귀모형중공선성정황.통과대삼충강유방법불족적분석,제출료진일보개진적원칙.