郑州大学学报(医学版)
鄭州大學學報(醫學版)
정주대학학보(의학판)
JOURNAL OF ZHENGZHOU UNIVERSITY(MEDICAL SCIENCES)
2012年
3期
315-318
,共4页
花琳琳%施念%杨永利%赵天仪%施学忠
花琳琳%施唸%楊永利%趙天儀%施學忠
화림림%시념%양영리%조천의%시학충
连续变量%缺失值%随机缺失
連續變量%缺失值%隨機缺失
련속변량%결실치%수궤결실
目的:比较不同的缺失值处理方法处理随机缺失数据的效果.方法:以HIV/AIDS血液样本血红蛋白、白细胞和血尿素氮检测数据为基础,利用SAS 9.1,分别模拟完整数据集和不同缺失率的数据集,从精确度、准确度和分布三方面比较不同方法对缺失数据集的处理效果.结果:任意缺失比例下血红蛋白和白细胞数据经不同的方法处理后与完整数据集比较差异无统计学意义.不同缺失比例下,多重填补(MI)法的精确度最高.缺失率10%~20%时,MI法填充后的准确度最高.缺失率30%时,成组删除法处理后的准确度最高.缺失40%以上时,准确度填充效果不稳定.不同缺失比例下,回归法、成组删除法和MI填充2次后的数据的分布特征与完整数据集一致.结论:数据缺失10%~20%时,MI法填充效果最好;缺失30%时,成组删除法处理效果最好;缺失40%以上时,所有方法填充效果均不佳.
目的:比較不同的缺失值處理方法處理隨機缺失數據的效果.方法:以HIV/AIDS血液樣本血紅蛋白、白細胞和血尿素氮檢測數據為基礎,利用SAS 9.1,分彆模擬完整數據集和不同缺失率的數據集,從精確度、準確度和分佈三方麵比較不同方法對缺失數據集的處理效果.結果:任意缺失比例下血紅蛋白和白細胞數據經不同的方法處理後與完整數據集比較差異無統計學意義.不同缺失比例下,多重填補(MI)法的精確度最高.缺失率10%~20%時,MI法填充後的準確度最高.缺失率30%時,成組刪除法處理後的準確度最高.缺失40%以上時,準確度填充效果不穩定.不同缺失比例下,迴歸法、成組刪除法和MI填充2次後的數據的分佈特徵與完整數據集一緻.結論:數據缺失10%~20%時,MI法填充效果最好;缺失30%時,成組刪除法處理效果最好;缺失40%以上時,所有方法填充效果均不佳.
목적:비교불동적결실치처리방법처리수궤결실수거적효과.방법:이HIV/AIDS혈액양본혈홍단백、백세포화혈뇨소담검측수거위기출,이용SAS 9.1,분별모의완정수거집화불동결실솔적수거집,종정학도、준학도화분포삼방면비교불동방법대결실수거집적처리효과.결과:임의결실비례하혈홍단백화백세포수거경불동적방법처리후여완정수거집비교차이무통계학의의.불동결실비례하,다중전보(MI)법적정학도최고.결실솔10%~20%시,MI법전충후적준학도최고.결실솔30%시,성조산제법처리후적준학도최고.결실40%이상시,준학도전충효과불은정.불동결실비례하,회귀법、성조산제법화MI전충2차후적수거적분포특정여완정수거집일치.결론:수거결실10%~20%시,MI법전충효과최호;결실30%시,성조산제법처리효과최호;결실40%이상시,소유방법전충효과균불가.