中华流行病学杂志
中華流行病學雜誌
중화류행병학잡지
CHINESE JOURNAL OF EPIDEMIOLOGY
2006年
6期
540-543
,共4页
张勇晶%陈坤%金明娟%范春红
張勇晶%陳坤%金明娟%範春紅
장용정%진곤%금명연%범춘홍
分类树模型%乳腺肿瘤%危险因素%卡方自动交互检测法
分類樹模型%乳腺腫瘤%危險因素%卡方自動交互檢測法
분류수모형%유선종류%위험인소%잡방자동교호검측법
目的介绍分类树模型筛选恶性肿瘤危险因素基本原理、运算法则和应用价值.方法以浙江省嘉善县乳腺癌现场调查数据为例,采用Exhaustive CHAID法建立分类树模型对调查结果进行危险因素筛选,使用错分概率Risk值和ROC曲线下面积对模型进行评价.结果分类树模型从全部105个候选变量中筛选出9个危险因素,其中职业是最重要的影响因素,工人、教师及退休人员的乳腺癌发生概率显著高于其他人员.另外,模型显示经常参加体育锻炼在不同人群中对乳腺癌的影响效果有所不同.模型错分概率Risk值为0.174,利用预测概率绘制的ROC曲线下面积为0.872,与0.5比较具有显著的统计学意义,模型拟合效果很好.结论分类树模型不仅可以有效挖掘筛选出主要的影响因素,还可以对研究变量科学定义分界点,展示变量间复杂的相互作用,在流行病学研究中具有较高的应用价值.
目的介紹分類樹模型篩選噁性腫瘤危險因素基本原理、運算法則和應用價值.方法以浙江省嘉善縣乳腺癌現場調查數據為例,採用Exhaustive CHAID法建立分類樹模型對調查結果進行危險因素篩選,使用錯分概率Risk值和ROC麯線下麵積對模型進行評價.結果分類樹模型從全部105箇候選變量中篩選齣9箇危險因素,其中職業是最重要的影響因素,工人、教師及退休人員的乳腺癌髮生概率顯著高于其他人員.另外,模型顯示經常參加體育鍛煉在不同人群中對乳腺癌的影響效果有所不同.模型錯分概率Risk值為0.174,利用預測概率繪製的ROC麯線下麵積為0.872,與0.5比較具有顯著的統計學意義,模型擬閤效果很好.結論分類樹模型不僅可以有效挖掘篩選齣主要的影響因素,還可以對研究變量科學定義分界點,展示變量間複雜的相互作用,在流行病學研究中具有較高的應用價值.
목적개소분류수모형사선악성종류위험인소기본원리、운산법칙화응용개치.방법이절강성가선현유선암현장조사수거위례,채용Exhaustive CHAID법건립분류수모형대조사결과진행위험인소사선,사용착분개솔Risk치화ROC곡선하면적대모형진행평개.결과분류수모형종전부105개후선변량중사선출9개위험인소,기중직업시최중요적영향인소,공인、교사급퇴휴인원적유선암발생개솔현저고우기타인원.령외,모형현시경상삼가체육단련재불동인군중대유선암적영향효과유소불동.모형착분개솔Risk치위0.174,이용예측개솔회제적ROC곡선하면적위0.872,여0.5비교구유현저적통계학의의,모형의합효과흔호.결론분류수모형불부가이유효알굴사선출주요적영향인소,환가이대연구변량과학정의분계점,전시변량간복잡적상호작용,재류행병학연구중구유교고적응용개치.