统计与信息论坛
統計與信息論罈
통계여신식론단
STATISTICS & INFORMATION TRIBUNE
2011年
6期
96-101
,共6页
Logistic模型%分类树%信用卡响应率%判别函数
Logistic模型%分類樹%信用卡響應率%判彆函數
Logistic모형%분류수%신용잡향응솔%판별함수
基于信用卡邮寄业务响应率分析来讨论Logistic模型和分类树模型在变量选取上的区别,并尝试从几个不同角度去解释两类模型变量筛选差异的原因.笔者认为没有绝对占优势的方法,需要结合具体场景和模型的特点来选择合适的模型.分类树模型在训练集上容易过度拟合,对单个变量的影响很敏感,在进行危险因素分析时结果更能强调危险因素,对孤立点的识别率很高.Logistic模型容易受到解释变量依存关系的影响,加上分类变量的影响容易过多地选人变量或者因子,对孤立点敏感,对噪点不敏感.判别函数的差异是变量筛选差异的关键因素.
基于信用卡郵寄業務響應率分析來討論Logistic模型和分類樹模型在變量選取上的區彆,併嘗試從幾箇不同角度去解釋兩類模型變量篩選差異的原因.筆者認為沒有絕對佔優勢的方法,需要結閤具體場景和模型的特點來選擇閤適的模型.分類樹模型在訓練集上容易過度擬閤,對單箇變量的影響很敏感,在進行危險因素分析時結果更能彊調危險因素,對孤立點的識彆率很高.Logistic模型容易受到解釋變量依存關繫的影響,加上分類變量的影響容易過多地選人變量或者因子,對孤立點敏感,對譟點不敏感.判彆函數的差異是變量篩選差異的關鍵因素.
기우신용잡유기업무향응솔분석래토론Logistic모형화분류수모형재변량선취상적구별,병상시종궤개불동각도거해석량류모형변량사선차이적원인.필자인위몰유절대점우세적방법,수요결합구체장경화모형적특점래선택합괄적모형.분류수모형재훈련집상용역과도의합,대단개변량적영향흔민감,재진행위험인소분석시결과경능강조위험인소,대고립점적식별솔흔고.Logistic모형용역수도해석변량의존관계적영향,가상분류변량적영향용역과다지선인변량혹자인자,대고립점민감,대조점불민감.판별함수적차이시변량사선차이적관건인소.