兵工学报
兵工學報
병공학보
ACTA ARMAMENTARII
2010年
9期
1222-1227
,共6页
曹建军%刁兴春%杜鹢%王芳潇%张潇毅
曹建軍%刁興春%杜鹢%王芳瀟%張瀟毅
조건군%조흥춘%두익%왕방소%장소의
信息处理技术%数据清洗%相似重复记录%蚁群算法%特征选择%支持向量机
信息處理技術%數據清洗%相似重複記錄%蟻群算法%特徵選擇%支持嚮量機
신식처리기술%수거청세%상사중복기록%의군산법%특정선택%지지향량궤
为实现相似重复记录的检测,提出一种基于蚁群算法特征选择的分类检测方法.将相似重复记录检测看成二分类问题,定义了字符串型、枚举型和日期型3种典型属性类型的相似特征和归一化算法,以两记录的相似特征向量作为分类器的输入进行检测;建立了以召回率、准确率和特征规模综合最优的特征选择多目标优化模型,并根据问题特点将多目标模型转化为单目标模型,应用蚁群算法设计了模型求解算法.最后,用欧氏距离分类法和支持向量机2种分类器验证了该方法的有效性.
為實現相似重複記錄的檢測,提齣一種基于蟻群算法特徵選擇的分類檢測方法.將相似重複記錄檢測看成二分類問題,定義瞭字符串型、枚舉型和日期型3種典型屬性類型的相似特徵和歸一化算法,以兩記錄的相似特徵嚮量作為分類器的輸入進行檢測;建立瞭以召迴率、準確率和特徵規模綜閤最優的特徵選擇多目標優化模型,併根據問題特點將多目標模型轉化為單目標模型,應用蟻群算法設計瞭模型求解算法.最後,用歐氏距離分類法和支持嚮量機2種分類器驗證瞭該方法的有效性.
위실현상사중복기록적검측,제출일충기우의군산법특정선택적분류검측방법.장상사중복기록검측간성이분류문제,정의료자부천형、매거형화일기형3충전형속성류형적상사특정화귀일화산법,이량기록적상사특정향량작위분류기적수입진행검측;건립료이소회솔、준학솔화특정규모종합최우적특정선택다목표우화모형,병근거문제특점장다목표모형전화위단목표모형,응용의군산법설계료모형구해산법.최후,용구씨거리분류법화지지향량궤2충분류기험증료해방법적유효성.