计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2004年
18期
71-73,108
,共4页
虞华%胡卫东%夏胜平%郁文贤
虞華%鬍衛東%夏勝平%鬱文賢
우화%호위동%하성평%욱문현
训练集构造%采样定理%频度函数%重采样%临界子集
訓練集構造%採樣定理%頻度函數%重採樣%臨界子集
훈련집구조%채양정리%빈도함수%중채양%림계자집
训练样本集在模式识别问题中起着重要的作用,它是分类器"知识"的基本来源,直接影响分类器的训练结果和识别系统的综合性能.为了减轻冗余数据对分类器训练和系统维护所带来的负面影响,该文在采样定理的启发下,遵循理想训练样本集所须满足的三个基本性质:遍历性、相容性和致密性,针对大数据量原始样本集,提出了一种基于频度统计重抽样手段构造精简训练样本集的方法.试验表明,该方法能够在保证分类器性能的前提下,有效减少冗余样本,降低计算代价和分类器复杂度.
訓練樣本集在模式識彆問題中起著重要的作用,它是分類器"知識"的基本來源,直接影響分類器的訓練結果和識彆繫統的綜閤性能.為瞭減輕冗餘數據對分類器訓練和繫統維護所帶來的負麵影響,該文在採樣定理的啟髮下,遵循理想訓練樣本集所鬚滿足的三箇基本性質:遍歷性、相容性和緻密性,針對大數據量原始樣本集,提齣瞭一種基于頻度統計重抽樣手段構造精簡訓練樣本集的方法.試驗錶明,該方法能夠在保證分類器性能的前提下,有效減少冗餘樣本,降低計算代價和分類器複雜度.
훈련양본집재모식식별문제중기착중요적작용,타시분류기"지식"적기본래원,직접영향분류기적훈련결과화식별계통적종합성능.위료감경용여수거대분류기훈련화계통유호소대래적부면영향,해문재채양정리적계발하,준순이상훈련양본집소수만족적삼개기본성질:편력성、상용성화치밀성,침대대수거량원시양본집,제출료일충기우빈도통계중추양수단구조정간훈련양본집적방법.시험표명,해방법능구재보증분류기성능적전제하,유효감소용여양본,강저계산대개화분류기복잡도.