计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2012年
7期
260-263,281
,共5页
类中心%文本分类%统计学习
類中心%文本分類%統計學習
류중심%문본분류%통계학습
网页分类中存在类别多、训练样本少等问题,一般分类器训练应用效果不佳.为了解决这个问题,提出基于类中心的统计学习方法.在较少人工标注网页的训练集情况下,此方法能取得很好的分类性能并且大幅度加快训练时间,并可以通过加入网页层次目录信息提升推理速度.在第一届LSHTC评测数据集上进行实验,结果表明:基于类中心的统计学习方法拥有较快的训练以及推理速度,并且在正确率上有很强的竞争力.
網頁分類中存在類彆多、訓練樣本少等問題,一般分類器訓練應用效果不佳.為瞭解決這箇問題,提齣基于類中心的統計學習方法.在較少人工標註網頁的訓練集情況下,此方法能取得很好的分類性能併且大幅度加快訓練時間,併可以通過加入網頁層次目錄信息提升推理速度.在第一屆LSHTC評測數據集上進行實驗,結果錶明:基于類中心的統計學習方法擁有較快的訓練以及推理速度,併且在正確率上有很彊的競爭力.
망혈분류중존재유별다、훈련양본소등문제,일반분류기훈련응용효과불가.위료해결저개문제,제출기우류중심적통계학습방법.재교소인공표주망혈적훈련집정황하,차방법능취득흔호적분류성능병차대폭도가쾌훈련시간,병가이통과가입망혈층차목록신식제승추리속도.재제일계LSHTC평측수거집상진행실험,결과표명:기우류중심적통계학습방법옹유교쾌적훈련이급추리속도,병차재정학솔상유흔강적경쟁력.