电脑知识与技术(学术交流)
電腦知識與技術(學術交流)
전뇌지식여기술(학술교류)
COMPUTER KNOWLEDGE AND TECHNOLOGY
2007年
16期
1125-1126,1169
,共3页
中心分类法%文本分类%未标识文档%已标识文档
中心分類法%文本分類%未標識文檔%已標識文檔
중심분류법%문본분류%미표식문당%이표식문당
中心分类法性能高效,但需要大量的训练文档(已标识文档)来训练分类器以保证分类的正确性.而训练文档因需花费大量人力物力来分类而数量有限,同时,网络上存在着很多未标识文档.为此,对中心分类法进行改进,提出了ONUC和0FFUC算法,以弥补当训练文档不足时,中心分类法性能急剧下降的缺陷.考虑到中心分类法易受孤立点的影响,采取了去边处理.实验证明,与普通的中心分类法、其它半监督经典算法比较,在训练文档很少的情况下,该算法能获得较好的性能.
中心分類法性能高效,但需要大量的訓練文檔(已標識文檔)來訓練分類器以保證分類的正確性.而訓練文檔因需花費大量人力物力來分類而數量有限,同時,網絡上存在著很多未標識文檔.為此,對中心分類法進行改進,提齣瞭ONUC和0FFUC算法,以瀰補噹訓練文檔不足時,中心分類法性能急劇下降的缺陷.攷慮到中心分類法易受孤立點的影響,採取瞭去邊處理.實驗證明,與普通的中心分類法、其它半鑑督經典算法比較,在訓練文檔很少的情況下,該算法能穫得較好的性能.
중심분류법성능고효,단수요대량적훈련문당(이표식문당)래훈련분류기이보증분류적정학성.이훈련문당인수화비대량인력물력래분류이수량유한,동시,망락상존재착흔다미표식문당.위차,대중심분류법진행개진,제출료ONUC화0FFUC산법,이미보당훈련문당불족시,중심분류법성능급극하강적결함.고필도중심분류법역수고립점적영향,채취료거변처리.실험증명,여보통적중심분류법、기타반감독경전산법비교,재훈련문당흔소적정황하,해산법능획득교호적성능.