江西师范大学学报(自然科学版)
江西師範大學學報(自然科學版)
강서사범대학학보(자연과학판)
JOURNAL OF JIANGXI NORMAL UNIVERSITY(NATURAL SCIENCES EDITION)
2011年
3期
240-245
,共6页
柯丽%王明文%何世柱%黎佳%罗远胜
柯麗%王明文%何世柱%黎佳%囉遠勝
가려%왕명문%하세주%려가%라원성
跨语言%网页分类%频率共现熵%贝叶斯分类%自适应贝叶斯分类
跨語言%網頁分類%頻率共現熵%貝葉斯分類%自適應貝葉斯分類
과어언%망혈분류%빈솔공현적%패협사분류%자괄응패협사분류
研究了基于频率共现熵的跨语言网页自动分类问题,使用翻译软件将所有中文网页翻译为英文,计算中文和英文网页的共现特征频率共现熵值,确定中文和英文网页的共现知识,并与英文网页相结合训练中文分类模型.实验结果表明,该方法与贝叶斯分类模型、向量空间分类模型和信息瓶颈模型相比体现出良好的性能.
研究瞭基于頻率共現熵的跨語言網頁自動分類問題,使用翻譯軟件將所有中文網頁翻譯為英文,計算中文和英文網頁的共現特徵頻率共現熵值,確定中文和英文網頁的共現知識,併與英文網頁相結閤訓練中文分類模型.實驗結果錶明,該方法與貝葉斯分類模型、嚮量空間分類模型和信息瓶頸模型相比體現齣良好的性能.
연구료기우빈솔공현적적과어언망혈자동분류문제,사용번역연건장소유중문망혈번역위영문,계산중문화영문망혈적공현특정빈솔공현적치,학정중문화영문망혈적공현지식,병여영문망혈상결합훈련중문분류모형.실험결과표명,해방법여패협사분류모형、향량공간분류모형화신식병경모형상비체현출량호적성능.