计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2005年
12期
2780-2782
,共3页
关键词提取%朴素贝叶斯模型%特征项
關鍵詞提取%樸素貝葉斯模型%特徵項
관건사제취%박소패협사모형%특정항
提出了一种基于朴素贝叶斯模型的中文关键词提取算法.该算法首先通过训练过程获得朴素贝叶斯模型中的各个参数,然后以之为基础,在测试过程完成关键词提取.实验表明,相对于传统的if*idf方法,该算法可从小规模的文档集中提取出更为准确的关键词,而且可灵活地增加表征词语重要性的特征项,因而具有更好的可扩展性.
提齣瞭一種基于樸素貝葉斯模型的中文關鍵詞提取算法.該算法首先通過訓練過程穫得樸素貝葉斯模型中的各箇參數,然後以之為基礎,在測試過程完成關鍵詞提取.實驗錶明,相對于傳統的if*idf方法,該算法可從小規模的文檔集中提取齣更為準確的關鍵詞,而且可靈活地增加錶徵詞語重要性的特徵項,因而具有更好的可擴展性.
제출료일충기우박소패협사모형적중문관건사제취산법.해산법수선통과훈련과정획득박소패협사모형중적각개삼수,연후이지위기출,재측시과정완성관건사제취.실험표명,상대우전통적if*idf방법,해산법가종소규모적문당집중제취출경위준학적관건사,이차가령활지증가표정사어중요성적특정항,인이구유경호적가확전성.