情报杂志
情報雜誌
정보잡지
JOURNAL OF INFORMATION
2010年
5期
144-147
,共4页
Web文本分类%向量空间模型%VSM%文本挖掘
Web文本分類%嚮量空間模型%VSM%文本挖掘
Web문본분류%향량공간모형%VSM%문본알굴
Web文本自动分类技术是Web文本挖掘的关键技术之一.针对Web文档中不同标签中的文本具有不同的表达文档内容的能力,提出了改进的特征项加权计算方法.根据特征项在文档中的位置和出现频率计算其权值,并给出了具体的Web文本分类算法和评测方法.经实验验证,改进后系统的微平均查准率均大于0.8,分类性能明显好于改进前.
Web文本自動分類技術是Web文本挖掘的關鍵技術之一.針對Web文檔中不同標籤中的文本具有不同的錶達文檔內容的能力,提齣瞭改進的特徵項加權計算方法.根據特徵項在文檔中的位置和齣現頻率計算其權值,併給齣瞭具體的Web文本分類算法和評測方法.經實驗驗證,改進後繫統的微平均查準率均大于0.8,分類性能明顯好于改進前.
Web문본자동분류기술시Web문본알굴적관건기술지일.침대Web문당중불동표첨중적문본구유불동적표체문당내용적능력,제출료개진적특정항가권계산방법.근거특정항재문당중적위치화출현빈솔계산기권치,병급출료구체적Web문본분류산법화평측방법.경실험험증,개진후계통적미평균사준솔균대우0.8,분류성능명현호우개진전.