中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2011年
4期
20-23
,共4页
胥桂仙%向春丞%翁彧%赵小兵%杨国胜
胥桂仙%嚮春丞%翁彧%趙小兵%楊國勝
서계선%향춘승%옹욱%조소병%양국성
藏文信息处理%文本分类%藏文网页分类
藏文信息處理%文本分類%藏文網頁分類
장문신식처리%문본분류%장문망혈분류
该文提出了一种简单、快速的藏文网页文本分类方法.该方法利用网页栏目中词条的类别特征,结合网页文本提取技术,实现了快速、精确地将藏文网页文本归于预定义类别中.实验表明,该方法具有很高的网页文本分类正确率,对构建高质量多类别藏文语料库有重要作用.
該文提齣瞭一種簡單、快速的藏文網頁文本分類方法.該方法利用網頁欄目中詞條的類彆特徵,結閤網頁文本提取技術,實現瞭快速、精確地將藏文網頁文本歸于預定義類彆中.實驗錶明,該方法具有很高的網頁文本分類正確率,對構建高質量多類彆藏文語料庫有重要作用.
해문제출료일충간단、쾌속적장문망혈문본분류방법.해방법이용망혈란목중사조적유별특정,결합망혈문본제취기술,실현료쾌속、정학지장장문망혈문본귀우예정의유별중.실험표명,해방법구유흔고적망혈문본분류정학솔,대구건고질량다유별장문어료고유중요작용.