计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2014年
7期
247-253
,共7页
云计算%关键词提取%文本分类%语义计算%网络传输代价%中文文本语义
雲計算%關鍵詞提取%文本分類%語義計算%網絡傳輸代價%中文文本語義
운계산%관건사제취%문본분류%어의계산%망락전수대개%중문문본어의
cloud computing%keyword extraction%text classification%semantic calculation%communication cost of network%Chinese text semantic
传统语义文本分类方法难以高效地在云计算环境下进行中文文本快速分类。为解决该问题,提出一个在云计算环境下基于语义关键词提取的分布式中文文本自适应分类算法,在代理端对中文文本关键词进行基于语义的分布式提取,并将提取出的中文关键词传输到中心数据库端进行整合,从而确定文本本身类别。通过理论证明在关键词提取数量足够的情况下,提出的文本分类算法可以在保证中文文本分类效果的前提下,有效降低网络传输的代价,从而提高中文文本分类算法在云计算环境下的性能。实验结果验证了该算法在云计算环境下的可行性以及理论推导的正确性。
傳統語義文本分類方法難以高效地在雲計算環境下進行中文文本快速分類。為解決該問題,提齣一箇在雲計算環境下基于語義關鍵詞提取的分佈式中文文本自適應分類算法,在代理耑對中文文本關鍵詞進行基于語義的分佈式提取,併將提取齣的中文關鍵詞傳輸到中心數據庫耑進行整閤,從而確定文本本身類彆。通過理論證明在關鍵詞提取數量足夠的情況下,提齣的文本分類算法可以在保證中文文本分類效果的前提下,有效降低網絡傳輸的代價,從而提高中文文本分類算法在雲計算環境下的性能。實驗結果驗證瞭該算法在雲計算環境下的可行性以及理論推導的正確性。
전통어의문본분류방법난이고효지재운계산배경하진행중문문본쾌속분류。위해결해문제,제출일개재운계산배경하기우어의관건사제취적분포식중문문본자괄응분류산법,재대리단대중문문본관건사진행기우어의적분포식제취,병장제취출적중문관건사전수도중심수거고단진행정합,종이학정문본본신유별。통과이론증명재관건사제취수량족구적정황하,제출적문본분류산법가이재보증중문문본분류효과적전제하,유효강저망락전수적대개,종이제고중문문본분류산법재운계산배경하적성능。실험결과험증료해산법재운계산배경하적가행성이급이론추도적정학성。
Aiming to problem of the traditional text semantic classify algorithm cannot efficiently classify Chinese text under cloud computing situation, a distribution Chinese text classification algorithm based on keyword under cloud computing situation is presented, using method of distribution extracting keyword in agent-side and merging the keyword in the master database side to classify Chinese text into different kinds. Though the theoretical derivation, under enough keywords extracted situation, the algorithm can ensure the result of text classification and reduce the communication cost of network. The correctness of theoretical derivation and the algorithm is verified by the experiment.