科技通报
科技通報
과기통보
BULLETIN OF SCIENCE AND TECHNOLOGY
2014年
4期
179-181
,共3页
灰度散布%分类指导%高类似度文本分类
灰度散佈%分類指導%高類似度文本分類
회도산포%분류지도%고유사도문본분류
distribution of gray level%guidance of classification%high likeness text
提出一种灰度散布分类指导挖掘的高类似度文本分类方法,采用灰度散布分类的思想对海量文本下的数据挖掘进行指导,采用灰度散布分类思想对特征更细分类能力,将相似度高的文本更细的分开,最后采用一组特征接近的随机词汇进行特征分类实验。结果显示,采用基于灰度散布分类指导挖掘方法,使特征类似度很高的文本可以被很好的区分开来,具有广泛的分类应用价值。
提齣一種灰度散佈分類指導挖掘的高類似度文本分類方法,採用灰度散佈分類的思想對海量文本下的數據挖掘進行指導,採用灰度散佈分類思想對特徵更細分類能力,將相似度高的文本更細的分開,最後採用一組特徵接近的隨機詞彙進行特徵分類實驗。結果顯示,採用基于灰度散佈分類指導挖掘方法,使特徵類似度很高的文本可以被很好的區分開來,具有廣汎的分類應用價值。
제출일충회도산포분류지도알굴적고유사도문본분류방법,채용회도산포분류적사상대해량문본하적수거알굴진행지도,채용회도산포분류사상대특정경세분류능력,장상사도고적문본경세적분개,최후채용일조특정접근적수궤사회진행특정분류실험。결과현시,채용기우회도산포분류지도알굴방법,사특정유사도흔고적문본가이피흔호적구분개래,구유엄범적분류응용개치。
A classification of high likeness text with guidance under distribution of gray level was proposed, the distribution of gray level was used to do data mining in mass text, the detailed characteristic was extracted, and the high likeness text was separated. Finally, a team of high likeness text was used to test the effect, and the experiment result shows that the high likeness text can be separated well with guidance under distribution of gray level, so it has good value for separation appli-cation.