山西大同大学学报(自然科学版)
山西大同大學學報(自然科學版)
산서대동대학학보(자연과학판)
JOURNAL OF SHANXI DATONG UNIVERSITY(NATURAL SCIENCE EDITION)
2014年
1期
4-7
,共4页
聚类%FIHC%知网%语义相似度
聚類%FIHC%知網%語義相似度
취류%FIHC%지망%어의상사도
针对FIHC文本聚类算法基于频繁词集实现聚类而未考虑词语间潜在语义联系的缺陷,对FIHC算法进行了有效改进.通过把基于知网的语义相似度计算方法归并到FIHC的Score函数中,有效的改善了score函数单纯的基于向量空间模型的不足.通过实现证明,改进后的FIHC算法明显的提高了聚类质量.
針對FIHC文本聚類算法基于頻繁詞集實現聚類而未攷慮詞語間潛在語義聯繫的缺陷,對FIHC算法進行瞭有效改進.通過把基于知網的語義相似度計算方法歸併到FIHC的Score函數中,有效的改善瞭score函數單純的基于嚮量空間模型的不足.通過實現證明,改進後的FIHC算法明顯的提高瞭聚類質量.
침대FIHC문본취류산법기우빈번사집실현취류이미고필사어간잠재어의련계적결함,대FIHC산법진행료유효개진.통과파기우지망적어의상사도계산방법귀병도FIHC적Score함수중,유효적개선료score함수단순적기우향량공간모형적불족.통과실현증명,개진후적FIHC산법명현적제고료취류질량.