计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2013年
z2期
208-215
,共8页
涂鼎%陈岭%陈根才%吴勇%王敬昌
塗鼎%陳嶺%陳根纔%吳勇%王敬昌
도정%진령%진근재%오용%왕경창
概念分类%WordNet%层次聚类%文本挖掘%本体评价
概唸分類%WordNet%層次聚類%文本挖掘%本體評價
개념분류%WordNet%층차취류%문본알굴%본체평개
concept taxonomy%WordNet%hierarchical clustering%text mining%ontology evaluation
针对基于传统层次聚类构建概念分类只能生成二叉树形式结果的限制,提出一种新的评论集概念分类构建方法.首先,使用主题模型对评论集进行描述,选出评论集中最具代表性的主题词作为候选概念词.接着,使用WordNet提取概念词间的语义关系,并计算概念词间的语义距离.最后,对概念词进行多路层次聚类,生成概念分类.此外,还提出一种新的概念分类构建性能评价标准,并使用该标准在用户评论数据集上将提出方法与基本层次聚类方法进行了比较,结果表明使用多路层次聚类的方法能够获得与目标概念分类更高的相似度.
針對基于傳統層次聚類構建概唸分類隻能生成二扠樹形式結果的限製,提齣一種新的評論集概唸分類構建方法.首先,使用主題模型對評論集進行描述,選齣評論集中最具代錶性的主題詞作為候選概唸詞.接著,使用WordNet提取概唸詞間的語義關繫,併計算概唸詞間的語義距離.最後,對概唸詞進行多路層次聚類,生成概唸分類.此外,還提齣一種新的概唸分類構建性能評價標準,併使用該標準在用戶評論數據集上將提齣方法與基本層次聚類方法進行瞭比較,結果錶明使用多路層次聚類的方法能夠穫得與目標概唸分類更高的相似度.
침대기우전통층차취류구건개념분류지능생성이차수형식결과적한제,제출일충신적평론집개념분류구건방법.수선,사용주제모형대평론집진행묘술,선출평론집중최구대표성적주제사작위후선개념사.접착,사용WordNet제취개념사간적어의관계,병계산개념사간적어의거리.최후,대개념사진행다로층차취류,생성개념분류.차외,환제출일충신적개념분류구건성능평개표준,병사용해표준재용호평론수거집상장제출방법여기본층차취류방법진행료비교,결과표명사용다로층차취류적방법능구획득여목표개념분류경고적상사도.