电子科技
電子科技
전자과기
IT AGE
2013年
7期
7-10
,共4页
关键词提取%未登录词%社会网络理论%语义相似度网络
關鍵詞提取%未登錄詞%社會網絡理論%語義相似度網絡
관건사제취%미등록사%사회망락이론%어의상사도망락
关键词提取在文本相似度计算得到应用.传统的关键词提取方法忽略文本中的未登录词以及缺乏对词语语义的理解.针对科技项目申请书,研究提出一种基于未登录词识别与语义的关键词提取方法.应用Lucene和统计相融合的方法进行分词,并识别未登录词作为申请书关键词的一部分;依据社会网络理论构建词语语义相似度网络,并计算词语关联度提取申请书其他关键词.实验结果表明,与传统的关键词提取方法相比,新方法能提取更准确的关键词,有更好的科技项目相似性检查效果.
關鍵詞提取在文本相似度計算得到應用.傳統的關鍵詞提取方法忽略文本中的未登錄詞以及缺乏對詞語語義的理解.針對科技項目申請書,研究提齣一種基于未登錄詞識彆與語義的關鍵詞提取方法.應用Lucene和統計相融閤的方法進行分詞,併識彆未登錄詞作為申請書關鍵詞的一部分;依據社會網絡理論構建詞語語義相似度網絡,併計算詞語關聯度提取申請書其他關鍵詞.實驗結果錶明,與傳統的關鍵詞提取方法相比,新方法能提取更準確的關鍵詞,有更好的科技項目相似性檢查效果.
관건사제취재문본상사도계산득도응용.전통적관건사제취방법홀략문본중적미등록사이급결핍대사어어의적리해.침대과기항목신청서,연구제출일충기우미등록사식별여어의적관건사제취방법.응용Lucene화통계상융합적방법진행분사,병식별미등록사작위신청서관건사적일부분;의거사회망락이론구건사어어의상사도망락,병계산사어관련도제취신청서기타관건사.실험결과표명,여전통적관건사제취방법상비,신방법능제취경준학적관건사,유경호적과기항목상사성검사효과.