河北科技大学学报
河北科技大學學報
하북과기대학학보
Journal of Hebei University of Science and Technology
2015年
5期
532-538
,共7页
自然语言处理%语言模型%词向量%相似词%POS-CBOW
自然語言處理%語言模型%詞嚮量%相似詞%POS-CBOW
자연어언처리%어언모형%사향량%상사사%POS-CBOW
natural language processing%language model%word vector%similar words%POS-CBOW
相似词分析是自然语言处理领域的研究热点之一,在文本分类、机器翻译和信息推荐等领域中具有重要的研究价值和应用意义.针对新浪微博短文本的特点,给出一种带词性的连续词袋模型(POS-CBOW).该模型在连续词袋模型的基础上加入过滤层和词性标注层,对空间词向量进行优化和词性标注,通过空间词向量的余弦相似度和词性相似度来判别词向量的相似性,并利用统计分析模型筛选出最优相似词集合.实验表明,基于POS-CBOW语言模型的相似词分析算法优于传统CBOW语言模型.
相似詞分析是自然語言處理領域的研究熱點之一,在文本分類、機器翻譯和信息推薦等領域中具有重要的研究價值和應用意義.針對新浪微博短文本的特點,給齣一種帶詞性的連續詞袋模型(POS-CBOW).該模型在連續詞袋模型的基礎上加入過濾層和詞性標註層,對空間詞嚮量進行優化和詞性標註,通過空間詞嚮量的餘絃相似度和詞性相似度來判彆詞嚮量的相似性,併利用統計分析模型篩選齣最優相似詞集閤.實驗錶明,基于POS-CBOW語言模型的相似詞分析算法優于傳統CBOW語言模型.
상사사분석시자연어언처리영역적연구열점지일,재문본분류、궤기번역화신식추천등영역중구유중요적연구개치화응용의의.침대신랑미박단문본적특점,급출일충대사성적련속사대모형(POS-CBOW).해모형재련속사대모형적기출상가입과려층화사성표주층,대공간사향량진행우화화사성표주,통과공간사향량적여현상사도화사성상사도래판별사향량적상사성,병이용통계분석모형사선출최우상사사집합.실험표명,기우POS-CBOW어언모형적상사사분석산법우우전통CBOW어언모형.