中原工学院学报
中原工學院學報
중원공학원학보
JOURNAL OF ZHONGYUAN INSTITUTE OF TECHNOLOGY
2010年
3期
45-50
,共6页
自然语言处理%词相似%分布相似度
自然語言處理%詞相似%分佈相似度
자연어언처리%사상사%분포상사도
针对词语相似度这一问题,在大规模语料库上,通过分布相似对汉语词相似进行了研究. 实现了一个词相似计算平台,可灵活组合各种计算词相似算法,新增加语料库可以被增量式用于计算;对比研究了基于距离的度量和基于概率的度量2类算法的性能,通过和人工创建的黄金标准进行比较,基于概率的度量算法要优于基于距离的度量算法.
針對詞語相似度這一問題,在大規模語料庫上,通過分佈相似對漢語詞相似進行瞭研究. 實現瞭一箇詞相似計算平檯,可靈活組閤各種計算詞相似算法,新增加語料庫可以被增量式用于計算;對比研究瞭基于距離的度量和基于概率的度量2類算法的性能,通過和人工創建的黃金標準進行比較,基于概率的度量算法要優于基于距離的度量算法.
침대사어상사도저일문제,재대규모어료고상,통과분포상사대한어사상사진행료연구. 실현료일개사상사계산평태,가령활조합각충계산사상사산법,신증가어료고가이피증량식용우계산;대비연구료기우거리적도량화기우개솔적도량2류산법적성능,통과화인공창건적황금표준진행비교,기우개솔적도량산법요우우기우거리적도량산법.