计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2015年
5期
1314-1319
,共6页
王荣波%李杰%黄孝喜%周昌乐%谌志群%王小华
王榮波%李傑%黃孝喜%週昌樂%諶誌群%王小華
왕영파%리걸%황효희%주창악%심지군%왕소화
汉语句群划分%多元判别分析%篇章分析%Skip-Gram模型%篇章衔接
漢語句群劃分%多元判彆分析%篇章分析%Skip-Gram模型%篇章銜接
한어구군화분%다원판별분석%편장분석%Skip-Gram모형%편장함접
Chinese sentences grouping%Multiple Discriminant Analysis (MDA)%discourse analysis%Skip-Gram model%discourse coherence
针对目前句群划分工作缺乏计算语言学数据支持、忽略篇章衔接词的问题以及当前篇章分析较少研究句群语法单位的现象,提出一种汉语句群自动划分方法.该方法以汉语句群理论为指导,构建汉语句群划分标注评测语料,并且基于多元判别分析(MDA)方法设计了一组评价函数J,从而实现汉语句群的自动划分.实验结果表明,引入切分片段长度因素和篇章衔接词因素可以改善句群划分性能,并且利用Skip-Gram Model比传统的向量空间模型(VSM)有更好的效果,其正确分割率Pu达到85.37%、错误分割率Window Diff降到24.08%.同时该方法在句群划分任务上有更大的优势,比传统MDA方法有更好的句群划分效果.
針對目前句群劃分工作缺乏計算語言學數據支持、忽略篇章銜接詞的問題以及噹前篇章分析較少研究句群語法單位的現象,提齣一種漢語句群自動劃分方法.該方法以漢語句群理論為指導,構建漢語句群劃分標註評測語料,併且基于多元判彆分析(MDA)方法設計瞭一組評價函數J,從而實現漢語句群的自動劃分.實驗結果錶明,引入切分片段長度因素和篇章銜接詞因素可以改善句群劃分性能,併且利用Skip-Gram Model比傳統的嚮量空間模型(VSM)有更好的效果,其正確分割率Pu達到85.37%、錯誤分割率Window Diff降到24.08%.同時該方法在句群劃分任務上有更大的優勢,比傳統MDA方法有更好的句群劃分效果.
침대목전구군화분공작결핍계산어언학수거지지、홀략편장함접사적문제이급당전편장분석교소연구구군어법단위적현상,제출일충한어구군자동화분방법.해방법이한어구군이론위지도,구건한어구군화분표주평측어료,병차기우다원판별분석(MDA)방법설계료일조평개함수J,종이실현한어구군적자동화분.실험결과표명,인입절분편단장도인소화편장함접사인소가이개선구군화분성능,병차이용Skip-Gram Model비전통적향량공간모형(VSM)유경호적효과,기정학분할솔Pu체도85.37%、착오분할솔Window Diff강도24.08%.동시해방법재구군화분임무상유경대적우세,비전통MDA방법유경호적구군화분효과.