计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2014年
9期
231-235
,共5页
中文句法分析%组合范畴语法%启发式搜索%预标注
中文句法分析%組閤範疇語法%啟髮式搜索%預標註
중문구법분석%조합범주어법%계발식수색%예표주
Chinese parsing%Combinatory categorial grammar(CCG)%A*search%Supertagging
针对中文组合范畴语法(CCG)分析困难的特点,研究如何将两种彼此相互独立的技术共同应用在中文CCG句法分析上。首先使用预标注算法,使用对数线性模型通过去除那些概率较低的词汇范畴来对句子的潜在分析空间进行剪枝。然后应用启发式搜索算法进一步加速分析过程。最后从时间效率和分析精度两个维度对所使用的方法进行验证。实验表明,基于启发式搜索与预标注的句法分析算法可以显著地提高分析效率与分析精度。
針對中文組閤範疇語法(CCG)分析睏難的特點,研究如何將兩種彼此相互獨立的技術共同應用在中文CCG句法分析上。首先使用預標註算法,使用對數線性模型通過去除那些概率較低的詞彙範疇來對句子的潛在分析空間進行剪枝。然後應用啟髮式搜索算法進一步加速分析過程。最後從時間效率和分析精度兩箇維度對所使用的方法進行驗證。實驗錶明,基于啟髮式搜索與預標註的句法分析算法可以顯著地提高分析效率與分析精度。
침대중문조합범주어법(CCG)분석곤난적특점,연구여하장량충피차상호독립적기술공동응용재중문CCG구법분석상。수선사용예표주산법,사용대수선성모형통과거제나사개솔교저적사회범주래대구자적잠재분석공간진행전지。연후응용계발식수색산법진일보가속분석과정。최후종시간효솔화분석정도량개유도대소사용적방법진행험증。실험표명,기우계발식수색여예표주적구법분석산법가이현저지제고분석효솔여분석정도。
Chinese CCG is difficult to parse,in light of this character,in the paper we investigate the way to integrate two independenttechniques on Chinese CCG parsing.Firstly the supertagging is used,and by eliminating with log-linear model those words categories whosepossibility is low,the latent parsing space of sentences is pruned.Secondly,A* search is applied to further accelerate the parsing procedure.At last the verifications are done on the approach used from the dimensions of both time efficiency and parsing accuracy.Experiments indicatethat the parsing algorithm based on A* search and supertagging can significantly improve the efficiency and accuracy.