中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
3期
3-8,21
,共7页
组合范畴语法%树库%中文句型%动词子范畴框架
組閤範疇語法%樹庫%中文句型%動詞子範疇框架
조합범주어법%수고%중문구형%동사자범주광가
组合范畴语法(CCG)是一种类型驱动的语法,可以高度词例化(lexicalized)并兼顾句法和一定程度上语义的表达,可为深层次的文本分析提供有效支持.将CCG应用于真实文本分析需要编制大规模的词库,为了避免为此付出的昂贵人力和资源,一个经济有效的解决方案是利用现有短语句法树库来自动生成CCG树库.该文提出在清华中文树库的基础上自动生成CCG树库的方法,在预定义的中文句型和基于清华树库的动词子范畴框架的支持下,通过标准转换算法,得到一个包含32737句、超过35万词次的中文CCG树库.该树库通过手工和自动评价验证,又与已有文献所报告的多语种CCG树库构建工作比较,均证明该文所述方法的有效性.
組閤範疇語法(CCG)是一種類型驅動的語法,可以高度詞例化(lexicalized)併兼顧句法和一定程度上語義的錶達,可為深層次的文本分析提供有效支持.將CCG應用于真實文本分析需要編製大規模的詞庫,為瞭避免為此付齣的昂貴人力和資源,一箇經濟有效的解決方案是利用現有短語句法樹庫來自動生成CCG樹庫.該文提齣在清華中文樹庫的基礎上自動生成CCG樹庫的方法,在預定義的中文句型和基于清華樹庫的動詞子範疇框架的支持下,通過標準轉換算法,得到一箇包含32737句、超過35萬詞次的中文CCG樹庫.該樹庫通過手工和自動評價驗證,又與已有文獻所報告的多語種CCG樹庫構建工作比較,均證明該文所述方法的有效性.
조합범주어법(CCG)시일충류형구동적어법,가이고도사례화(lexicalized)병겸고구법화일정정도상어의적표체,가위심층차적문본분석제공유효지지.장CCG응용우진실문본분석수요편제대규모적사고,위료피면위차부출적앙귀인력화자원,일개경제유효적해결방안시이용현유단어구법수고래자동생성CCG수고.해문제출재청화중문수고적기출상자동생성CCG수고적방법,재예정의적중문구형화기우청화수고적동사자범주광가적지지하,통과표준전환산법,득도일개포함32737구、초과35만사차적중문CCG수고.해수고통과수공화자동평개험증,우여이유문헌소보고적다어충CCG수고구건공작비교,균증명해문소술방법적유효성.