中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
5期
120-128
,共9页
周俏丽%刘新%郎文静%蔡东风
週俏麗%劉新%郎文靜%蔡東風
주초려%류신%랑문정%채동풍
汉语组块分析%分治策略%句法分析%最长名词短语%条件随机场%支持向量机
漢語組塊分析%分治策略%句法分析%最長名詞短語%條件隨機場%支持嚮量機
한어조괴분석%분치책략%구법분석%최장명사단어%조건수궤장%지지향량궤
组块分析的主要任务是语块的识别和划分,它使句法分析的任务在某种程度上得到简化.针对长句子组块分析所遇到的困难,该文提出了一种基于分治策略的组块分析方法.该方法的基本思想是首先对句子进行最长名词短语识别,根据识别的结果,将句子分解为最长名词短语部分和句子框架部分;然后,针对不同的分析单元选用不同的模型加以分析,再将分析结果进行组合,完成整个组块分析过程.该方法将整句分解为更小的组块分析单元,降低了句子的复杂度.通过在宾州中文树库CTB4数据集上的实验结果显示,各种组块识别结果平均F1值结果为91.79%,优于目前其他的组块分析方法.
組塊分析的主要任務是語塊的識彆和劃分,它使句法分析的任務在某種程度上得到簡化.針對長句子組塊分析所遇到的睏難,該文提齣瞭一種基于分治策略的組塊分析方法.該方法的基本思想是首先對句子進行最長名詞短語識彆,根據識彆的結果,將句子分解為最長名詞短語部分和句子框架部分;然後,針對不同的分析單元選用不同的模型加以分析,再將分析結果進行組閤,完成整箇組塊分析過程.該方法將整句分解為更小的組塊分析單元,降低瞭句子的複雜度.通過在賓州中文樹庫CTB4數據集上的實驗結果顯示,各種組塊識彆結果平均F1值結果為91.79%,優于目前其他的組塊分析方法.
조괴분석적주요임무시어괴적식별화화분,타사구법분석적임무재모충정도상득도간화.침대장구자조괴분석소우도적곤난,해문제출료일충기우분치책략적조괴분석방법.해방법적기본사상시수선대구자진행최장명사단어식별,근거식별적결과,장구자분해위최장명사단어부분화구자광가부분;연후,침대불동적분석단원선용불동적모형가이분석,재장분석결과진행조합,완성정개조괴분석과정.해방법장정구분해위경소적조괴분석단원,강저료구자적복잡도.통과재빈주중문수고CTB4수거집상적실험결과현시,각충조괴식별결과평균F1치결과위91.79%,우우목전기타적조괴분석방법.