中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2014年
5期
170-175,191
,共7页
王天航%史树敏%龙从军%黄河燕%李琳
王天航%史樹敏%龍從軍%黃河燕%李琳
왕천항%사수민%룡종군%황하연%리림
错误驱动学习%藏语句法功能组块%组块边界识别%CRFs%TBL
錯誤驅動學習%藏語句法功能組塊%組塊邊界識彆%CRFs%TBL
착오구동학습%장어구법공능조괴%조괴변계식별%CRFs%TBL
error-driven learning%Tibetan syntactic functional chunk%chunk boundary recognition%CRFs%TBL
藏语句法功能组块分析旨在识别出藏语句子的句法成分,为后续句子级深入分析提供支持.根据藏语的语言特点,该文在藏语句法功能组块描述体系基础上,提出基于错误驱动学习策略的藏语功能组块边界识别方法.具体思路为,首先基于条件随机场(Conditional Random Fields,CRFs)识别组块,然后分别基于转换规则的错误驱动学习(Transformation-based Error-driven Learning,TBL)及基于新特征模板的CRFs错误驱动学习进行二次识别,并对初次结果进行校正,F值分别提高了1.65%、8.36%.最后通过实验分析,进一步将两种错误驱动学习机制融合,在18 073词级的藏语语料上开展实验,识别性能进一步提高,准确率、召回率与F值分别这到94.1%、94.76%与94.43%,充分验证了本文提出方法的有效性.
藏語句法功能組塊分析旨在識彆齣藏語句子的句法成分,為後續句子級深入分析提供支持.根據藏語的語言特點,該文在藏語句法功能組塊描述體繫基礎上,提齣基于錯誤驅動學習策略的藏語功能組塊邊界識彆方法.具體思路為,首先基于條件隨機場(Conditional Random Fields,CRFs)識彆組塊,然後分彆基于轉換規則的錯誤驅動學習(Transformation-based Error-driven Learning,TBL)及基于新特徵模闆的CRFs錯誤驅動學習進行二次識彆,併對初次結果進行校正,F值分彆提高瞭1.65%、8.36%.最後通過實驗分析,進一步將兩種錯誤驅動學習機製融閤,在18 073詞級的藏語語料上開展實驗,識彆性能進一步提高,準確率、召迴率與F值分彆這到94.1%、94.76%與94.43%,充分驗證瞭本文提齣方法的有效性.
장어구법공능조괴분석지재식별출장어구자적구법성분,위후속구자급심입분석제공지지.근거장어적어언특점,해문재장어구법공능조괴묘술체계기출상,제출기우착오구동학습책략적장어공능조괴변계식별방법.구체사로위,수선기우조건수궤장(Conditional Random Fields,CRFs)식별조괴,연후분별기우전환규칙적착오구동학습(Transformation-based Error-driven Learning,TBL)급기우신특정모판적CRFs착오구동학습진행이차식별,병대초차결과진행교정,F치분별제고료1.65%、8.36%.최후통과실험분석,진일보장량충착오구동학습궤제융합,재18 073사급적장어어료상개전실험,식별성능진일보제고,준학솔、소회솔여F치분별저도94.1%、94.76%여94.43%,충분험증료본문제출방법적유효성.