软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2011年
2期
233-244
,共12页
费仲超%周雅倩%黄萱菁%吴立德
費仲超%週雅倩%黃萱菁%吳立德
비중초%주아천%황훤정%오립덕
代词指代消解%口语对话理解%代词分类
代詞指代消解%口語對話理解%代詞分類
대사지대소해%구어대화리해%대사분류
提出一套分为两步的代词指代消解算法,算法不需要人工清洗语料及预定义规则.算法第1步采用一些新特征和机器学习算法对名词性指代代词和非名词性指代(non-anaphoric)代词分类,第2步分别对两类代词进行消解.针对名词性代词指代消解,提出了适用于口语对话的特征抽取及表示方法,如代词和候选先行词的距离、语法、语义等的抽取和表示方法,然后通过综合这些特征来选择先行词.针对非名词性指代,将右边界规则(right frontier rule)改进为可以在口语对话中自动抽取的形式,并根据该规则选择先行项.在Byron于2004年发布的语料上测试,消解正确率达到77.0%.召回率达到66.0%.与Byron的工作相比,该方法在保证系统能够自动完成的同时还提高了消解性能.
提齣一套分為兩步的代詞指代消解算法,算法不需要人工清洗語料及預定義規則.算法第1步採用一些新特徵和機器學習算法對名詞性指代代詞和非名詞性指代(non-anaphoric)代詞分類,第2步分彆對兩類代詞進行消解.針對名詞性代詞指代消解,提齣瞭適用于口語對話的特徵抽取及錶示方法,如代詞和候選先行詞的距離、語法、語義等的抽取和錶示方法,然後通過綜閤這些特徵來選擇先行詞.針對非名詞性指代,將右邊界規則(right frontier rule)改進為可以在口語對話中自動抽取的形式,併根據該規則選擇先行項.在Byron于2004年髮佈的語料上測試,消解正確率達到77.0%.召迴率達到66.0%.與Byron的工作相比,該方法在保證繫統能夠自動完成的同時還提高瞭消解性能.
제출일투분위량보적대사지대소해산법,산법불수요인공청세어료급예정의규칙.산법제1보채용일사신특정화궤기학습산법대명사성지대대사화비명사성지대(non-anaphoric)대사분류,제2보분별대량류대사진행소해.침대명사성대사지대소해,제출료괄용우구어대화적특정추취급표시방법,여대사화후선선행사적거리、어법、어의등적추취화표시방법,연후통과종합저사특정래선택선행사.침대비명사성지대,장우변계규칙(right frontier rule)개진위가이재구어대화중자동추취적형식,병근거해규칙선택선행항.재Byron우2004년발포적어료상측시,소해정학솔체도77.0%.소회솔체도66.0%.여Byron적공작상비,해방법재보증계통능구자동완성적동시환제고료소해성능.