软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2010年
4期
597-611
,共15页
李济洪%王瑞波%王蔚林%李国臣
李濟洪%王瑞波%王蔚林%李國臣
리제홍%왕서파%왕위림%리국신
汉语框架语义知识库%语义角色标注%正交表%特征选择%条件随机场
漢語框架語義知識庫%語義角色標註%正交錶%特徵選擇%條件隨機場
한어광가어의지식고%어의각색표주%정교표%특정선택%조건수궤장
基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及其组合为特征.针对每个特征设定若干可选的窗口,组合构成模型的各种特征模板,基于统计学中的正交表,给出一种较优模板选择方法.全部实验在选出的25个框架的6 692个例句的语料上进行.对每一个框架,分别按照其例句训练一个模型,同时进行语义角色的边界识别与分类,进行2-fold交叉验证.在给定句子中的目标词以及目标词所属的框架情况下,25个框架交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%和61.62%.
基于山西大學自主開髮的漢語框架語義知識庫(CFN),將語義角色標註問題通過IOB策略轉化為詞序列標註問題,採用條件隨機場模型,研究瞭漢語框架語義角色的自動標註.模型以詞為基本標註單元,選擇詞、詞性、詞相對于目標詞的位置、目標詞及其組閤為特徵.針對每箇特徵設定若榦可選的窗口,組閤構成模型的各種特徵模闆,基于統計學中的正交錶,給齣一種較優模闆選擇方法.全部實驗在選齣的25箇框架的6 692箇例句的語料上進行.對每一箇框架,分彆按照其例句訓練一箇模型,同時進行語義角色的邊界識彆與分類,進行2-fold交扠驗證.在給定句子中的目標詞以及目標詞所屬的框架情況下,25箇框架交扠驗證的實驗結果的準確率、召迴率、F1-值分彆達到74.16%,52.70%和61.62%.
기우산서대학자주개발적한어광가어의지식고(CFN),장어의각색표주문제통과IOB책략전화위사서렬표주문제,채용조건수궤장모형,연구료한어광가어의각색적자동표주.모형이사위기본표주단원,선택사、사성、사상대우목표사적위치、목표사급기조합위특정.침대매개특정설정약간가선적창구,조합구성모형적각충특정모판,기우통계학중적정교표,급출일충교우모판선택방법.전부실험재선출적25개광가적6 692개례구적어료상진행.대매일개광가,분별안조기례구훈련일개모형,동시진행어의각색적변계식별여분류,진행2-fold교차험증.재급정구자중적목표사이급목표사소속적광가정황하,25개광가교차험증적실험결과적준학솔、소회솔、F1-치분별체도74.16%,52.70%화61.62%.