中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2013年
4期
44-51
,共8页
李国臣%张立凡%李茹%刘海静%石佼
李國臣%張立凡%李茹%劉海靜%石佼
리국신%장립범%리여%류해정%석교
框架排歧%汉语框架网语义资源%自动特征选择%词元语义特征
框架排歧%漢語框架網語義資源%自動特徵選擇%詞元語義特徵
광가배기%한어광가망어의자원%자동특정선택%사원어의특정
Chinese frame disambiguation%Chinese FrameNet%automatic feature selection%semantic feature of lexical units
框架排歧指的是在一个给定的句子中,判断句中目标词激起的语义场景与该目标词可能激起的哪个框架一致,则将该框架分配给当前的目标词.框架排歧最重要的一个步骤就是特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地利用每个目标词的语义特征,而且大量实验表明,不同的目标词取得最好的结果时所用的特征模板是不同的.因此,该文为每个目标词设置一个特征模板,并提出了特征模板的自动选择算法,首先从语料中抽取特征构成特征集,然后利用打分机制,把特征集中得分最高的特征逐个加入到特征模板中,直到相邻两次的得分不再增加.该文借助汉语框架网语义资源,利用最大熵模型建模,使用自动特征选择算法选出特征模板,并进行5-fold交叉验证,平均精确率可达到84.46%.
框架排歧指的是在一箇給定的句子中,判斷句中目標詞激起的語義場景與該目標詞可能激起的哪箇框架一緻,則將該框架分配給噹前的目標詞.框架排歧最重要的一箇步驟就是特徵選擇,目前常用的方法是人工特徵選擇方法,但是這種方法不能有效地利用每箇目標詞的語義特徵,而且大量實驗錶明,不同的目標詞取得最好的結果時所用的特徵模闆是不同的.因此,該文為每箇目標詞設置一箇特徵模闆,併提齣瞭特徵模闆的自動選擇算法,首先從語料中抽取特徵構成特徵集,然後利用打分機製,把特徵集中得分最高的特徵逐箇加入到特徵模闆中,直到相鄰兩次的得分不再增加.該文藉助漢語框架網語義資源,利用最大熵模型建模,使用自動特徵選擇算法選齣特徵模闆,併進行5-fold交扠驗證,平均精確率可達到84.46%.
광가배기지적시재일개급정적구자중,판단구중목표사격기적어의장경여해목표사가능격기적나개광가일치,칙장해광가분배급당전적목표사.광가배기최중요적일개보취취시특정선택,목전상용적방법시인공특정선택방법,단시저충방법불능유효지이용매개목표사적어의특정,이차대량실험표명,불동적목표사취득최호적결과시소용적특정모판시불동적.인차,해문위매개목표사설치일개특정모판,병제출료특정모판적자동선택산법,수선종어료중추취특정구성특정집,연후이용타분궤제,파특정집중득분최고적특정축개가입도특정모판중,직도상린량차적득분불재증가.해문차조한어광가망어의자원,이용최대적모형건모,사용자동특정선택산법선출특정모판,병진행5-fold교차험증,평균정학솔가체도84.46%.