计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2011年
5期
203-205
,共3页
朱道辉%肖基毅%程阳%吴诗祥
硃道輝%肖基毅%程暘%吳詩祥
주도휘%초기의%정양%오시상
长距离依赖%条件随机域%线性链%同-token%文本
長距離依賴%條件隨機域%線性鏈%同-token%文本
장거리의뢰%조건수궤역%선성련%동-token%문본
信息抽取中,同-token在文本中可能出现多次,且token多次出现的位置通常相隔很远,传统线性链CRF模型由于Markov假设不能表达长距离依赖关系于是将多次出现的同-token分开标注,丧失了全局信息.提出了长距离依赖条件随机域模型,该模型能结合多次出现的同-token各处的特征,对其进行联合标注.由于长距离依赖使得精确的标注算法不可计算,采用了TRP估计算法.实验表明该模型抽取性能优于线性链CRF模型,尤其是speaker域上的召回率有了很大的提高.
信息抽取中,同-token在文本中可能齣現多次,且token多次齣現的位置通常相隔很遠,傳統線性鏈CRF模型由于Markov假設不能錶達長距離依賴關繫于是將多次齣現的同-token分開標註,喪失瞭全跼信息.提齣瞭長距離依賴條件隨機域模型,該模型能結閤多次齣現的同-token各處的特徵,對其進行聯閤標註.由于長距離依賴使得精確的標註算法不可計算,採用瞭TRP估計算法.實驗錶明該模型抽取性能優于線性鏈CRF模型,尤其是speaker域上的召迴率有瞭很大的提高.
신식추취중,동-token재문본중가능출현다차,차token다차출현적위치통상상격흔원,전통선성련CRF모형유우Markov가설불능표체장거리의뢰관계우시장다차출현적동-token분개표주,상실료전국신식.제출료장거리의뢰조건수궤역모형,해모형능결합다차출현적동-token각처적특정,대기진행연합표주.유우장거리의뢰사득정학적표주산법불가계산,채용료TRP고계산법.실험표명해모형추취성능우우선성련CRF모형,우기시speaker역상적소회솔유료흔대적제고.