计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2006年
z3期
174-178
,共5页
赵伟%赵法兴%王东海%韩达奇
趙偉%趙法興%王東海%韓達奇
조위%조법흥%왕동해%한체기
最大熵模型%词性标注%Gaussian%prior平滑方法%BLMVM算法
最大熵模型%詞性標註%Gaussian%prior平滑方法%BLMVM算法
최대적모형%사성표주%Gaussian%prior평활방법%BLMVM산법
最大熵模型已成为自然语言处理领域中的研究热点,但由于熟语料库规模的限制,模型参数会出现稀疏现象,影响了模型的精确度.另外最大熵模型参数众多、计算量大,一个好的参数估计算法将会有效地提高模型的效率.实验证明,采用BLMVM算法的基于Gaussian prior平滑技术的最大熵模型具有出色的表现.基于以上认识,结合汉语自身的特点,设计了一个基于词和字特征的汉语词性自动标注系统,取得了较好的标注效果.
最大熵模型已成為自然語言處理領域中的研究熱點,但由于熟語料庫規模的限製,模型參數會齣現稀疏現象,影響瞭模型的精確度.另外最大熵模型參數衆多、計算量大,一箇好的參數估計算法將會有效地提高模型的效率.實驗證明,採用BLMVM算法的基于Gaussian prior平滑技術的最大熵模型具有齣色的錶現.基于以上認識,結閤漢語自身的特點,設計瞭一箇基于詞和字特徵的漢語詞性自動標註繫統,取得瞭較好的標註效果.
최대적모형이성위자연어언처리영역중적연구열점,단유우숙어료고규모적한제,모형삼수회출현희소현상,영향료모형적정학도.령외최대적모형삼수음다、계산량대,일개호적삼수고계산법장회유효지제고모형적효솔.실험증명,채용BLMVM산법적기우Gaussian prior평활기술적최대적모형구유출색적표현.기우이상인식,결합한어자신적특점,설계료일개기우사화자특정적한어사성자동표주계통,취득료교호적표주효과.