计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2012年
6期
187-190
,共4页
藏文句子%边界识别%最大熵模型
藏文句子%邊界識彆%最大熵模型
장문구자%변계식별%최대적모형
藏文句子的边界识别是藏文文本分析的基础性研究,是藏文与其他语种之间建立句子级平行语料库的必要工作,也是进一步进行藏汉机器翻译的基础.本文通过分析藏文句子的结束形式,研究藏文句子边界规则,提出了一种藏文句子的边界识别方法.该方法首先利用特殊规则和词表对藏文句子进行识别,然后利用最大熵模型对有歧义的句子进一步识别.从而提高藏文句子的边界识别率.
藏文句子的邊界識彆是藏文文本分析的基礎性研究,是藏文與其他語種之間建立句子級平行語料庫的必要工作,也是進一步進行藏漢機器翻譯的基礎.本文通過分析藏文句子的結束形式,研究藏文句子邊界規則,提齣瞭一種藏文句子的邊界識彆方法.該方法首先利用特殊規則和詞錶對藏文句子進行識彆,然後利用最大熵模型對有歧義的句子進一步識彆.從而提高藏文句子的邊界識彆率.
장문구자적변계식별시장문문본분석적기출성연구,시장문여기타어충지간건립구자급평행어료고적필요공작,야시진일보진행장한궤기번역적기출.본문통과분석장문구자적결속형식,연구장문구자변계규칙,제출료일충장문구자적변계식별방법.해방법수선이용특수규칙화사표대장문구자진행식별,연후이용최대적모형대유기의적구자진일보식별.종이제고장문구자적변계식별솔.