计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2011年
5期
151-154
,共4页
中文信息处理%语料库%藏文分词
中文信息處理%語料庫%藏文分詞
중문신식처리%어료고%장문분사
语料库作为基本的语言数据库和知识库,是各种自然语言处理方法实现的基础.随着统计方法在自然语言处理中的广泛应用,语料库建设已成为重要的研究课题.自动分词是句法分析的一项不可或缺的基础性工作,其性能直接影响句法分析.本文通过对85万字节藏语语料的统计分析和藏语词的分布特点、语法功能研究,介绍基于词典库的藏文自动分词系统的模型,给出了切分用词典库的结构、格分决算法和还原算法.系统的研制为藏文输入法研究、藏文电子词典建设、藏文字词频统计、搜索引擎的设计和实现、机器翻译系统的开发、网络信息安全、藏文语料库建设以及藏语语义分析研究奠定了基础.
語料庫作為基本的語言數據庫和知識庫,是各種自然語言處理方法實現的基礎.隨著統計方法在自然語言處理中的廣汎應用,語料庫建設已成為重要的研究課題.自動分詞是句法分析的一項不可或缺的基礎性工作,其性能直接影響句法分析.本文通過對85萬字節藏語語料的統計分析和藏語詞的分佈特點、語法功能研究,介紹基于詞典庫的藏文自動分詞繫統的模型,給齣瞭切分用詞典庫的結構、格分決算法和還原算法.繫統的研製為藏文輸入法研究、藏文電子詞典建設、藏文字詞頻統計、搜索引擎的設計和實現、機器翻譯繫統的開髮、網絡信息安全、藏文語料庫建設以及藏語語義分析研究奠定瞭基礎.
어료고작위기본적어언수거고화지식고,시각충자연어언처리방법실현적기출.수착통계방법재자연어언처리중적엄범응용,어료고건설이성위중요적연구과제.자동분사시구법분석적일항불가혹결적기출성공작,기성능직접영향구법분석.본문통과대85만자절장어어료적통계분석화장어사적분포특점、어법공능연구,개소기우사전고적장문자동분사계통적모형,급출료절분용사전고적결구、격분결산법화환원산법.계통적연제위장문수입법연구、장문전자사전건설、장문자사빈통계、수색인경적설계화실현、궤기번역계통적개발、망락신식안전、장문어료고건설이급장어어의분석연구전정료기출.