中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2013年
5期
205-210
,共6页
韩国语%名词短语%标注语料库%边界界定%自动提取
韓國語%名詞短語%標註語料庫%邊界界定%自動提取
한국어%명사단어%표주어료고%변계계정%자동제취
Korean%noun phrase%tagged corpus%boundary identification%automatic extraction
名词短语作为语言中一种普遍的语法现象,在自然语言处理领域日益受到了研究人员的关注.目前,对其研究范围主要集中在边界识别、语法分析、语义分析及其分类等方面.该文通过研究分析韩国语书面语名词短语的左右边界规则,从大规模标注语料库中自动提取出名词短语.实验结果表明:语料中的高频名词短语相对集中于8个类型之中.根据提取结果分别建立不同类型的名词短语库,为进一步建立双语平行短语语料库打下基础,以便于以后的机器翻译、信息检索等自然语言信息处理工作.
名詞短語作為語言中一種普遍的語法現象,在自然語言處理領域日益受到瞭研究人員的關註.目前,對其研究範圍主要集中在邊界識彆、語法分析、語義分析及其分類等方麵.該文通過研究分析韓國語書麵語名詞短語的左右邊界規則,從大規模標註語料庫中自動提取齣名詞短語.實驗結果錶明:語料中的高頻名詞短語相對集中于8箇類型之中.根據提取結果分彆建立不同類型的名詞短語庫,為進一步建立雙語平行短語語料庫打下基礎,以便于以後的機器翻譯、信息檢索等自然語言信息處理工作.
명사단어작위어언중일충보편적어법현상,재자연어언처리영역일익수도료연구인원적관주.목전,대기연구범위주요집중재변계식별、어법분석、어의분석급기분류등방면.해문통과연구분석한국어서면어명사단어적좌우변계규칙,종대규모표주어료고중자동제취출명사단어.실험결과표명:어료중적고빈명사단어상대집중우8개류형지중.근거제취결과분별건립불동류형적명사단어고,위진일보건립쌍어평행단어어료고타하기출,이편우이후적궤기번역、신식검색등자연어언신식처리공작.