计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2012年
12期
19-23
,共5页
机助%话语标记%计量%过滤
機助%話語標記%計量%過濾
궤조%화어표기%계량%과려
语篇中的话语标记在自然语言处理中逐渐得到重视.基于大规模语料库对话语标记进行自顶向下的梳理是该研究的目标.研究中构建了两个500万字次的语体语料库,利用UltraEdit等软件对话语标记进行提取和统计,对使用情况作了详细分析,发现话语标记并非只用于口语之中,每种语体都有自己的使用特色.在获得的话语标记的基础上,给出了在大规模语料库中提取算法并编程实现,减少了人工操作,提高了识别效率.
語篇中的話語標記在自然語言處理中逐漸得到重視.基于大規模語料庫對話語標記進行自頂嚮下的梳理是該研究的目標.研究中構建瞭兩箇500萬字次的語體語料庫,利用UltraEdit等軟件對話語標記進行提取和統計,對使用情況作瞭詳細分析,髮現話語標記併非隻用于口語之中,每種語體都有自己的使用特色.在穫得的話語標記的基礎上,給齣瞭在大規模語料庫中提取算法併編程實現,減少瞭人工操作,提高瞭識彆效率.
어편중적화어표기재자연어언처리중축점득도중시.기우대규모어료고대화어표기진행자정향하적소리시해연구적목표.연구중구건료량개500만자차적어체어료고,이용UltraEdit등연건대화어표기진행제취화통계,대사용정황작료상세분석,발현화어표기병비지용우구어지중,매충어체도유자기적사용특색.재획득적화어표기적기출상,급출료재대규모어료고중제취산법병편정실현,감소료인공조작,제고료식별효솔.