智能系统学报
智能繫統學報
지능계통학보
CAAI TRANSACTIONS ON INTELLIGENT SYSTEMS
2009年
3期
270-277
,共8页
沈映泉%刘勇进%蔡骏%史晓东
瀋映泉%劉勇進%蔡駿%史曉東
침영천%류용진%채준%사효동
语音语料库标注%人类计算%分布式知识获取%基于Web的语言学习
語音語料庫標註%人類計算%分佈式知識穫取%基于Web的語言學習
어음어료고표주%인류계산%분포식지식획취%기우Web적어언학습
提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算方法获得的标注文本的质量,使用了一些计算机辅助机制来校验收集到的标注的可靠性.采用这种方法实现语音语料库标注的主要优点在于将语料库标注和语言学习相结合,无需专门投入大量的人力来进行枯燥乏味的语料库标注工作,从而节省了语料库标注的成本.对这种基于人类计算的语音语料库标注技术进行了探讨,说明了用于收集用户输入的语言学习系统的设计以及标注生成系统的设计.系统的应用表明,该标注方法能够有效、低成本地生成语音语料库的词汇标注和音标标注.
提齣一種基于人類計算的語音語料庫標註方法.該標註方法的主要思路是通過一箇基于Web的語言學習繫統來收集由大量學習者(用戶)輸入的詞彙標註和音標標註,併從中選擇齣現概率最大的用戶輸入作為語料的正確標註.為瞭保證通過這種人類計算方法穫得的標註文本的質量,使用瞭一些計算機輔助機製來校驗收集到的標註的可靠性.採用這種方法實現語音語料庫標註的主要優點在于將語料庫標註和語言學習相結閤,無需專門投入大量的人力來進行枯燥乏味的語料庫標註工作,從而節省瞭語料庫標註的成本.對這種基于人類計算的語音語料庫標註技術進行瞭探討,說明瞭用于收集用戶輸入的語言學習繫統的設計以及標註生成繫統的設計.繫統的應用錶明,該標註方法能夠有效、低成本地生成語音語料庫的詞彙標註和音標標註.
제출일충기우인류계산적어음어료고표주방법.해표주방법적주요사로시통과일개기우Web적어언학습계통래수집유대량학습자(용호)수입적사회표주화음표표주,병종중선택출현개솔최대적용호수입작위어료적정학표주.위료보증통과저충인류계산방법획득적표주문본적질량,사용료일사계산궤보조궤제래교험수집도적표주적가고성.채용저충방법실현어음어료고표주적주요우점재우장어료고표주화어언학습상결합,무수전문투입대량적인력래진행고조핍미적어료고표주공작,종이절성료어료고표주적성본.대저충기우인류계산적어음어료고표주기술진행료탐토,설명료용우수집용호수입적어언학습계통적설계이급표주생성계통적설계.계통적응용표명,해표주방법능구유효、저성본지생성어음어료고적사회표주화음표표주.