计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
30期
8-10
,共3页
平行语料%词语搭配%短语分析%自动识别%中文信息处理
平行語料%詞語搭配%短語分析%自動識彆%中文信息處理
평행어료%사어탑배%단어분석%자동식별%중문신식처리
目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源.以现代汉语v+n序列的结构关系为研究对象,设计出在英汉平行语料中识别v+n结构关系的平行处理算法:首先利用各种单语资源,提取出构成不同结构关系的动词和名词相互间的制约规则,再分别依据v+n中汉语名词、动词的语义在英语译文中的具体形式及上下文模板来判断v+n的结构关系类型.实验证明,在自动分词和词性标注的PCCEl000文本中,v+n单语处理的F值为72.14%,而进一步利用汉英词典和英语译文信息,F值到达了88.81%.提高了16.67个百分点.
目前,在英漢平行語料中,對漢語文本的深加工多跼限于隻利用單語分析的成果,沒有充分利用雙語資源.以現代漢語v+n序列的結構關繫為研究對象,設計齣在英漢平行語料中識彆v+n結構關繫的平行處理算法:首先利用各種單語資源,提取齣構成不同結構關繫的動詞和名詞相互間的製約規則,再分彆依據v+n中漢語名詞、動詞的語義在英語譯文中的具體形式及上下文模闆來判斷v+n的結構關繫類型.實驗證明,在自動分詞和詞性標註的PCCEl000文本中,v+n單語處理的F值為72.14%,而進一步利用漢英詞典和英語譯文信息,F值到達瞭88.81%.提高瞭16.67箇百分點.
목전,재영한평행어료중,대한어문본적심가공다국한우지이용단어분석적성과,몰유충분이용쌍어자원.이현대한어v+n서렬적결구관계위연구대상,설계출재영한평행어료중식별v+n결구관계적평행처리산법:수선이용각충단어자원,제취출구성불동결구관계적동사화명사상호간적제약규칙,재분별의거v+n중한어명사、동사적어의재영어역문중적구체형식급상하문모판래판단v+n적결구관계류형.실험증명,재자동분사화사성표주적PCCEl000문본중,v+n단어처리적F치위72.14%,이진일보이용한영사전화영어역문신식,F치도체료88.81%.제고료16.67개백분점.