计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2015年
4期
115-119,153
,共6页
简体字%繁体字%简繁体字转换%一对多简繁转换
簡體字%繁體字%簡繁體字轉換%一對多簡繁轉換
간체자%번체자%간번체자전환%일대다간번전환
Chinese character%traditional Chinese characters%conversion between simplified and traditional Chinese characters
目前使用的汉字有简体和繁体两大形式:中国大陆和新加坡等地使用简体字,我国港澳台地区和部分海外华人社区使用繁体字。其中大多数简体字的意义和用法与对应的繁体字是一样的,具有一一对应关系,这种情况通过查找简繁对照表就可以正确处理。然而,还有相当一部分简体字对应多个繁体字,这是简繁字转换的重点和难点。基于此背景提出基于对照表以及语义相关性的简繁汉字转换方法。在教育部语信司及中国中文信息学会联合举办的一对多简繁转换评测中,此一对多简繁转换系统以95.6%的准确率排名第一。
目前使用的漢字有簡體和繁體兩大形式:中國大陸和新加坡等地使用簡體字,我國港澳檯地區和部分海外華人社區使用繁體字。其中大多數簡體字的意義和用法與對應的繁體字是一樣的,具有一一對應關繫,這種情況通過查找簡繁對照錶就可以正確處理。然而,還有相噹一部分簡體字對應多箇繁體字,這是簡繁字轉換的重點和難點。基于此揹景提齣基于對照錶以及語義相關性的簡繁漢字轉換方法。在教育部語信司及中國中文信息學會聯閤舉辦的一對多簡繁轉換評測中,此一對多簡繁轉換繫統以95.6%的準確率排名第一。
목전사용적한자유간체화번체량대형식:중국대륙화신가파등지사용간체자,아국항오태지구화부분해외화인사구사용번체자。기중대다수간체자적의의화용법여대응적번체자시일양적,구유일일대응관계,저충정황통과사조간번대조표취가이정학처리。연이,환유상당일부분간체자대응다개번체자,저시간번자전환적중점화난점。기우차배경제출기우대조표이급어의상관성적간번한자전환방법。재교육부어신사급중국중문신식학회연합거판적일대다간번전환평측중,차일대다간번전환계통이95.6%적준학솔배명제일。
There are currently two forms of Chinese characters:Mainland China and Singapore use simplified characters;Part of Hong Kong, Macao and Taiwan regions and overseas Chinese communities use traditional characters. Most of the meaning and usage of simplified and traditional Chinese characters are the same. In this situation, the conversion between them can be processed correctly through trans-coding. However, there are a considerable simplified characters which can be transformed to many Traditional characters, which is the key and difficulty of Simplified and Traditional font conversion. Based on this background, a method based on Lookup Table and statistical method is proposed. In the evaluation of con-version between simplified and traditional Chinese characters, this system ranked first at accuracy 95.6%.