中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2011年
3期
112-117
,共6页
诺明花%吴健%刘汇丹%丁治明
諾明花%吳健%劉彙丹%丁治明
낙명화%오건%류회단%정치명
藏文语块%短语译文获取%藏文信息处理%中文信息处理
藏文語塊%短語譯文穫取%藏文信息處理%中文信息處理
장문어괴%단어역문획취%장문신식처리%중문신식처리
该文从法律法规和公文领域汉藏语料中对待翻译汉语短语提取藏语译文.目前普遍采用的短语对抽取方法需要依赖于词性或句法分析等资源或词对齐技术.考虑现阶段藏文资源不足,词法句法相关技术不成熟,该文提出藏文词串频率统计方法(TSM)和藏文词序列相交算法(TIA)两种方法来获取藏语译文.其中TSM抽取1-1连续和非连续短语准确率达到90%左右,但遗漏1-n情况.TIA能够抽取1-n连续和非连续藏文语块,准确率达到81%.
該文從法律法規和公文領域漢藏語料中對待翻譯漢語短語提取藏語譯文.目前普遍採用的短語對抽取方法需要依賴于詞性或句法分析等資源或詞對齊技術.攷慮現階段藏文資源不足,詞法句法相關技術不成熟,該文提齣藏文詞串頻率統計方法(TSM)和藏文詞序列相交算法(TIA)兩種方法來穫取藏語譯文.其中TSM抽取1-1連續和非連續短語準確率達到90%左右,但遺漏1-n情況.TIA能夠抽取1-n連續和非連續藏文語塊,準確率達到81%.
해문종법율법규화공문영역한장어료중대대번역한어단어제취장어역문.목전보편채용적단어대추취방법수요의뢰우사성혹구법분석등자원혹사대제기술.고필현계단장문자원불족,사법구법상관기술불성숙,해문제출장문사천빈솔통계방법(TSM)화장문사서렬상교산법(TIA)량충방법래획취장어역문.기중TSM추취1-1련속화비련속단어준학솔체도90%좌우,단유루1-n정황.TIA능구추취1-n련속화비련속장문어괴,준학솔체도81%.