西藏大学学报
西藏大學學報
서장대학학보
Journal of Tibet University
2012年
5期
61~65
,共null页
虚词识别 藏文分词 藏文信息处理 中文信息处理
虛詞識彆 藏文分詞 藏文信息處理 中文信息處理
허사식별 장문분사 장문신식처리 중문신식처리
Function word recognition; Tibetan participle word; Tibetan; Information processing; Chinese
藏文分词是藏文自然语言处理的基础。根据藏文虚词在藏文文本中的特殊作用以及虚词的兼类性、结合性、黏着变体性和还原特性,设计实现了一个基于藏语虚词切分的正向最大匹配的藏文分词系统,该系统对原始文本进行逐次扫描处理得到分词结果。实验表明,文章提出的藏文分词系统具有较高的切分精度和切分速度。
藏文分詞是藏文自然語言處理的基礎。根據藏文虛詞在藏文文本中的特殊作用以及虛詞的兼類性、結閤性、黏著變體性和還原特性,設計實現瞭一箇基于藏語虛詞切分的正嚮最大匹配的藏文分詞繫統,該繫統對原始文本進行逐次掃描處理得到分詞結果。實驗錶明,文章提齣的藏文分詞繫統具有較高的切分精度和切分速度。
장문분사시장문자연어언처리적기출。근거장문허사재장문문본중적특수작용이급허사적겸류성、결합성、점착변체성화환원특성,설계실현료일개기우장어허사절분적정향최대필배적장문분사계통,해계통대원시문본진행축차소묘처리득도분사결과。실험표명,문장제출적장문분사계통구유교고적절분정도화절분속도。
The Tibetan participle word is the baseline of research on the processing Tibetan natural language.According to the special role of the Tibetan function words in the Tibetan text as well as its integrating features,agglutinative variant and restore features,a Tibetan participle words system was designed based on the forward maximum matching of Tibetan function words segmentation.The original text word is carried on scanning process gradually by this system to get segmentation results.The experiments showed that the function words segmentation correct rate possess more than 90% with the system.