中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2011年
1期
110-115
,共6页
罗阳%季铎%张桂平%王莹莹
囉暘%季鐸%張桂平%王瑩瑩
라양%계탁%장계평%왕형형
Web挖掘%网页分类%双语资源%频繁序列模式%支持向量机
Web挖掘%網頁分類%雙語資源%頻繁序列模式%支持嚮量機
Web알굴%망혈분류%쌍어자원%빈번서렬모식%지지향량궤
双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要.该文提出一种面向单一双语网页的双语资源挖掘方法,该方法重点采用了以频繁序列模式为特征的SVM分类方法,实现了包舍双语资源的单一双语网页的筛选与识别,并以此为基础挖掘具有对译的双语资源.实验结果表明,该方法能够有效改进双语资源挖掘的质量.
雙語資源是機器翻譯和跨語言信息檢索等領域的重要資源,但是由于語料庫真實性、時效性和語種靈活性等問題,使得現有的雙語資源的規模很難滿足實際應用的需要.該文提齣一種麵嚮單一雙語網頁的雙語資源挖掘方法,該方法重點採用瞭以頻繁序列模式為特徵的SVM分類方法,實現瞭包捨雙語資源的單一雙語網頁的篩選與識彆,併以此為基礎挖掘具有對譯的雙語資源.實驗結果錶明,該方法能夠有效改進雙語資源挖掘的質量.
쌍어자원시궤기번역화과어언신식검색등영역적중요자원,단시유우어료고진실성、시효성화어충령활성등문제,사득현유적쌍어자원적규모흔난만족실제응용적수요.해문제출일충면향단일쌍어망혈적쌍어자원알굴방법,해방법중점채용료이빈번서렬모식위특정적SVM분류방법,실현료포사쌍어자원적단일쌍어망혈적사선여식별,병이차위기출알굴구유대역적쌍어자원.실험결과표명,해방법능구유효개진쌍어자원알굴적질량.