情报学报
情報學報
정보학보
2011年
12期
1242-1248
,共7页
最长短语识别%类别信息消歧%特征提取
最長短語識彆%類彆信息消歧%特徵提取
최장단어식별%유별신식소기%특정제취
随着文本分类算法的实用化和多语种信息的日益丰富,当机构或组织的文档管理部门日益依赖自动文本分类时,如何解决多语种文档的归类问题成为新的研究热点,跨语言文本分类技术就是在这样的背景下提出的.本文以国家图书文献中心(NSTL)的多语种语料为研究对象,以一部科技类的汉英科技词典为资源工具,提出了一种基于跨语言文本分类的跨语言特征提取方法,实验结果验证了在简单翻译资源条件下对科技文献进行跨语言分类的可行性,也为下一阶段建立实用跨语言文类系统奠定了基础.
隨著文本分類算法的實用化和多語種信息的日益豐富,噹機構或組織的文檔管理部門日益依賴自動文本分類時,如何解決多語種文檔的歸類問題成為新的研究熱點,跨語言文本分類技術就是在這樣的揹景下提齣的.本文以國傢圖書文獻中心(NSTL)的多語種語料為研究對象,以一部科技類的漢英科技詞典為資源工具,提齣瞭一種基于跨語言文本分類的跨語言特徵提取方法,實驗結果驗證瞭在簡單翻譯資源條件下對科技文獻進行跨語言分類的可行性,也為下一階段建立實用跨語言文類繫統奠定瞭基礎.
수착문본분류산법적실용화화다어충신식적일익봉부,당궤구혹조직적문당관리부문일익의뢰자동문본분류시,여하해결다어충문당적귀류문제성위신적연구열점,과어언문본분류기술취시재저양적배경하제출적.본문이국가도서문헌중심(NSTL)적다어충어료위연구대상,이일부과기류적한영과기사전위자원공구,제출료일충기우과어언문본분류적과어언특정제취방법,실험결과험증료재간단번역자원조건하대과기문헌진행과어언분류적가행성,야위하일계단건립실용과어언문류계통전정료기출.