术语标准化与信息技术
術語標準化與信息技術
술어표준화여신식기술
TERMINOLOGY STANDARDIZATION AND INFORMATION TECHNOLOGY
2004年
3期
31-35
,共5页
Web%文本挖掘%XML%LawsMiner%语料库
Web%文本挖掘%XML%LawsMiner%語料庫
Web%문본알굴%XML%LawsMiner%어료고
语料文本的挖掘和文本语料库的建设对语言学研究具有重要意义,因此语料文本的挖掘和文本语料库的建设就越来越值得探讨.但由于Web上文本的半结构化特征和异构文本源的问题,在Web上的文本挖掘具有很多困难.本文提出了将XML技术与Web挖掘技术相结合,根据研究者的个人需求定制个性化的Web中文文本挖掘系统框架和实现方案,并给出了面向法律领域的Web文本挖掘系统LawsMiner的实例.
語料文本的挖掘和文本語料庫的建設對語言學研究具有重要意義,因此語料文本的挖掘和文本語料庫的建設就越來越值得探討.但由于Web上文本的半結構化特徵和異構文本源的問題,在Web上的文本挖掘具有很多睏難.本文提齣瞭將XML技術與Web挖掘技術相結閤,根據研究者的箇人需求定製箇性化的Web中文文本挖掘繫統框架和實現方案,併給齣瞭麵嚮法律領域的Web文本挖掘繫統LawsMiner的實例.
어료문본적알굴화문본어료고적건설대어언학연구구유중요의의,인차어료문본적알굴화문본어료고적건설취월래월치득탐토.단유우Web상문본적반결구화특정화이구문본원적문제,재Web상적문본알굴구유흔다곤난.본문제출료장XML기술여Web알굴기술상결합,근거연구자적개인수구정제개성화적Web중문문본알굴계통광가화실현방안,병급출료면향법률영역적Web문본알굴계통LawsMiner적실례.