情报杂志
情報雜誌
정보잡지
JOURNAL OF INFORMATION
2010年
8期
131-135
,共5页
WEB挖掘%文本挖掘%海量数据%数据转换%网上清洗
WEB挖掘%文本挖掘%海量數據%數據轉換%網上清洗
WEB알굴%문본알굴%해량수거%수거전환%망상청세
对海量数据采集与挖掘技术的问题,提出如何利用WEB文本进行多断点控制、并发采集、网上清洗等新技术方法进行海量数据采集及处理,构建了基于WEB文本海量数据挖掘的应用统计系统,实现了三千多万条原始数据的采集、转换、统计.
對海量數據採集與挖掘技術的問題,提齣如何利用WEB文本進行多斷點控製、併髮採集、網上清洗等新技術方法進行海量數據採集及處理,構建瞭基于WEB文本海量數據挖掘的應用統計繫統,實現瞭三韆多萬條原始數據的採集、轉換、統計.
대해량수거채집여알굴기술적문제,제출여하이용WEB문본진행다단점공제、병발채집、망상청세등신기술방법진행해량수거채집급처리,구건료기우WEB문본해량수거알굴적응용통계계통,실현료삼천다만조원시수거적채집、전환、통계.