中国电子商情·通信市场
中國電子商情·通信市場
중국전자상정·통신시장
TELECOM MARKET
2010年
5期
118-124
,共7页
数据流%滑动窗口模型%概要数据库%TOP-N查询%知识库
數據流%滑動窗口模型%概要數據庫%TOP-N查詢%知識庫
수거류%활동창구모형%개요수거고%TOP-N사순%지식고
通过对数据流的研究,可以得出一系列的结论,如:数据流具有实时性、持续性、广泛性、语义不定性等特征.在传统的数据流处理技术,如:直方图方法、抽样方法、哈希方法的基础上,本文提出了使用基于时间滑动窗口模型的方法改构建概要数据库,从而为用基于学习的TOP-N查询解决数据流问题提供了可能.在传统的TOP-N查询的基础上,本文提出一种基于学习的top-N查询方法.该方法首先需要建立一个知识库,用来存储查询简档,然后对知识库进行检索.在检索知识库时,需要通过计算分布密度ρ,得到查询半径r,从而近似地查询到符合要求的N个结果.当有新近一批数据进入概要数据库时,还需要对知识库进行更新、维护.
通過對數據流的研究,可以得齣一繫列的結論,如:數據流具有實時性、持續性、廣汎性、語義不定性等特徵.在傳統的數據流處理技術,如:直方圖方法、抽樣方法、哈希方法的基礎上,本文提齣瞭使用基于時間滑動窗口模型的方法改構建概要數據庫,從而為用基于學習的TOP-N查詢解決數據流問題提供瞭可能.在傳統的TOP-N查詢的基礎上,本文提齣一種基于學習的top-N查詢方法.該方法首先需要建立一箇知識庫,用來存儲查詢簡檔,然後對知識庫進行檢索.在檢索知識庫時,需要通過計算分佈密度ρ,得到查詢半徑r,從而近似地查詢到符閤要求的N箇結果.噹有新近一批數據進入概要數據庫時,還需要對知識庫進行更新、維護.
통과대수거류적연구,가이득출일계렬적결론,여:수거류구유실시성、지속성、엄범성、어의불정성등특정.재전통적수거류처리기술,여:직방도방법、추양방법、합희방법적기출상,본문제출료사용기우시간활동창구모형적방법개구건개요수거고,종이위용기우학습적TOP-N사순해결수거류문제제공료가능.재전통적TOP-N사순적기출상,본문제출일충기우학습적top-N사순방법.해방법수선수요건립일개지식고,용래존저사순간당,연후대지식고진행검색.재검색지식고시,수요통과계산분포밀도ρ,득도사순반경r,종이근사지사순도부합요구적N개결과.당유신근일비수거진입개요수거고시,환수요대지식고진행경신、유호.