计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
28期
146-148
,共3页
领域知识%知识库%数据清洗%海量数据
領域知識%知識庫%數據清洗%海量數據
영역지식%지식고%수거청세%해량수거
针对传统知识库表示的局限性,通过分解和重组领域知识,建立扩展树状结构的知识库,其中叶结点对应具体知识实例,称为原子知识,非叶结点只对应知识概念.同时提出相关的数据清洗算法,根据用户的选择,自动提取原子知识进行分析,消除重复,按照处理权重建立原子知识序列,然后逐一对数据进行清洗.实验表明,该算法能有效优化用户的请求,减少时海量数据的遍历次数,海量数据的清洗效率明显提高.
針對傳統知識庫錶示的跼限性,通過分解和重組領域知識,建立擴展樹狀結構的知識庫,其中葉結點對應具體知識實例,稱為原子知識,非葉結點隻對應知識概唸.同時提齣相關的數據清洗算法,根據用戶的選擇,自動提取原子知識進行分析,消除重複,按照處理權重建立原子知識序列,然後逐一對數據進行清洗.實驗錶明,該算法能有效優化用戶的請求,減少時海量數據的遍歷次數,海量數據的清洗效率明顯提高.
침대전통지식고표시적국한성,통과분해화중조영역지식,건립확전수상결구적지식고,기중협결점대응구체지식실례,칭위원자지식,비협결점지대응지식개념.동시제출상관적수거청세산법,근거용호적선택,자동제취원자지식진행분석,소제중복,안조처리권중건립원자지식서렬,연후축일대수거진행청세.실험표명,해산법능유효우화용호적청구,감소시해량수거적편력차수,해량수거적청세효솔명현제고.