计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2006年
7期
166-168
,共3页
数据流%变化%概要数据结构%精确抽样%朴素贝叶斯分类%阈值
數據流%變化%概要數據結構%精確抽樣%樸素貝葉斯分類%閾值
수거류%변화%개요수거결구%정학추양%박소패협사분류%역치
针对数据流上变化的挖掘问题,提出了算法NBCC,首先利用精确抽样的方法对数据流构建概要数据结构,然后借鉴经典朴素贝叶斯分类方法的思想,将训练样本集分成Ci类,i=1,2,…,m.对测试样本集设定一个阈值α:当P(Ci|X)<α时,即当样本X属于任何已知类别Ci的概率都小于设定的α时,表明有变化发生,并且保留该变化,记为新类Cm+1,并重复使用该方法.
針對數據流上變化的挖掘問題,提齣瞭算法NBCC,首先利用精確抽樣的方法對數據流構建概要數據結構,然後藉鑒經典樸素貝葉斯分類方法的思想,將訓練樣本集分成Ci類,i=1,2,…,m.對測試樣本集設定一箇閾值α:噹P(Ci|X)<α時,即噹樣本X屬于任何已知類彆Ci的概率都小于設定的α時,錶明有變化髮生,併且保留該變化,記為新類Cm+1,併重複使用該方法.
침대수거류상변화적알굴문제,제출료산법NBCC,수선이용정학추양적방법대수거류구건개요수거결구,연후차감경전박소패협사분류방법적사상,장훈련양본집분성Ci류,i=1,2,…,m.대측시양본집설정일개역치α:당P(Ci|X)<α시,즉당양본X속우임하이지유별Ci적개솔도소우설정적α시,표명유변화발생,병차보류해변화,기위신류Cm+1,병중복사용해방법.