计算机科学与探索
計算機科學與探索
계산궤과학여탐색
JOURNAL OF FRONTIERS OF COMPUTER SCIENCE & TECHNOLOGY
2013年
7期
639-648
,共10页
赵婷婷%赵素云%裴斌%陈红%李翠平
趙婷婷%趙素雲%裴斌%陳紅%李翠平
조정정%조소운%배빈%진홍%리취평
分类%随机性%概率数据%辨识距离
分類%隨機性%概率數據%辨識距離
분류%수궤성%개솔수거%변식거리
classification%randomness%probabilistic data%discernible distance
分类作为一类重要的数据挖掘问题被广泛地研究和应用,然而先前的研究主要针对确定数据上的分类问题,由于目前例如传感器等数据采集工具的普遍使用,概率数据广泛存在,在这类数据上进行分类研究十分必要.提出了一种新的概率数据模型,它既考虑了概率分布上的随机性,又包含了独立区间上的相似度;定义了一种新的辨识距离来衡量这类概率数据元组之间的距离;最后提出了概率数据上基于规则的分类算法,在基础分类算法上,引入了一种带有可变精度的分类算法来降低噪声或者扰动,提高了分类的精度.实验结果证明了该算法的有效性.
分類作為一類重要的數據挖掘問題被廣汎地研究和應用,然而先前的研究主要針對確定數據上的分類問題,由于目前例如傳感器等數據採集工具的普遍使用,概率數據廣汎存在,在這類數據上進行分類研究十分必要.提齣瞭一種新的概率數據模型,它既攷慮瞭概率分佈上的隨機性,又包含瞭獨立區間上的相似度;定義瞭一種新的辨識距離來衡量這類概率數據元組之間的距離;最後提齣瞭概率數據上基于規則的分類算法,在基礎分類算法上,引入瞭一種帶有可變精度的分類算法來降低譟聲或者擾動,提高瞭分類的精度.實驗結果證明瞭該算法的有效性.
분류작위일류중요적수거알굴문제피엄범지연구화응용,연이선전적연구주요침대학정수거상적분류문제,유우목전례여전감기등수거채집공구적보편사용,개솔수거엄범존재,재저류수거상진행분류연구십분필요.제출료일충신적개솔수거모형,타기고필료개솔분포상적수궤성,우포함료독립구간상적상사도;정의료일충신적변식거리래형량저류개솔수거원조지간적거리;최후제출료개솔수거상기우규칙적분류산법,재기출분류산법상,인입료일충대유가변정도적분류산법래강저조성혹자우동,제고료분류적정도.실험결과증명료해산법적유효성.