计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2014年
19期
85-88
,共4页
人工免疫系统%树突细胞算法%自动数据预处理%主成分分析法
人工免疫繫統%樹突細胞算法%自動數據預處理%主成分分析法
인공면역계통%수돌세포산법%자동수거예처리%주성분분석법
Artificial Immune System(AIS)%Dendritic Cell Algorithm(DCA)%automatic data preprocessing%Principal Component Analysis(PCA)
树突细胞算法(DCA)能够在数据规模方面有效地处理大数据集。然而,在处理复杂数据集时,数据规模不是唯一需要考虑的,也要考虑高维数据问题。树突细胞算法的复杂性出现在数据预处理阶段,因此数据降维就尤其重要,以往,树突细胞算法的数据预处理是根据问题域的专家知识采用手工方法执行的,既浪费时间又是难以实现的。提出利用主成分分析法实现DCA的自动数据预处理,提取和选择相关特征使算法适应于基础数据的特点。在KDDCUP’99数据集上将PCA应用于DCA显示其可行性,并产生有用且准确的分类结果。
樹突細胞算法(DCA)能夠在數據規模方麵有效地處理大數據集。然而,在處理複雜數據集時,數據規模不是唯一需要攷慮的,也要攷慮高維數據問題。樹突細胞算法的複雜性齣現在數據預處理階段,因此數據降維就尤其重要,以往,樹突細胞算法的數據預處理是根據問題域的專傢知識採用手工方法執行的,既浪費時間又是難以實現的。提齣利用主成分分析法實現DCA的自動數據預處理,提取和選擇相關特徵使算法適應于基礎數據的特點。在KDDCUP’99數據集上將PCA應用于DCA顯示其可行性,併產生有用且準確的分類結果。
수돌세포산법(DCA)능구재수거규모방면유효지처리대수거집。연이,재처리복잡수거집시,수거규모불시유일수요고필적,야요고필고유수거문제。수돌세포산법적복잡성출현재수거예처리계단,인차수거강유취우기중요,이왕,수돌세포산법적수거예처리시근거문제역적전가지식채용수공방법집행적,기낭비시간우시난이실현적。제출이용주성분분석법실현DCA적자동수거예처리,제취화선택상관특정사산법괄응우기출수거적특점。재KDDCUP’99수거집상장PCA응용우DCA현시기가행성,병산생유용차준학적분류결과。
The Dendritic Cell algorithm(DCA)can efficiently and effectively process large datasets in terms of data size. However, data size is not the only concern when handling complex datasets, high dimensionality is often a bigger prob-lem. Complexity occurs at the data preprocessing stage of the DCA when dimensionality reduction is required. Previously, the data pre-processing of the DCA is performed manually based on users’expert knowledge of a given problem domain, which is time consuming and sometime difficult to achieve. In this paper, automating the data pre-processing for DCA is proposed using Principal Component Analysis(PCA), which extracts and selects relevant features, and adapts the algo-rithm to characteristics of the underlying data. The application of PCA to the DCA in KDDCUP’99 data set shows feasi-bility and generates useful and accurate classification results.