厦门大学学报(自然科学版)
廈門大學學報(自然科學版)
하문대학학보(자연과학판)
JOURNAL OF XIAMEN UNIVERSITY (NATURAL SCIENCE)
2010年
3期
333-338
,共6页
特征提取%随机森林%转导推理
特徵提取%隨機森林%轉導推理
특정제취%수궤삼림%전도추리
提出一种基于随机森林和转导推理的特征提取方法,步骤如下:1)利用带标签的训练样本建立随机森林模型;2)将无标签的测试数据导入随机森林模型中,生成全体数据(训练样本和测试数据)的相似性矩阵;3)对该相似性矩阵进行多维尺度变换得到全体数据的低维数据表示,即低维特征,使得原高维数据在低维空间中具有更好的可分性.UCI数据库的实验结果表明:与主成分分析方法相比,该方法将无标签测试集的数据分布信息转移到相似性矩阵中,更好地刻画整个样本空间上的数据分布特性,从而提高分类器的性能,是一种行之有效的特征提取方法.最后还讨论了特征提取维数对模型准确率的影响,为实际应用提供参考.
提齣一種基于隨機森林和轉導推理的特徵提取方法,步驟如下:1)利用帶標籤的訓練樣本建立隨機森林模型;2)將無標籤的測試數據導入隨機森林模型中,生成全體數據(訓練樣本和測試數據)的相似性矩陣;3)對該相似性矩陣進行多維呎度變換得到全體數據的低維數據錶示,即低維特徵,使得原高維數據在低維空間中具有更好的可分性.UCI數據庫的實驗結果錶明:與主成分分析方法相比,該方法將無標籤測試集的數據分佈信息轉移到相似性矩陣中,更好地刻畫整箇樣本空間上的數據分佈特性,從而提高分類器的性能,是一種行之有效的特徵提取方法.最後還討論瞭特徵提取維數對模型準確率的影響,為實際應用提供參攷.
제출일충기우수궤삼림화전도추리적특정제취방법,보취여하:1)이용대표첨적훈련양본건립수궤삼림모형;2)장무표첨적측시수거도입수궤삼림모형중,생성전체수거(훈련양본화측시수거)적상사성구진;3)대해상사성구진진행다유척도변환득도전체수거적저유수거표시,즉저유특정,사득원고유수거재저유공간중구유경호적가분성.UCI수거고적실험결과표명:여주성분분석방법상비,해방법장무표첨측시집적수거분포신식전이도상사성구진중,경호지각화정개양본공간상적수거분포특성,종이제고분류기적성능,시일충행지유효적특정제취방법.최후환토론료특정제취유수대모형준학솔적영향,위실제응용제공삼고.