计算机工程与应用
計算機工程與應用
계산궤공정여응용
Computer Engineering and Applications
2015年
23期
131-138,225
,共9页
迁移学习%欧式距离%余弦距离%保护型%归一化约束%过维数
遷移學習%歐式距離%餘絃距離%保護型%歸一化約束%過維數
천이학습%구식거리%여현거리%보호형%귀일화약속%과유수
transfer learning%Euclidean distance%cosine distance%protection-type%normalization constraints%over dimension
以往研究者都从公式的合理性出发研究迁移学习和传统机器学习,但他们忽视了对问题的整体性考虑,致使在具体应用到文本分类问题时,无法实现彻底的分类.通过研究文本分类的整个过程,在k-均值算法中使用余弦距离,显著提高了实验结果;提出保护型迭代思想,同时弃用传统的词特征空间,采用隐空间作为特征向量空间,实施归一化约束.以CCI算法为例,结合提出的改进思想,产生改进算法PCCI,在降低计算复杂度的同时显著提高迁移学习的分类正确率.通过在数据集20-NewsGroups和Reuters-21578上测试并与现有其他迁移学习算法进行比较,证明了该改进算法的优越性.
以往研究者都從公式的閤理性齣髮研究遷移學習和傳統機器學習,但他們忽視瞭對問題的整體性攷慮,緻使在具體應用到文本分類問題時,無法實現徹底的分類.通過研究文本分類的整箇過程,在k-均值算法中使用餘絃距離,顯著提高瞭實驗結果;提齣保護型迭代思想,同時棄用傳統的詞特徵空間,採用隱空間作為特徵嚮量空間,實施歸一化約束.以CCI算法為例,結閤提齣的改進思想,產生改進算法PCCI,在降低計算複雜度的同時顯著提高遷移學習的分類正確率.通過在數據集20-NewsGroups和Reuters-21578上測試併與現有其他遷移學習算法進行比較,證明瞭該改進算法的優越性.
이왕연구자도종공식적합이성출발연구천이학습화전통궤기학습,단타문홀시료대문제적정체성고필,치사재구체응용도문본분류문제시,무법실현철저적분류.통과연구문본분류적정개과정,재k-균치산법중사용여현거리,현저제고료실험결과;제출보호형질대사상,동시기용전통적사특정공간,채용은공간작위특정향량공간,실시귀일화약속.이CCI산법위례,결합제출적개진사상,산생개진산법PCCI,재강저계산복잡도적동시현저제고천이학습적분류정학솔.통과재수거집20-NewsGroups화Reuters-21578상측시병여현유기타천이학습산법진행비교,증명료해개진산법적우월성.