计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2010年
2期
110-113
,共4页
信息熵%半监督学习%主动学习%分类
信息熵%半鑑督學習%主動學習%分類
신식적%반감독학습%주동학습%분류
针对小规模训练样本不足以支持学习器对含有大量潜在不确定因素的未标样本集分类的问题,提出了一种基于信息熵的主动学习方法,引入信息熵的离散事件概率估计理论,通过对未标文档熵值的计算,结合二阶段学习策略,主动学习利用现有知识,结合实验样本环境,主动地选取最有可能的解决问题的样本并标注它们的类别,获得新的参数,重新训练分类器,选择最有利分类器性能的样本,迭代直到未标样本集为空.实验结果表明,该方法取得了较好的分类效果.
針對小規模訓練樣本不足以支持學習器對含有大量潛在不確定因素的未標樣本集分類的問題,提齣瞭一種基于信息熵的主動學習方法,引入信息熵的離散事件概率估計理論,通過對未標文檔熵值的計算,結閤二階段學習策略,主動學習利用現有知識,結閤實驗樣本環境,主動地選取最有可能的解決問題的樣本併標註它們的類彆,穫得新的參數,重新訓練分類器,選擇最有利分類器性能的樣本,迭代直到未標樣本集為空.實驗結果錶明,該方法取得瞭較好的分類效果.
침대소규모훈련양본불족이지지학습기대함유대량잠재불학정인소적미표양본집분류적문제,제출료일충기우신식적적주동학습방법,인입신식적적리산사건개솔고계이론,통과대미표문당적치적계산,결합이계단학습책략,주동학습이용현유지식,결합실험양본배경,주동지선취최유가능적해결문제적양본병표주타문적유별,획득신적삼수,중신훈련분류기,선택최유리분류기성능적양본,질대직도미표양본집위공.실험결과표명,해방법취득료교호적분류효과.