计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2013年
8期
1650-1658
,共9页
林煜明%朱涛%王晓玲%周傲英
林煜明%硃濤%王曉玲%週傲英
림욱명%주도%왕효령%주오영
观点分析%集成学习%分类准确度%多样性%近似算法
觀點分析%集成學習%分類準確度%多樣性%近似算法
관점분석%집성학습%분류준학도%다양성%근사산법
opinion analysis%ensemble learning%classification accuracy%diversity%approximation algorithm
网络上用户生成的数据(User-Generated Data)富含用户的观点(情感),自动识别这些用户观点对很多的Web应用具有重要的作用,例如推荐系统和电子商务/政务智能系统等.但用户的观点表达通常与领域是相关的,因此对于不同的分析领域,用户难以选择到效果最好的分类器.文中针对用户观点分析问题设计了一个三阶段的多分类器集成框架,在此框架下用户只需指定可用的分类器,系统将自动选择一组最优的分类器组合,将它们的预测结果整合为最终分类结果,同时能够保证分类效果优越于最好的单分类器.针对分类器组的选择过程中面临的组合爆炸问题,文中在考虑分类器的准确度和多样性的基础上,设计了一个贪心算法选择成员分类器,并证明该算法是2-近似的.最后,在不同领域的真实数据集上进行了充分的实验,实验结果验证了文中提出的框架和算法的有效性.
網絡上用戶生成的數據(User-Generated Data)富含用戶的觀點(情感),自動識彆這些用戶觀點對很多的Web應用具有重要的作用,例如推薦繫統和電子商務/政務智能繫統等.但用戶的觀點錶達通常與領域是相關的,因此對于不同的分析領域,用戶難以選擇到效果最好的分類器.文中針對用戶觀點分析問題設計瞭一箇三階段的多分類器集成框架,在此框架下用戶隻需指定可用的分類器,繫統將自動選擇一組最優的分類器組閤,將它們的預測結果整閤為最終分類結果,同時能夠保證分類效果優越于最好的單分類器.針對分類器組的選擇過程中麵臨的組閤爆炸問題,文中在攷慮分類器的準確度和多樣性的基礎上,設計瞭一箇貪心算法選擇成員分類器,併證明該算法是2-近似的.最後,在不同領域的真實數據集上進行瞭充分的實驗,實驗結果驗證瞭文中提齣的框架和算法的有效性.
망락상용호생성적수거(User-Generated Data)부함용호적관점(정감),자동식별저사용호관점대흔다적Web응용구유중요적작용,례여추천계통화전자상무/정무지능계통등.단용호적관점표체통상여영역시상관적,인차대우불동적분석영역,용호난이선택도효과최호적분류기.문중침대용호관점분석문제설계료일개삼계단적다분류기집성광가,재차광가하용호지수지정가용적분류기,계통장자동선택일조최우적분류기조합,장타문적예측결과정합위최종분류결과,동시능구보증분류효과우월우최호적단분류기.침대분류기조적선택과정중면림적조합폭작문제,문중재고필분류기적준학도화다양성적기출상,설계료일개탐심산법선택성원분류기,병증명해산법시2-근사적.최후,재불동영역적진실수거집상진행료충분적실험,실험결과험증료문중제출적광가화산법적유효성.