计算机与现代化
計算機與現代化
계산궤여현대화
COMPUTER AND MODERNIZATION
2013年
12期
145-148,154
,共5页
手写识别%数据挖掘%图文分离%分类模型
手寫識彆%數據挖掘%圖文分離%分類模型
수사식별%수거알굴%도문분리%분류모형
sketch recognition%data mining%text-shape separation%classification model
手写识别作为改善人机交互的技术之一已经变得越来越重要,涌现了大量对手写文字和手绘图形的研究工作,而作为手写识别的一个重要部分,对图形和文本的分类工作一直没有获得足够的重视。本文基于开源数据挖掘工具Weka设计并实现一种手写图文分离方法,基于LogitBoost、Random Forest和LADTree三种不同分类器的测试结果表明,Logit-Boost的综合分类效果最好。通过联合3个分类器能够实现精确的图形判定,但文本的分类效率则受限于分类效果最差的分类器。同时基于信息增益评估结果,分析了不同特征对图文分类的影响。
手寫識彆作為改善人機交互的技術之一已經變得越來越重要,湧現瞭大量對手寫文字和手繪圖形的研究工作,而作為手寫識彆的一箇重要部分,對圖形和文本的分類工作一直沒有穫得足夠的重視。本文基于開源數據挖掘工具Weka設計併實現一種手寫圖文分離方法,基于LogitBoost、Random Forest和LADTree三種不同分類器的測試結果錶明,Logit-Boost的綜閤分類效果最好。通過聯閤3箇分類器能夠實現精確的圖形判定,但文本的分類效率則受限于分類效果最差的分類器。同時基于信息增益評估結果,分析瞭不同特徵對圖文分類的影響。
수사식별작위개선인궤교호적기술지일이경변득월래월중요,용현료대량대수사문자화수회도형적연구공작,이작위수사식별적일개중요부분,대도형화문본적분류공작일직몰유획득족구적중시。본문기우개원수거알굴공구Weka설계병실현일충수사도문분리방법,기우LogitBoost、Random Forest화LADTree삼충불동분류기적측시결과표명,Logit-Boost적종합분류효과최호。통과연합3개분류기능구실현정학적도형판정,단문본적분류효솔칙수한우분류효과최차적분류기。동시기우신식증익평고결과,분석료불동특정대도문분류적영향。
As a technology to improve human-computer interaction , handwriting recognition is becoming more and more impor-tant.However, the distinction of handwriting texts and shapes has not drawn enough attention .In this paper, we designed and implemented a handwriting text and shape separation approach based on Weka .The experiment results based on three classifica-tion techniques , LogitBoost , RandomForest and LogitBoost , show that LogitBoost performances best .Through a combination of these three classifiers , shapes can be recognized more accurately , while the precision of text is limited by the classifier with lowest accuracy.Moreover, the effect of different features to the results is analyzed based on Information Gain Method .