西安电子科技大学学报(自然科学版)
西安電子科技大學學報(自然科學版)
서안전자과기대학학보(자연과학판)
Journal of Xidian University (Natural Science)
2015年
5期
26-32
,共7页
姚超%卢朝阳%李静%姜维%范志辉
姚超%盧朝暘%李靜%薑維%範誌輝
요초%로조양%리정%강유%범지휘
相似汉字识别%手写汉字识别%修正的二次判别函数%支撑向量机%分类器
相似漢字識彆%手寫漢字識彆%脩正的二次判彆函數%支撐嚮量機%分類器
상사한자식별%수사한자식별%수정적이차판별함수%지탱향량궤%분류기
similar character recognition%handw ritten Chinese character recognition%modified quadratic discriminant function(MQDF)%support vector machine(SVM)%classifier
针对手写相似汉字识别问题,提出一种新的基于分类器的方法来更全面地利用原始特征中的判别信息。新方法与现有的对相似汉字提取额外特征的方法不同,其在得到特征向量之后,首先利用修正的二次判别函数进行分类,然后用支持向量机对分类结果中的相似汉字的上述特征向量进行再一次的分类,得到最终的识别结果。利用分类混淆矩阵自动得到相似汉字集合,并提出了一种新型的存储结构用于快速查找支持向量机的训练字典。在ETL9B手写汉字数据库上的实验表明,所提出的方法可得到相对于提取额外特征方法更好的识别结果,以此证明了原始特征中存在对于相似字的判别信息,提出的基于分类器的方法可更好地利用这些判别信息。
針對手寫相似漢字識彆問題,提齣一種新的基于分類器的方法來更全麵地利用原始特徵中的判彆信息。新方法與現有的對相似漢字提取額外特徵的方法不同,其在得到特徵嚮量之後,首先利用脩正的二次判彆函數進行分類,然後用支持嚮量機對分類結果中的相似漢字的上述特徵嚮量進行再一次的分類,得到最終的識彆結果。利用分類混淆矩陣自動得到相似漢字集閤,併提齣瞭一種新型的存儲結構用于快速查找支持嚮量機的訓練字典。在ETL9B手寫漢字數據庫上的實驗錶明,所提齣的方法可得到相對于提取額外特徵方法更好的識彆結果,以此證明瞭原始特徵中存在對于相似字的判彆信息,提齣的基于分類器的方法可更好地利用這些判彆信息。
침대수사상사한자식별문제,제출일충신적기우분류기적방법래경전면지이용원시특정중적판별신식。신방법여현유적대상사한자제취액외특정적방법불동,기재득도특정향량지후,수선이용수정적이차판별함수진행분류,연후용지지향량궤대분류결과중적상사한자적상술특정향량진행재일차적분류,득도최종적식별결과。이용분류혼효구진자동득도상사한자집합,병제출료일충신형적존저결구용우쾌속사조지지향량궤적훈련자전。재ETL9B수사한자수거고상적실험표명,소제출적방법가득도상대우제취액외특정방법경호적식별결과,이차증명료원시특정중존재대우상사자적판별신식,제출적기우분류기적방법가경호지이용저사판별신식。
To solve the similar handwritten character recognition problem , a novel scheme is proposed to make better use of the feature's discriminative information . Different from the methods for extracting the extra feature for the similar characters , the Modified Quadratic Discriminant Function ( MQDF) is first adopted to classify the feature , then the Support Vector Machine(SVM) is used to discriminate the similar characters without the extra feature . To collect the subset of similar characters , the confusion matrix is employed . A new structure for storing the dictionary of the SVM is also proposed for quickly searching . Experimental results on ETL9B show the superior performance of the proposed scheme to the methods for extracting the extra feature , which proves that the feature contains discriminative information for the similar characters and that the proposed scheme can utilize this information very effectively .