软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2014年
10期
2266-2281
,共16页
王恺%李成学%王庆人%赵宏%张健
王愷%李成學%王慶人%趙宏%張健
왕개%리성학%왕경인%조굉%장건
稀疏编码%梯度方向直方图%增量线性决策分析%汉字识别%文档图像处理
稀疏編碼%梯度方嚮直方圖%增量線性決策分析%漢字識彆%文檔圖像處理
희소편마%제도방향직방도%증량선성결책분석%한자식별%문당도상처리
sparse coding (SC)%histograms of oriented gradients (HOG)%incremental linear discriminant analysis (ILDA)%Chinese character recognition%document image processing
复杂图像文字识别是基于内容图像检索的一个重要研究方向.针对图像中的文字可能存在倾斜、光照不均、噪音干扰和边缘柔化等多种异态问题,提出一种有效的异态汉字识别方法,称作SC-HOG.首先,利用稀疏编码得到基向量和稀疏系数,通过重构图像滤除噪音、处理边缘柔化;然后,利用梯度方向直方图抽取复原图像的汉字边缘梯度特征,削弱倾斜和光照的影响;最后,将获取的特征向量送入分类器,实现异态汉字的识别.通过合成数据集和真实数据集两方面的实验来验证SC-HOG方法的有效性:前一方面实验结果表明,SC-HOG方法对于倾斜、光照不均、噪音干扰和边缘柔化等异态情况有较强的鲁棒性;后一方面实验结果表明,SC-HOG 方法在原生数字图像和场景图像真实样本集上也能取得较好的结果.
複雜圖像文字識彆是基于內容圖像檢索的一箇重要研究方嚮.針對圖像中的文字可能存在傾斜、光照不均、譟音榦擾和邊緣柔化等多種異態問題,提齣一種有效的異態漢字識彆方法,稱作SC-HOG.首先,利用稀疏編碼得到基嚮量和稀疏繫數,通過重構圖像濾除譟音、處理邊緣柔化;然後,利用梯度方嚮直方圖抽取複原圖像的漢字邊緣梯度特徵,削弱傾斜和光照的影響;最後,將穫取的特徵嚮量送入分類器,實現異態漢字的識彆.通過閤成數據集和真實數據集兩方麵的實驗來驗證SC-HOG方法的有效性:前一方麵實驗結果錶明,SC-HOG方法對于傾斜、光照不均、譟音榦擾和邊緣柔化等異態情況有較彊的魯棒性;後一方麵實驗結果錶明,SC-HOG 方法在原生數字圖像和場景圖像真實樣本集上也能取得較好的結果.
복잡도상문자식별시기우내용도상검색적일개중요연구방향.침대도상중적문자가능존재경사、광조불균、조음간우화변연유화등다충이태문제,제출일충유효적이태한자식별방법,칭작SC-HOG.수선,이용희소편마득도기향량화희소계수,통과중구도상려제조음、처리변연유화;연후,이용제도방향직방도추취복원도상적한자변연제도특정,삭약경사화광조적영향;최후,장획취적특정향량송입분류기,실현이태한자적식별.통과합성수거집화진실수거집량방면적실험래험증SC-HOG방법적유효성:전일방면실험결과표명,SC-HOG방법대우경사、광조불균、조음간우화변연유화등이태정황유교강적로봉성;후일방면실험결과표명,SC-HOG 방법재원생수자도상화장경도상진실양본집상야능취득교호적결과.
Recognizing characters from the complex image plays an important role in content-based image retrieval and has been well studied in past decades. The methods for normal characters recognition, however, become inapplicable when characters suffer from skew, uneven illumination, noise and anti-aliasing. A new method, named SC-HOG, is proposed in this paper for recognizing abnormal Chinese characters. Firstly, sparse coding is applied on abnormal character image to smooth noises and reduce anti-aliasing. Secondly, HOG features that help reducing the influence of skew and uneven illumination are extracted. Finally, these features are fed into a well-trained classifier to recognize the character of the given image. Experiments on both synthetic and real data sets show that the proposed method, SC-HOG, achieves high accuracy on abnormal Chinese characters recognition.