软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2011年
12期
2919-2933
,共15页
视频文字识别%基于颜色的聚类%多帧融合%视频检索%噪声去除
視頻文字識彆%基于顏色的聚類%多幀融閤%視頻檢索%譟聲去除
시빈문자식별%기우안색적취류%다정융합%시빈검색%조성거제
提出一种基于颜色聚类和多帧融合的视频文字识别方法,首先,在视频文字检测模块,综合考虑了文字区域的两个显著特征:一致的颜色和密集的边缘,利用近邻传播聚类算法,根据图像中边缘颜色的复杂程度,自适应地把彩色边缘分解到若干边缘子图中去,使得在各个子图中检测文字区域更为准确.其次,在视频文字增强模块,基于文字笔画强度图过滤掉模糊的文字区域,并综合平均融合和最小值融合的优点,对在不同视频帧中检测到的、包含相同内容的文字区域进行融合,能够得到背景更为平滑、笔画更为清晰的文字区域图像.最后,在视频文字提取模块,通过自适应地选取具有较高文字对比度的颜色分量进行二值化,能够取得比现有方法更好的二值化结果:另一方面,基于图像中背景与文字的颜色差异,利用颜色聚类的方法去除噪声,能够有效地提高文字识别率.实验结果表明,该方法能够比现有方法取得更好的文字识别结果.
提齣一種基于顏色聚類和多幀融閤的視頻文字識彆方法,首先,在視頻文字檢測模塊,綜閤攷慮瞭文字區域的兩箇顯著特徵:一緻的顏色和密集的邊緣,利用近鄰傳播聚類算法,根據圖像中邊緣顏色的複雜程度,自適應地把綵色邊緣分解到若榦邊緣子圖中去,使得在各箇子圖中檢測文字區域更為準確.其次,在視頻文字增彊模塊,基于文字筆畫彊度圖過濾掉模糊的文字區域,併綜閤平均融閤和最小值融閤的優點,對在不同視頻幀中檢測到的、包含相同內容的文字區域進行融閤,能夠得到揹景更為平滑、筆畫更為清晰的文字區域圖像.最後,在視頻文字提取模塊,通過自適應地選取具有較高文字對比度的顏色分量進行二值化,能夠取得比現有方法更好的二值化結果:另一方麵,基于圖像中揹景與文字的顏色差異,利用顏色聚類的方法去除譟聲,能夠有效地提高文字識彆率.實驗結果錶明,該方法能夠比現有方法取得更好的文字識彆結果.
제출일충기우안색취류화다정융합적시빈문자식별방법,수선,재시빈문자검측모괴,종합고필료문자구역적량개현저특정:일치적안색화밀집적변연,이용근린전파취류산법,근거도상중변연안색적복잡정도,자괄응지파채색변연분해도약간변연자도중거,사득재각개자도중검측문자구역경위준학.기차,재시빈문자증강모괴,기우문자필화강도도과려도모호적문자구역,병종합평균융합화최소치융합적우점,대재불동시빈정중검측도적、포함상동내용적문자구역진행융합,능구득도배경경위평활、필화경위청석적문자구역도상.최후,재시빈문자제취모괴,통과자괄응지선취구유교고문자대비도적안색분량진행이치화,능구취득비현유방법경호적이치화결과:령일방면,기우도상중배경여문자적안색차이,이용안색취류적방법거제조성,능구유효지제고문자식별솔.실험결과표명,해방법능구비현유방법취득경호적문자식별결과.