中国图象图形学报
中國圖象圖形學報
중국도상도형학보
JOURNAL OF IMAGE AND GRAPHICS
2014年
5期
683-692
,共10页
李钦瑞%吕学强%李卓%刘坤
李欽瑞%呂學彊%李卓%劉坤
리흠서%려학강%리탁%류곤
复杂背景%字幕增强%Logistic模型%字幕检测与跟踪%时域特征
複雜揹景%字幕增彊%Logistic模型%字幕檢測與跟蹤%時域特徵
복잡배경%자막증강%Logistic모형%자막검측여근종%시역특정
complex background%caption enhancement%Logistic model%caption detection and tracking%time domain feature
目的 为提高复杂背景下的视频字幕在光学字符识别(OCR)中的识别率,需要对提取的视频字幕进行有效地字幕增强.首次将Logistic模型应用到视频字幕增强中,提出了基于Logistic模型的融合多帧信息的视频字幕增强方法.方法 对字幕进行检测与跟踪,将出现在连续多帧中的同一字幕片段进行对齐;通过分析字幕片段在多帧中信息,提出字幕背景在时域上的变化特征、背景和字幕文本的固有特征,并将3个特征进行量化与融合,构建适用于字幕增强的Logistic模型,实现对视频字幕的增强.结果 对含阴影或描边效果的特殊复杂背景字幕、普通复杂背景字幕、单一背景字幕分别进行实验,增强后的字幕在OCR软件中的识别正确率分别为81.76%、97.13%、98.19%,与对比方法比较均有一定的提高.结论 实验结果表明,本文方法既可以降低字幕背景的复杂度,又可以提高字幕背景与文本的对比度,从而可以对复杂背景和单一背景下的视频字幕进行有效地增强.
目的 為提高複雜揹景下的視頻字幕在光學字符識彆(OCR)中的識彆率,需要對提取的視頻字幕進行有效地字幕增彊.首次將Logistic模型應用到視頻字幕增彊中,提齣瞭基于Logistic模型的融閤多幀信息的視頻字幕增彊方法.方法 對字幕進行檢測與跟蹤,將齣現在連續多幀中的同一字幕片段進行對齊;通過分析字幕片段在多幀中信息,提齣字幕揹景在時域上的變化特徵、揹景和字幕文本的固有特徵,併將3箇特徵進行量化與融閤,構建適用于字幕增彊的Logistic模型,實現對視頻字幕的增彊.結果 對含陰影或描邊效果的特殊複雜揹景字幕、普通複雜揹景字幕、單一揹景字幕分彆進行實驗,增彊後的字幕在OCR軟件中的識彆正確率分彆為81.76%、97.13%、98.19%,與對比方法比較均有一定的提高.結論 實驗結果錶明,本文方法既可以降低字幕揹景的複雜度,又可以提高字幕揹景與文本的對比度,從而可以對複雜揹景和單一揹景下的視頻字幕進行有效地增彊.
목적 위제고복잡배경하적시빈자막재광학자부식별(OCR)중적식별솔,수요대제취적시빈자막진행유효지자막증강.수차장Logistic모형응용도시빈자막증강중,제출료기우Logistic모형적융합다정신식적시빈자막증강방법.방법 대자막진행검측여근종,장출현재련속다정중적동일자막편단진행대제;통과분석자막편단재다정중신식,제출자막배경재시역상적변화특정、배경화자막문본적고유특정,병장3개특정진행양화여융합,구건괄용우자막증강적Logistic모형,실현대시빈자막적증강.결과 대함음영혹묘변효과적특수복잡배경자막、보통복잡배경자막、단일배경자막분별진행실험,증강후적자막재OCR연건중적식별정학솔분별위81.76%、97.13%、98.19%,여대비방법비교균유일정적제고.결론 실험결과표명,본문방법기가이강저자막배경적복잡도,우가이제고자막배경여문본적대비도,종이가이대복잡배경화단일배경하적시빈자막진행유효지증강.