软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2009年
9期
2450-2461
,共12页
王梅%周向东%许红涛%施伯乐
王梅%週嚮東%許紅濤%施伯樂
왕매%주향동%허홍도%시백악
自动图像标注%生成模型%判别模型%可判别超平面树%层次分类
自動圖像標註%生成模型%判彆模型%可判彆超平麵樹%層次分類
자동도상표주%생성모형%판별모형%가판별초평면수%층차분류
图像语义的自动标注是一个具有挑战性的研究课题,目前常见的机器学习方法,如统计生成模型(generative model)与判别模型(discriminative model)都被用于该问题的研究中.然而由于语义鸿沟的存在、图像训练数据的不平衡性以及图像标注的多标签特性等问题,使得上述方法的性能都有待进一步提高.提出一种基于可判别超平面树的生成模型图像标注方法.该方法根据待标注目标图像的高生成概率邻域,建立局部超平面分类树,进而利用同层类间可判别信息,按自顶向下的层次分类得到待标注图像的语义相关图像集合.由此得到的相关类信息与新的生成模型框架相结合对待标注图像与语义关键词的联合概率进行估计,实现对目标图像的标注.其特点在于生成模型与判别模型方法得到了有效结合,可判别超平面树对隐含语义聚类的判别分析是对待标注图像的生成"邻域"的逐步求精过程,有效地提高了生成模型标注准确度;而对于判别分析难以解决的多标签分类、训练数据不平衡等问题,此方法通过联合概率估计自然地实现目标图像的多标签分配.在常用的包含5 000幅图像的ECCV2002数据集进行了实验,结果表明,与目前已知的具有较好标注效果的基于生成模型的MBRM模型(采用图像分割方法)以及基于辨别分析的ASVM-MIL相比,此方法的F1因子分别提高了14%和13%.
圖像語義的自動標註是一箇具有挑戰性的研究課題,目前常見的機器學習方法,如統計生成模型(generative model)與判彆模型(discriminative model)都被用于該問題的研究中.然而由于語義鴻溝的存在、圖像訓練數據的不平衡性以及圖像標註的多標籤特性等問題,使得上述方法的性能都有待進一步提高.提齣一種基于可判彆超平麵樹的生成模型圖像標註方法.該方法根據待標註目標圖像的高生成概率鄰域,建立跼部超平麵分類樹,進而利用同層類間可判彆信息,按自頂嚮下的層次分類得到待標註圖像的語義相關圖像集閤.由此得到的相關類信息與新的生成模型框架相結閤對待標註圖像與語義關鍵詞的聯閤概率進行估計,實現對目標圖像的標註.其特點在于生成模型與判彆模型方法得到瞭有效結閤,可判彆超平麵樹對隱含語義聚類的判彆分析是對待標註圖像的生成"鄰域"的逐步求精過程,有效地提高瞭生成模型標註準確度;而對于判彆分析難以解決的多標籤分類、訓練數據不平衡等問題,此方法通過聯閤概率估計自然地實現目標圖像的多標籤分配.在常用的包含5 000幅圖像的ECCV2002數據集進行瞭實驗,結果錶明,與目前已知的具有較好標註效果的基于生成模型的MBRM模型(採用圖像分割方法)以及基于辨彆分析的ASVM-MIL相比,此方法的F1因子分彆提高瞭14%和13%.
도상어의적자동표주시일개구유도전성적연구과제,목전상견적궤기학습방법,여통계생성모형(generative model)여판별모형(discriminative model)도피용우해문제적연구중.연이유우어의홍구적존재、도상훈련수거적불평형성이급도상표주적다표첨특성등문제,사득상술방법적성능도유대진일보제고.제출일충기우가판별초평면수적생성모형도상표주방법.해방법근거대표주목표도상적고생성개솔린역,건립국부초평면분류수,진이이용동층류간가판별신식,안자정향하적층차분류득도대표주도상적어의상관도상집합.유차득도적상관류신식여신적생성모형광가상결합대대표주도상여어의관건사적연합개솔진행고계,실현대목표도상적표주.기특점재우생성모형여판별모형방법득도료유효결합,가판별초평면수대은함어의취류적판별분석시대대표주도상적생성"린역"적축보구정과정,유효지제고료생성모형표주준학도;이대우판별분석난이해결적다표첨분류、훈련수거불평형등문제,차방법통과연합개솔고계자연지실현목표도상적다표첨분배.재상용적포함5 000폭도상적ECCV2002수거집진행료실험,결과표명,여목전이지적구유교호표주효과적기우생성모형적MBRM모형(채용도상분할방법)이급기우변별분석적ASVM-MIL상비,차방법적F1인자분별제고료14%화13%.