信息工程大学学报
信息工程大學學報
신식공정대학학보
JOURNAL OF INFORMATION ENGINEERING UNIVERSITY
2014年
4期
453-458,465
,共7页
视觉语言模型%图像分类%空间位置信息%长距离
視覺語言模型%圖像分類%空間位置信息%長距離
시각어언모형%도상분류%공간위치신식%장거리
传统的视觉语言模型(visual language model,VLM)只考虑了相邻视觉单词之间的空间位置关系,不考虑不相邻视觉单词之间的贡献.针对传统视觉语言模型的不足,提出了一种N步长距离视觉语言模型,并将其用于图像分类.该方法首先给出了相隔N个视觉单词的二元依赖关系,然后训练长距离视觉语言模型,最后通过不同的权重分配方式进行融合,得到3种不同的图像分类方法.实验比较了不同参数和分类方法对图像分类的影响,结果表明,文章方法能在一定程度上改善视觉语言模型对图像表达的准确度,进而提高图像分类的准确率.
傳統的視覺語言模型(visual language model,VLM)隻攷慮瞭相鄰視覺單詞之間的空間位置關繫,不攷慮不相鄰視覺單詞之間的貢獻.針對傳統視覺語言模型的不足,提齣瞭一種N步長距離視覺語言模型,併將其用于圖像分類.該方法首先給齣瞭相隔N箇視覺單詞的二元依賴關繫,然後訓練長距離視覺語言模型,最後通過不同的權重分配方式進行融閤,得到3種不同的圖像分類方法.實驗比較瞭不同參數和分類方法對圖像分類的影響,結果錶明,文章方法能在一定程度上改善視覺語言模型對圖像錶達的準確度,進而提高圖像分類的準確率.
전통적시각어언모형(visual language model,VLM)지고필료상린시각단사지간적공간위치관계,불고필불상린시각단사지간적공헌.침대전통시각어언모형적불족,제출료일충N보장거리시각어언모형,병장기용우도상분류.해방법수선급출료상격N개시각단사적이원의뢰관계,연후훈련장거리시각어언모형,최후통과불동적권중분배방식진행융합,득도3충불동적도상분류방법.실험비교료불동삼수화분류방법대도상분류적영향,결과표명,문장방법능재일정정도상개선시각어언모형대도상표체적준학도,진이제고도상분류적준학솔.