基于视频、音频和文本的视频分段
기우시빈、음빈화문본적시빈분단
Vision,Speech and Text for Video Segmentation
저자의 최근 논문