计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
19期
4-7
,共4页
播音员声纹%故事单元分割%高斯混合模型%新闻视频
播音員聲紋%故事單元分割%高斯混閤模型%新聞視頻
파음원성문%고사단원분할%고사혼합모형%신문시빈
新闻视频的语义单元分割是基于内容的新闻视频检索和情报挖掘的重要步骤,受到众多研究者的关注.提出了一种基于播音员识别的新闻视频故事单分割的新方法,首先从新闻节目中提取各播音员的声学感知特征的作为其声纹,训练出其相应的混合高斯模型(GMM),并采用KL差异法从视频镜头中探测出各播音员和非播音员音频镜头,最后结合视频字幕帧事件和新闻节目特殊的结构知识对新闻节目进行故事单元分割.在2个多小时的CCTV和CNN新闻视频实验中获得96.02%查准率和92.58%的查全率.
新聞視頻的語義單元分割是基于內容的新聞視頻檢索和情報挖掘的重要步驟,受到衆多研究者的關註.提齣瞭一種基于播音員識彆的新聞視頻故事單分割的新方法,首先從新聞節目中提取各播音員的聲學感知特徵的作為其聲紋,訓練齣其相應的混閤高斯模型(GMM),併採用KL差異法從視頻鏡頭中探測齣各播音員和非播音員音頻鏡頭,最後結閤視頻字幕幀事件和新聞節目特殊的結構知識對新聞節目進行故事單元分割.在2箇多小時的CCTV和CNN新聞視頻實驗中穫得96.02%查準率和92.58%的查全率.
신문시빈적어의단원분할시기우내용적신문시빈검색화정보알굴적중요보취,수도음다연구자적관주.제출료일충기우파음원식별적신문시빈고사단분할적신방법,수선종신문절목중제취각파음원적성학감지특정적작위기성문,훈련출기상응적혼합고사모형(GMM),병채용KL차이법종시빈경두중탐측출각파음원화비파음원음빈경두,최후결합시빈자막정사건화신문절목특수적결구지식대신문절목진행고사단원분할.재2개다소시적CCTV화CNN신문시빈실험중획득96.02%사준솔화92.58%적사전솔.