国防科技大学学报
國防科技大學學報
국방과기대학학보
JOURNAL OF NATIONAL UNIVERSITY OF DEFENSE TECHNOLOGY
2013年
4期
146-155
,共10页
谭文堂%王桢文%殷风景%葛斌%肖卫东
譚文堂%王楨文%慇風景%葛斌%肖衛東
담문당%왕정문%은풍경%갈빈%초위동
比较性文本挖掘%涌现%话题模型%CDCMLDA模型
比較性文本挖掘%湧現%話題模型%CDCMLDA模型
비교성문본알굴%용현%화제모형%CDCMLDA모형
comparative text mining%burstiness%topic model%CDCMLDA model
提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导.在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势.
提齣一種CDCMLDA生成模型來實現跨文本集的話題分析,採用狄利剋雷組閤多項式模型(Dirichlet Compound Multinomial,DCM)對文本集中詞的湧現現象進行建模,把DCM模型和LDA結閤起來分析文本集之間話題的差異,採用矇特卡囉期望最大化方法進行參數推導.在多箇實際數據集中通過定性和定量的方法對模型進行評價,實驗錶明,模型不僅能夠髮現不同文本集間的異同,而且在模型睏惑度指標上相對噹前兩種主要跨文本集的話題模型具有明顯的優勢.
제출일충CDCMLDA생성모형래실현과문본집적화제분석,채용적리극뢰조합다항식모형(Dirichlet Compound Multinomial,DCM)대문본집중사적용현현상진행건모,파DCM모형화LDA결합기래분석문본집지간화제적차이,채용몽특잡라기망최대화방법진행삼수추도.재다개실제수거집중통과정성화정량적방법대모형진행평개,실험표명,모형불부능구발현불동문본집간적이동,이차재모형곤혹도지표상상대당전량충주요과문본집적화제모형구유명현적우세.