情报学报
情報學報
정보학보
2013年
9期
912-919
,共8页
史庆伟%乔晓东%徐硕%农国武
史慶偉%喬曉東%徐碩%農國武
사경위%교효동%서석%농국무
主题模型%作者主题演化模型%研究兴趣演化分析%吉布斯采样%困惑度
主題模型%作者主題縯化模型%研究興趣縯化分析%吉佈斯採樣%睏惑度
주제모형%작자주제연화모형%연구흥취연화분석%길포사채양%곤혹도
从海量科技文献中自动挖掘隐含主题、研究人员的研究兴趣及其演化规律是信息服务迈向知识服务需要解决的关键问题之一.目前的方法多从静态的角度分析文献主题、科研人员的研究兴趣,而演化分析的方法主要集中文档的内部特征,即文档内容本身,很少考虑作者等外部特征.基于此,本文在AT和ToT模型的基础上构建了作者主题演化(AToT)模型,并给出了一种估计AToT模型参数的吉布斯采样方法.该模型集成了AT和ToT模型的优势,不仅可以揭示科技文献中隐含的主题、作者的研究兴趣,而且可以挖掘研究兴趣随时间变化的规律.最后,以1740篇NIPS会议论文集作为实验数据,通过与AT模型的对比分析验证了AToT模型的可行性和有效性.
從海量科技文獻中自動挖掘隱含主題、研究人員的研究興趣及其縯化規律是信息服務邁嚮知識服務需要解決的關鍵問題之一.目前的方法多從靜態的角度分析文獻主題、科研人員的研究興趣,而縯化分析的方法主要集中文檔的內部特徵,即文檔內容本身,很少攷慮作者等外部特徵.基于此,本文在AT和ToT模型的基礎上構建瞭作者主題縯化(AToT)模型,併給齣瞭一種估計AToT模型參數的吉佈斯採樣方法.該模型集成瞭AT和ToT模型的優勢,不僅可以揭示科技文獻中隱含的主題、作者的研究興趣,而且可以挖掘研究興趣隨時間變化的規律.最後,以1740篇NIPS會議論文集作為實驗數據,通過與AT模型的對比分析驗證瞭AToT模型的可行性和有效性.
종해량과기문헌중자동알굴은함주제、연구인원적연구흥취급기연화규률시신식복무매향지식복무수요해결적관건문제지일.목전적방법다종정태적각도분석문헌주제、과연인원적연구흥취,이연화분석적방법주요집중문당적내부특정,즉문당내용본신,흔소고필작자등외부특정.기우차,본문재AT화ToT모형적기출상구건료작자주제연화(AToT)모형,병급출료일충고계AToT모형삼수적길포사채양방법.해모형집성료AT화ToT모형적우세,불부가이게시과기문헌중은함적주제、작자적연구흥취,이차가이알굴연구흥취수시간변화적규률.최후,이1740편NIPS회의논문집작위실험수거,통과여AT모형적대비분석험증료AToT모형적가행성화유효성.