中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2010年
5期
70-76
,共7页
张辉%周敬民%王亮%赵莉萍
張輝%週敬民%王亮%趙莉萍
장휘%주경민%왕량%조리평
话题追踪%话题模型%三维文档向量模型%自适应KNN追踪器
話題追蹤%話題模型%三維文檔嚮量模型%自適應KNN追蹤器
화제추종%화제모형%삼유문당향량모형%자괄응KNN추종기
话题追踪(TT)是研究自动追踪事件动态发展过程的一种信息智能获取技术,是话题检测与追踪(TDT)技术的一个子任务,其目标在于自动发现新闻报道信息流中与某一已知话题有关的新报道.该文通过分析传统文档向量空间模型的不足,结合新闻报道的特征,提出了一种三维文档向量模型,在此基础上建立了一种符合新闻报道特征的话题模型.该话题模型在追踪过程中能够根据事件的动态发展进行自我学习和自我修正.结合话题模型,该文还设计了一种自适应的KNN新闻话题追踪器,从而形成了一种完整的中文话题追踪器模型.实验数据表明该方法在描述新闻话题、避免话题漂移方面具有一定优势,在中文话题追踪领域取得了较好效果.
話題追蹤(TT)是研究自動追蹤事件動態髮展過程的一種信息智能穫取技術,是話題檢測與追蹤(TDT)技術的一箇子任務,其目標在于自動髮現新聞報道信息流中與某一已知話題有關的新報道.該文通過分析傳統文檔嚮量空間模型的不足,結閤新聞報道的特徵,提齣瞭一種三維文檔嚮量模型,在此基礎上建立瞭一種符閤新聞報道特徵的話題模型.該話題模型在追蹤過程中能夠根據事件的動態髮展進行自我學習和自我脩正.結閤話題模型,該文還設計瞭一種自適應的KNN新聞話題追蹤器,從而形成瞭一種完整的中文話題追蹤器模型.實驗數據錶明該方法在描述新聞話題、避免話題漂移方麵具有一定優勢,在中文話題追蹤領域取得瞭較好效果.
화제추종(TT)시연구자동추종사건동태발전과정적일충신식지능획취기술,시화제검측여추종(TDT)기술적일개자임무,기목표재우자동발현신문보도신식류중여모일이지화제유관적신보도.해문통과분석전통문당향량공간모형적불족,결합신문보도적특정,제출료일충삼유문당향량모형,재차기출상건립료일충부합신문보도특정적화제모형.해화제모형재추종과정중능구근거사건적동태발전진행자아학습화자아수정.결합화제모형,해문환설계료일충자괄응적KNN신문화제추종기,종이형성료일충완정적중문화제추종기모형.실험수거표명해방법재묘술신문화제、피면화제표이방면구유일정우세,재중문화제추종영역취득료교호효과.