计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2009年
18期
135-138,151
,共5页
文本分割%概率潜在语义分析模型%LDA模型%小世界模型
文本分割%概率潛在語義分析模型%LDA模型%小世界模型
문본분할%개솔잠재어의분석모형%LDA모형%소세계모형
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用.基于PLSA及LDA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系,而基于小世界模型的分割则依据小世界模型的短路径、高聚集性的特点实现片段边界的识别.从模型的特点、分割策略以及实验结果等角度对基于三种模型的分割进行对比.分析表明,基于LDA模型的分割比基于PLSA模型的分割具有更大的稳定性,且分割效果更好.基于小世界模型的分割策略更适合小世界模型特性明显的文本.
文本分割在信息提取、文摘自動生成、語言建模、首語消解等諸多領域都有極為重要的應用.基于PLSA及LDA模型的文本分割試圖使隱藏于片段內的不同主題與文本錶麵的詞、句對建立聯繫,而基于小世界模型的分割則依據小世界模型的短路徑、高聚集性的特點實現片段邊界的識彆.從模型的特點、分割策略以及實驗結果等角度對基于三種模型的分割進行對比.分析錶明,基于LDA模型的分割比基于PLSA模型的分割具有更大的穩定性,且分割效果更好.基于小世界模型的分割策略更適閤小世界模型特性明顯的文本.
문본분할재신식제취、문적자동생성、어언건모、수어소해등제다영역도유겁위중요적응용.기우PLSA급LDA모형적문본분할시도사은장우편단내적불동주제여문본표면적사、구대건립련계,이기우소세계모형적분할칙의거소세계모형적단로경、고취집성적특점실현편단변계적식별.종모형적특점、분할책략이급실험결과등각도대기우삼충모형적분할진행대비.분석표명,기우LDA모형적분할비기우PLSA모형적분할구유경대적은정성,차분할효과경호.기우소세계모형적분할책략경괄합소세계모형특성명현적문본.