计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
21期
212-216
,共5页
文本分割%词汇链%TextrTiling算%Dotpiotting算法
文本分割%詞彙鏈%TextrTiling算%Dotpiotting算法
문본분할%사회련%TextrTiling산%Dotpiotting산법
文本分割是信息检索的一个重要问题.文本分割是指在一个书面文档或语音序列中自动识别具有独立意义的单元(片段)之间的边界,其分割对象可以是书面的、语音的或者动态的文本.文本线性分割的主要目的是找出主题边界,它对于很多自然语言处理如自动文摘、问答系统等来说具有重要的价值.在大量文献的基础上,总结归纳文本线性分割中的主要方法,并提出未来的研究方向.
文本分割是信息檢索的一箇重要問題.文本分割是指在一箇書麵文檔或語音序列中自動識彆具有獨立意義的單元(片段)之間的邊界,其分割對象可以是書麵的、語音的或者動態的文本.文本線性分割的主要目的是找齣主題邊界,它對于很多自然語言處理如自動文摘、問答繫統等來說具有重要的價值.在大量文獻的基礎上,總結歸納文本線性分割中的主要方法,併提齣未來的研究方嚮.
문본분할시신식검색적일개중요문제.문본분할시지재일개서면문당혹어음서렬중자동식별구유독립의의적단원(편단)지간적변계,기분할대상가이시서면적、어음적혹자동태적문본.문본선성분할적주요목적시조출주제변계,타대우흔다자연어언처리여자동문적、문답계통등래설구유중요적개치.재대량문헌적기출상,총결귀납문본선성분할중적주요방법,병제출미래적연구방향.