计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2005年
21期
97-99
,共3页
隐式章节划分%TextTiling算法%遗传算法%参数优化
隱式章節劃分%TextTiling算法%遺傳算法%參數優化
은식장절화분%TextTiling산법%유전산법%삼수우화
如何正确有效地确定文档的子主题边界对于自动文摘、问答系统等自然语言处理应用是非常重要的.然而多数文档中子主题之间没有明确的标记(如小标题),这给子主题的提取带来一定的困难.文章首先分析了利用TextTiling算法进行隐式章节划分的基本原理.同时考虑到算法中人工定义参数可能会对系统的指标产生影响,利用遗传算法对其进行了优化,自动获取的参数值使系统准确率提高了7.1%.实验表明遗传算法是一种非常简单有效的参数优化方法.通过该文方法获取的参数更加适合中文文档的隐式章节划分.
如何正確有效地確定文檔的子主題邊界對于自動文摘、問答繫統等自然語言處理應用是非常重要的.然而多數文檔中子主題之間沒有明確的標記(如小標題),這給子主題的提取帶來一定的睏難.文章首先分析瞭利用TextTiling算法進行隱式章節劃分的基本原理.同時攷慮到算法中人工定義參數可能會對繫統的指標產生影響,利用遺傳算法對其進行瞭優化,自動穫取的參數值使繫統準確率提高瞭7.1%.實驗錶明遺傳算法是一種非常簡單有效的參數優化方法.通過該文方法穫取的參數更加適閤中文文檔的隱式章節劃分.
여하정학유효지학정문당적자주제변계대우자동문적、문답계통등자연어언처리응용시비상중요적.연이다수문당중자주제지간몰유명학적표기(여소표제),저급자주제적제취대래일정적곤난.문장수선분석료이용TextTiling산법진행은식장절화분적기본원리.동시고필도산법중인공정의삼수가능회대계통적지표산생영향,이용유전산법대기진행료우화,자동획취적삼수치사계통준학솔제고료7.1%.실험표명유전산법시일충비상간단유효적삼수우화방법.통과해문방법획취적삼수경가괄합중문문당적은식장절화분.