计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2006年
11期
143-145
,共3页
文本分类%关联规则%最大频繁项目集
文本分類%關聯規則%最大頻繁項目集
문본분류%관련규칙%최대빈번항목집
我们提出了一种新颖的、基于最大关联的文本分类方法-SAT-MOD+.在文本分类中,以往的方法在挖掘频繁项集和关联规则的时候,往往是将整个文本看作一个事务来处理的,然而文本的基本的语义单元实际上是句子.那些同时出现在一个句子里的一组单词比仅仅是同时出现在同一篇文档中的一组单词有更强的语义上的联系.基于以上的考虑,SAT-MOD+把一篇文档里的某些句子作为一个单独的事务.通过在标准的文本集上的大量实验,证明了SAT-MOD+的有效性.
我們提齣瞭一種新穎的、基于最大關聯的文本分類方法-SAT-MOD+.在文本分類中,以往的方法在挖掘頻繁項集和關聯規則的時候,往往是將整箇文本看作一箇事務來處理的,然而文本的基本的語義單元實際上是句子.那些同時齣現在一箇句子裏的一組單詞比僅僅是同時齣現在同一篇文檔中的一組單詞有更彊的語義上的聯繫.基于以上的攷慮,SAT-MOD+把一篇文檔裏的某些句子作為一箇單獨的事務.通過在標準的文本集上的大量實驗,證明瞭SAT-MOD+的有效性.
아문제출료일충신영적、기우최대관련적문본분류방법-SAT-MOD+.재문본분류중,이왕적방법재알굴빈번항집화관련규칙적시후,왕왕시장정개문본간작일개사무래처리적,연이문본적기본적어의단원실제상시구자.나사동시출현재일개구자리적일조단사비부부시동시출현재동일편문당중적일조단사유경강적어의상적련계.기우이상적고필,SAT-MOD+파일편문당리적모사구자작위일개단독적사무.통과재표준적문본집상적대량실험,증명료SAT-MOD+적유효성.