模式识别与人工智能
模式識彆與人工智能
모식식별여인공지능
Moshi Shibie yu Rengong Zhineng
2005年
4期
405-411
,共7页
元数据提取%基于规则%自动规约
元數據提取%基于規則%自動規約
원수거제취%기우규칙%자동규약
利用HTML文档的元数据,可以为Web检索提供多样化的检索手段.本文提出了一种从HTML文档自动提取文档元数据的方法,对其中提取规则的设计、规约算法及其复杂度分析做出了重点介绍.该方法的提取规则在语法形式上和文档片断接近,更适合自动生成,通过自动规约生成规则无需人工分析,适应Web文档特点.文章最后给出了实验结果并进行了分析.
利用HTML文檔的元數據,可以為Web檢索提供多樣化的檢索手段.本文提齣瞭一種從HTML文檔自動提取文檔元數據的方法,對其中提取規則的設計、規約算法及其複雜度分析做齣瞭重點介紹.該方法的提取規則在語法形式上和文檔片斷接近,更適閤自動生成,通過自動規約生成規則無需人工分析,適應Web文檔特點.文章最後給齣瞭實驗結果併進行瞭分析.
이용HTML문당적원수거,가이위Web검색제공다양화적검색수단.본문제출료일충종HTML문당자동제취문당원수거적방법,대기중제취규칙적설계、규약산법급기복잡도분석주출료중점개소.해방법적제취규칙재어법형식상화문당편단접근,경괄합자동생성,통과자동규약생성규칙무수인공분석,괄응Web문당특점.문장최후급출료실험결과병진행료분석.