计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2010年
1期
197-200
,共4页
语义Block%Block权值%Block主题提取%Web信息挖掘
語義Block%Block權值%Block主題提取%Web信息挖掘
어의Block%Block권치%Block주제제취%Web신식알굴
基于页面结构的信息提取是Web数据挖掘中三大研究领域之一.该研究的关键技术是如何识别Web页面的组织形式,从中挖掘所需要的页面信息.文中基于页面的语义分块(Block)给出一个新的块主题提取算法,与传统的以页面为单位的Web信息提取相比,更符合实际情况,粒度优势明显.该算法针对页面中不同分块的重要性给予不同的权值,依据权值大小取舍页面信息提供给用户.针对该算法进行了模拟实验,从实验结果可以看出该算法具有一定的实用性和有效性.
基于頁麵結構的信息提取是Web數據挖掘中三大研究領域之一.該研究的關鍵技術是如何識彆Web頁麵的組織形式,從中挖掘所需要的頁麵信息.文中基于頁麵的語義分塊(Block)給齣一箇新的塊主題提取算法,與傳統的以頁麵為單位的Web信息提取相比,更符閤實際情況,粒度優勢明顯.該算法針對頁麵中不同分塊的重要性給予不同的權值,依據權值大小取捨頁麵信息提供給用戶.針對該算法進行瞭模擬實驗,從實驗結果可以看齣該算法具有一定的實用性和有效性.
기우혈면결구적신식제취시Web수거알굴중삼대연구영역지일.해연구적관건기술시여하식별Web혈면적조직형식,종중알굴소수요적혈면신식.문중기우혈면적어의분괴(Block)급출일개신적괴주제제취산법,여전통적이혈면위단위적Web신식제취상비,경부합실제정황,립도우세명현.해산법침대혈면중불동분괴적중요성급여불동적권치,의거권치대소취사혈면신식제공급용호.침대해산법진행료모의실험,종실험결과가이간출해산법구유일정적실용성화유효성.