鞍山师范学院学报
鞍山師範學院學報
안산사범학원학보
JOURNAL OF ANSHAN TEACHERS COLLEGE
2007年
6期
36-39
,共4页
哈希技术%文本%关联规则
哈希技術%文本%關聯規則
합희기술%문본%관련규칙
采用新的关键字的获得方法,并基于DHP算法提出一种新的高效的文本关联规则算法.根据 TF‘IDF 公式计算特征词的权重,特征词的平均权重作为阈值,权重大于阈值的特征词作为该文本的关键词,将关键词的权重用到本文的算法ARTREE中,抽取出文本的关联规则.本文算法和Apriori算法相比,具有运算效率高、规则的精度高的优点.实验验证本算法的有效性.
採用新的關鍵字的穫得方法,併基于DHP算法提齣一種新的高效的文本關聯規則算法.根據 TF‘IDF 公式計算特徵詞的權重,特徵詞的平均權重作為閾值,權重大于閾值的特徵詞作為該文本的關鍵詞,將關鍵詞的權重用到本文的算法ARTREE中,抽取齣文本的關聯規則.本文算法和Apriori算法相比,具有運算效率高、規則的精度高的優點.實驗驗證本算法的有效性.
채용신적관건자적획득방법,병기우DHP산법제출일충신적고효적문본관련규칙산법.근거 TF‘IDF 공식계산특정사적권중,특정사적평균권중작위역치,권중대우역치적특정사작위해문본적관건사,장관건사적권중용도본문적산법ARTREE중,추취출문본적관련규칙.본문산법화Apriori산법상비,구유운산효솔고、규칙적정도고적우점.실험험증본산법적유효성.