计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2005年
8期
24-25,39
,共3页
Web挖掘%遗传算法%特征抽取
Web挖掘%遺傳算法%特徵抽取
Web알굴%유전산법%특정추취
已有许多方法用于英文网页的特征抽取,相对而言适合于中文网页的方法还不多.该文设计了一个综合考虑位置、频率和词长3个因素的中文Web文本词权重的计算公式,提出了一种用变长度染色体遗传算法提取Web文本特征的方法.实验表明该方法在降低特征矢量维数方面是有效的.
已有許多方法用于英文網頁的特徵抽取,相對而言適閤于中文網頁的方法還不多.該文設計瞭一箇綜閤攷慮位置、頻率和詞長3箇因素的中文Web文本詞權重的計算公式,提齣瞭一種用變長度染色體遺傳算法提取Web文本特徵的方法.實驗錶明該方法在降低特徵矢量維數方麵是有效的.
이유허다방법용우영문망혈적특정추취,상대이언괄합우중문망혈적방법환불다.해문설계료일개종합고필위치、빈솔화사장3개인소적중문Web문본사권중적계산공식,제출료일충용변장도염색체유전산법제취Web문본특정적방법.실험표명해방법재강저특정시량유수방면시유효적.