计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2009年
1期
197-199
,共3页
查重%算法%电子商务
查重%算法%電子商務
사중%산법%전자상무
研究一种高效的文本信息查重算法,对电子商务网站的相似信息进行自动归类排序,大幅度提高信息审核效率与正确性.测试表明,信息数量在100-1000条时,该算法十分有效,1000条的文本信息相互比较可控制在2秒之内.信息数量超过1000条后,计算时间会大幅度上升.可通过调整算法中相关参数来调整精度.对于过短信息(少于10个字),可将本算法与Levenshtein算法相结合,以提高该文本信息查重算法的灵活性.
研究一種高效的文本信息查重算法,對電子商務網站的相似信息進行自動歸類排序,大幅度提高信息審覈效率與正確性.測試錶明,信息數量在100-1000條時,該算法十分有效,1000條的文本信息相互比較可控製在2秒之內.信息數量超過1000條後,計算時間會大幅度上升.可通過調整算法中相關參數來調整精度.對于過短信息(少于10箇字),可將本算法與Levenshtein算法相結閤,以提高該文本信息查重算法的靈活性.
연구일충고효적문본신식사중산법,대전자상무망참적상사신식진행자동귀류배서,대폭도제고신식심핵효솔여정학성.측시표명,신식수량재100-1000조시,해산법십분유효,1000조적문본신식상호비교가공제재2초지내.신식수량초과1000조후,계산시간회대폭도상승.가통과조정산법중상관삼수래조정정도.대우과단신식(소우10개자),가장본산법여Levenshtein산법상결합,이제고해문본신식사중산법적령활성.