中原工学院学报
中原工學院學報
중원공학원학보
JOURNAL OF ZHONGYUAN INSTITUTE OF TECHNOLOGY
2014年
6期
59-63
,共5页
关键词抽取%TFIDF%词语分布%自动标引
關鍵詞抽取%TFIDF%詞語分佈%自動標引
관건사추취%TFIDF%사어분포%자동표인
介绍了关键词抽取的相关工作,并对基于TFIDF的关键词抽取算法进行了分析.结合词语在文本中的分布均衡程度和首次出现位置等特征,提出了一种改进的TFIDF算法,并给出了相应的计算公式.在文档数量和文档平均长度不同的3个语料上进行了对比实验.实验结果表明,结合词语分布信息的TFIDF关键词抽取方法是可行和有效的.
介紹瞭關鍵詞抽取的相關工作,併對基于TFIDF的關鍵詞抽取算法進行瞭分析.結閤詞語在文本中的分佈均衡程度和首次齣現位置等特徵,提齣瞭一種改進的TFIDF算法,併給齣瞭相應的計算公式.在文檔數量和文檔平均長度不同的3箇語料上進行瞭對比實驗.實驗結果錶明,結閤詞語分佈信息的TFIDF關鍵詞抽取方法是可行和有效的.
개소료관건사추취적상관공작,병대기우TFIDF적관건사추취산법진행료분석.결합사어재문본중적분포균형정도화수차출현위치등특정,제출료일충개진적TFIDF산법,병급출료상응적계산공식.재문당수량화문당평균장도불동적3개어료상진행료대비실험.실험결과표명,결합사어분포신식적TFIDF관건사추취방법시가행화유효적.