电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2011年
1期
204-206
,共3页
文本表示%向量空间模型%词语权重%信息增益
文本錶示%嚮量空間模型%詞語權重%信息增益
문본표시%향량공간모형%사어권중%신식증익
文本的形式化表示一直是文本检索、自动Model)中的TF.IDF文本表示是该领域中得到广泛应用并且取得较好效果的一种文本表示方法.词语在文本集合中的类别分布比例量上的差异是决定词语表达文本内容的重要因素之一.但现在的TF.IDF方法无法把握这一因素,针对这一缺点,将信息增益公式引入文本集合中并提出TF.IDF.IG文本表示方法,并比较分析了其相较于传统TF.IDF公式的优点.用实验验证了其可行性和有效性.
文本的形式化錶示一直是文本檢索、自動Model)中的TF.IDF文本錶示是該領域中得到廣汎應用併且取得較好效果的一種文本錶示方法.詞語在文本集閤中的類彆分佈比例量上的差異是決定詞語錶達文本內容的重要因素之一.但現在的TF.IDF方法無法把握這一因素,針對這一缺點,將信息增益公式引入文本集閤中併提齣TF.IDF.IG文本錶示方法,併比較分析瞭其相較于傳統TF.IDF公式的優點.用實驗驗證瞭其可行性和有效性.
문본적형식화표시일직시문본검색、자동Model)중적TF.IDF문본표시시해영역중득도엄범응용병차취득교호효과적일충문본표시방법.사어재문본집합중적유별분포비례량상적차이시결정사어표체문본내용적중요인소지일.단현재적TF.IDF방법무법파악저일인소,침대저일결점,장신식증익공식인입문본집합중병제출TF.IDF.IG문본표시방법,병비교분석료기상교우전통TF.IDF공식적우점.용실험험증료기가행성화유효성.