计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2001年
19期
21-22
,共2页
文本分类%信息检索%汉明距离
文本分類%信息檢索%漢明距離
문본분류%신식검색%한명거리
传统的文本分类中相似度的计算,是根据欧氏空间中向量之间夹角的余弦值来表征的,它根据余弦值的大小来反映文本之间的相互关系.该文则首先建立文本集与码字集之间的1-1对应关系,然后借用编码理论中汉明距离的概念,由汉明距离的计算公式,得到了一种全新的文本相似度的计算方法,与传统的方法相比较,它具有简便,快速等优点.
傳統的文本分類中相似度的計算,是根據歐氏空間中嚮量之間夾角的餘絃值來錶徵的,它根據餘絃值的大小來反映文本之間的相互關繫.該文則首先建立文本集與碼字集之間的1-1對應關繫,然後藉用編碼理論中漢明距離的概唸,由漢明距離的計算公式,得到瞭一種全新的文本相似度的計算方法,與傳統的方法相比較,它具有簡便,快速等優點.
전통적문본분류중상사도적계산,시근거구씨공간중향량지간협각적여현치래표정적,타근거여현치적대소래반영문본지간적상호관계.해문칙수선건립문본집여마자집지간적1-1대응관계,연후차용편마이론중한명거리적개념,유한명거리적계산공식,득도료일충전신적문본상사도적계산방법,여전통적방법상비교,타구유간편,쾌속등우점.