信息网络安全
信息網絡安全
신식망락안전
NETINFO SECURITY
2013年
11期
8-10
,共3页
文本过滤%语义框架%层次结构%相似度计算
文本過濾%語義框架%層次結構%相似度計算
문본과려%어의광가%층차결구%상사도계산
text ifltration%semantic framework%hierarchical structure%similarity calculation
文章提出了一种基于层次结构语义框架的信息过滤匹配算法,用以进行网络文本过滤。文章将网页分为两层,即标题层与正文层,标题层比正文层的权重大。该算法综合考虑3种因素,即“槽”与行为动词之间的语义距离、“槽”的相关度与层级结构,并进行权重的计算与归一化。试验结果表明,与传统算法相比较,该算法可以使文本的查全率和查准率得到一定程度的提高。
文章提齣瞭一種基于層次結構語義框架的信息過濾匹配算法,用以進行網絡文本過濾。文章將網頁分為兩層,即標題層與正文層,標題層比正文層的權重大。該算法綜閤攷慮3種因素,即“槽”與行為動詞之間的語義距離、“槽”的相關度與層級結構,併進行權重的計算與歸一化。試驗結果錶明,與傳統算法相比較,該算法可以使文本的查全率和查準率得到一定程度的提高。
문장제출료일충기우층차결구어의광가적신식과려필배산법,용이진행망락문본과려。문장장망혈분위량층,즉표제층여정문층,표제층비정문층적권중대。해산법종합고필3충인소,즉“조”여행위동사지간적어의거리、“조”적상관도여층급결구,병진행권중적계산여귀일화。시험결과표명,여전통산법상비교,해산법가이사문본적사전솔화사준솔득도일정정도적제고。
The paper puts forward a kind of information filtering matching algorithm based on semantic framework of hierarchical structure to iflter network text. The Web pages are divided in two layeres,which are the title layer and the text layer . The weight of the title layer is bigger than that of the text layer .The algorithm in this paper takes account of three factors, which are the semantic distance between slot and action verbs, the relevanceof the slotsand the hierarchical structure, computes and normalizes the weight. Compared with the traditional algorithm, tests show that the recall and precision ratio of the text all have been improved to some extent.