微计算机信息
微計算機信息
미계산궤신식
CONTROL & AUTOMATION
2010年
12期
158-160
,共3页
赵国光%尹湘舟%余希田%刘金刚
趙國光%尹湘舟%餘希田%劉金剛
조국광%윤상주%여희전%류금강
相关性%后缀树%向量空间模型%特征项权重
相關性%後綴樹%嚮量空間模型%特徵項權重
상관성%후철수%향량공간모형%특정항권중
本文利用后缀树向量空间模型(VSM),为每篇文献建立相应的基于内容的向量模型,通过夹角余弦得出文献之间的相似度,再结合中国医学科学院医学信息研究所提供的文献数据,最终构建出医学文献相关性数据库.该模型与传统的基于词表的VSM相比,最大的优点表现为:在获得文本的向量表示时,不需要基于词表的分词和特征项提取,而其这一特点正好能够解决现在相关性数据库中词表的建立和维护问题,从而使得该模型能够实时获得文本的向量表示.该模型的另外一个优点是与语种无关.
本文利用後綴樹嚮量空間模型(VSM),為每篇文獻建立相應的基于內容的嚮量模型,通過夾角餘絃得齣文獻之間的相似度,再結閤中國醫學科學院醫學信息研究所提供的文獻數據,最終構建齣醫學文獻相關性數據庫.該模型與傳統的基于詞錶的VSM相比,最大的優點錶現為:在穫得文本的嚮量錶示時,不需要基于詞錶的分詞和特徵項提取,而其這一特點正好能夠解決現在相關性數據庫中詞錶的建立和維護問題,從而使得該模型能夠實時穫得文本的嚮量錶示.該模型的另外一箇優點是與語種無關.
본문이용후철수향량공간모형(VSM),위매편문헌건립상응적기우내용적향량모형,통과협각여현득출문헌지간적상사도,재결합중국의학과학원의학신식연구소제공적문헌수거,최종구건출의학문헌상관성수거고.해모형여전통적기우사표적VSM상비,최대적우점표현위:재획득문본적향량표시시,불수요기우사표적분사화특정항제취,이기저일특점정호능구해결현재상관성수거고중사표적건립화유호문제,종이사득해모형능구실시획득문본적향량표시.해모형적령외일개우점시여어충무관.