东南大学学报(自然科学版)
東南大學學報(自然科學版)
동남대학학보(자연과학판)
JOURNAL OF SOUTHEAST UNIVERSITY
2009年
6期
1109-1113
,共5页
陈叶旺%李文%彭鑫%赵文耘
陳葉旺%李文%彭鑫%趙文耘
진협왕%리문%팽흠%조문운
本体%语义环境%语义标注
本體%語義環境%語義標註
본체%어의배경%어의표주
ontology%semantic context%semantic annotation
在领域本体知识的语义环境和资源文档结构基础上,提出一种文档语义标注改进方法,分析、计算标签一文档的词频相关性和语义环境在局部窗口的共现性,实现对各类文档资源的语义标注.该方法首先提取出文档资源的纯文本内容,并分解出子句、句和段落集合.然后,对于每个具体的领域知识项,在本体知识库中寻找其语义环境信息.最后,按照7条相关度规则,分别计算出这些信息与分解后文档内容的相关度,从而完成整个文档库内和知识库内的综合计算,得到该项知识与文档资源的最终相关度.卖验结果显示,该方法能够依据领域本体,有效地对互联网中大量以网页等形式存在的多种类文档知识资源进行自动语义标注.
在領域本體知識的語義環境和資源文檔結構基礎上,提齣一種文檔語義標註改進方法,分析、計算標籤一文檔的詞頻相關性和語義環境在跼部窗口的共現性,實現對各類文檔資源的語義標註.該方法首先提取齣文檔資源的純文本內容,併分解齣子句、句和段落集閤.然後,對于每箇具體的領域知識項,在本體知識庫中尋找其語義環境信息.最後,按照7條相關度規則,分彆計算齣這些信息與分解後文檔內容的相關度,從而完成整箇文檔庫內和知識庫內的綜閤計算,得到該項知識與文檔資源的最終相關度.賣驗結果顯示,該方法能夠依據領域本體,有效地對互聯網中大量以網頁等形式存在的多種類文檔知識資源進行自動語義標註.
재영역본체지식적어의배경화자원문당결구기출상,제출일충문당어의표주개진방법,분석、계산표첨일문당적사빈상관성화어의배경재국부창구적공현성,실현대각류문당자원적어의표주.해방법수선제취출문당자원적순문본내용,병분해출자구、구화단락집합.연후,대우매개구체적영역지식항,재본체지식고중심조기어의배경신식.최후,안조7조상관도규칙,분별계산출저사신식여분해후문당내용적상관도,종이완성정개문당고내화지식고내적종합계산,득도해항지식여문당자원적최종상관도.매험결과현시,해방법능구의거영역본체,유효지대호련망중대량이망혈등형식존재적다충류문당지식자원진행자동어의표주.