计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2011年
9期
150-154,181
,共6页
陈叶旺%李海波%余金山%陈维斌
陳葉旺%李海波%餘金山%陳維斌
진협왕%리해파%여금산%진유빈
本体%语义标注%段落结构%SAMSC
本體%語義標註%段落結構%SAMSC
본체%어의표주%단락결구%SAMSC
语义标注是实现语义网的一个重要研究内容,目前已有很多标注方法取得了不错的效果.但这些方法几乎都没有注意到本体所描述的知识往往稀疏地分布在文档中,也未能有效地利用文档的组织结构信息,使得这些方法对质量较差的文档的标注不理想.为此提出了一种基于稀疏编码的本体语义自动标注方法(Semantic Annotation Method based on Sparse Coding,SAMSC),该方法先按本体知识描述从文档中识别出一定的语义作为初始值,再通过迭代解析文档段落结构和描述主题,完成本体知识与文档资源的相关系数矩阵计算,最后在全局文档空间中通过最小化损失函数来实现用本体对文档的语义标注.实验表明,该方法能有效地对互联网中大量良莠不齐的文档进行自动语义标注,对质量差的文档资源能取得让人接受的结果.
語義標註是實現語義網的一箇重要研究內容,目前已有很多標註方法取得瞭不錯的效果.但這些方法幾乎都沒有註意到本體所描述的知識往往稀疏地分佈在文檔中,也未能有效地利用文檔的組織結構信息,使得這些方法對質量較差的文檔的標註不理想.為此提齣瞭一種基于稀疏編碼的本體語義自動標註方法(Semantic Annotation Method based on Sparse Coding,SAMSC),該方法先按本體知識描述從文檔中識彆齣一定的語義作為初始值,再通過迭代解析文檔段落結構和描述主題,完成本體知識與文檔資源的相關繫數矩陣計算,最後在全跼文檔空間中通過最小化損失函數來實現用本體對文檔的語義標註.實驗錶明,該方法能有效地對互聯網中大量良莠不齊的文檔進行自動語義標註,對質量差的文檔資源能取得讓人接受的結果.
어의표주시실현어의망적일개중요연구내용,목전이유흔다표주방법취득료불착적효과.단저사방법궤호도몰유주의도본체소묘술적지식왕왕희소지분포재문당중,야미능유효지이용문당적조직결구신식,사득저사방법대질량교차적문당적표주불이상.위차제출료일충기우희소편마적본체어의자동표주방법(Semantic Annotation Method based on Sparse Coding,SAMSC),해방법선안본체지식묘술종문당중식별출일정적어의작위초시치,재통과질대해석문당단락결구화묘술주제,완성본체지식여문당자원적상관계수구진계산,최후재전국문당공간중통과최소화손실함수래실현용본체대문당적어의표주.실험표명,해방법능유효지대호련망중대량량유불제적문당진행자동어의표주,대질량차적문당자원능취득양인접수적결과.