情报学报
情報學報
정보학보
2014年
4期
439-448
,共10页
语义标注%标注信息%抽取语义%网本体
語義標註%標註信息%抽取語義%網本體
어의표주%표주신식%추취어의%망본체
semantic annotation%annotation%information extraction%semantic Web%ontology
语义网的实现需要为网络上现有的和新的文档进行广泛可用的语义标注,使其内容可被机器所识别和理解。语义标注是清晰、明确、容易理解的,可作为大量应用的服务基础,适用于多种文本,包括网页、普通(非网络)文档、数据库中的文本等。本文根据语义标注的研究历程,介绍了国内外面向文本的语义标注研究现状,对语义标注所使用的技术进行总结;在已有语义标注方法分类的基础上,对现有的标注方法进行分类分析;指出了近年来语义标注方法的不足,并探讨了面向文本文档的语义标注发展趋势。
語義網的實現需要為網絡上現有的和新的文檔進行廣汎可用的語義標註,使其內容可被機器所識彆和理解。語義標註是清晰、明確、容易理解的,可作為大量應用的服務基礎,適用于多種文本,包括網頁、普通(非網絡)文檔、數據庫中的文本等。本文根據語義標註的研究歷程,介紹瞭國內外麵嚮文本的語義標註研究現狀,對語義標註所使用的技術進行總結;在已有語義標註方法分類的基礎上,對現有的標註方法進行分類分析;指齣瞭近年來語義標註方法的不足,併探討瞭麵嚮文本文檔的語義標註髮展趨勢。
어의망적실현수요위망락상현유적화신적문당진행엄범가용적어의표주,사기내용가피궤기소식별화리해。어의표주시청석、명학、용역리해적,가작위대량응용적복무기출,괄용우다충문본,포괄망혈、보통(비망락)문당、수거고중적문본등。본문근거어의표주적연구역정,개소료국내외면향문본적어의표주연구현상,대어의표주소사용적기술진행총결;재이유어의표주방법분류적기출상,대현유적표주방법진행분류분석;지출료근년래어의표주방법적불족,병탐토료면향문본문당적어의표주발전추세。
The realization of the Semantic Web requires the widespread availability of semantic annotations for existing and new documents on the Web. Semantic annotation is clearly specified, easy to understand, can serve as a basis for number of useful applications, and is applicable to any sort of textweb pages, regular (nonweb) documents, text fields in databases, etc. In this paper, we provide an overview of semantic annotation of text documents and summarize the techniques used in semantic annotation research according to the research process of semantic annotation. The classification analysis of the existing annotation methods is achieved based on the previous classification. In addition, we pointed out the shortcomings of semantic annotation methods in recent years ,and discuss the development trend of semantic annotation of text document.