情报学报
情報學報
정보학보
Journal of the China Society for Scientific andTechnical Information
2015年
6期
616-627
,共12页
学科术语%层次关系%本体学习%形式概念分析%概念格%OWL
學科術語%層次關繫%本體學習%形式概唸分析%概唸格%OWL
학과술어%층차관계%본체학습%형식개념분석%개념격%OWL
subject terms%hierarchy relation ship%ontology learning%formal co ncept analysis (FCA)%concept lattice%O W L
本体是领域知识的有效组织和描述,本体学习则是实现本体自动构建的方法体系和技术集合。本文以本体学习理论为指导,提出了一种以文档-术语空间为核心、形式概念分析(FCA)为手段的中文领域本体层次结构自动构建的有效方法,并以“白血病”领域为例,对面向学科资源的医学专业术语层次关联的抽取进行了详细论证,具体包括专业术语的抽取和筛选,术语文档关联的修正等数据清洗过程;文档术语矩阵的建立,领域概念格的自动生成,以及概念格中术语属性的层次关联建立等FCA过程;术语层次关联的自动OWL描述和存储,和领域本体的概念检索和可视化展示过程等。
本體是領域知識的有效組織和描述,本體學習則是實現本體自動構建的方法體繫和技術集閤。本文以本體學習理論為指導,提齣瞭一種以文檔-術語空間為覈心、形式概唸分析(FCA)為手段的中文領域本體層次結構自動構建的有效方法,併以“白血病”領域為例,對麵嚮學科資源的醫學專業術語層次關聯的抽取進行瞭詳細論證,具體包括專業術語的抽取和篩選,術語文檔關聯的脩正等數據清洗過程;文檔術語矩陣的建立,領域概唸格的自動生成,以及概唸格中術語屬性的層次關聯建立等FCA過程;術語層次關聯的自動OWL描述和存儲,和領域本體的概唸檢索和可視化展示過程等。
본체시영역지식적유효조직화묘술,본체학습칙시실현본체자동구건적방법체계화기술집합。본문이본체학습이론위지도,제출료일충이문당-술어공간위핵심、형식개념분석(FCA)위수단적중문영역본체층차결구자동구건적유효방법,병이“백혈병”영역위례,대면향학과자원적의학전업술어층차관련적추취진행료상세론증,구체포괄전업술어적추취화사선,술어문당관련적수정등수거청세과정;문당술어구진적건립,영역개념격적자동생성,이급개념격중술어속성적층차관련건립등FCA과정;술어층차관련적자동OWL묘술화존저,화영역본체적개념검색화가시화전시과정등。
O ntology is theeffectiveorgan izatio n and descrip tio n for domain know ledgeand O ntology Learnin g ( O L ) is themethodology and tech n olo gy to con struct O ntology a uto ma ticaly. WiththeO L theo ry as a g uid e,this pap er proposes an effectivemethod ,which is withdocumen ts-terms spaceas a coreand withF o rma l C oncept A n a lysis ( FCA) as a mea n s,to con struct h ierarchy struc tureofC hineseD oma in O ntology a uto ma ticaly. Taking “ leuk emia ” field for an example,it in d eta il demonstrates theextra ctin g process on h ierarchy relation ship of Med ic a l professio n al terms o rien tedd is ciplin es res o urc e,which s p ec ific a l y contains 3 processes. F irs t is thedata c lea rin g process as in itia liz a tio n in c lud in g extra ctin g and filterin g of professio n al terms ,and amendment ofassociation ofterms fromdocuments. Second is theFCAprocess in c lud in g b uild in g ofdocumen ts-terms ma trix , a uto matic generation ofdomain concept la ttic eand con structio n ofh iera rch y relation s h ip ofp rop erties fro mterms in concept la ttic e. Third is theterms ontology d escrip tio n process in c lud in g automatic OWL descrip tio n and storageofh ierarchy associations ofterms ,concep t searching and vis ualy display in g ofdomain ontology.