标准科学
標準科學
표준과학
STANDARD SCIENCE
2012年
2期
92-96
,共5页
组织机构代码信息%自由文本%信息抽取%属性关联
組織機構代碼信息%自由文本%信息抽取%屬性關聯
조직궤구대마신식%자유문본%신식추취%속성관련
本文以涵盖各类单位动态基本信息的全国组织机构代码数据库为基础,依托当前自然语言自动处理技术的成功经验和研究成果,探究实现大规模机构信息自由文本数据的信息抽取、切分词优化、统计分类推断、属性关联分析等方法.为“全国组织机构代码共享平台”实现核心字段动态自动翻译、知识发现、数据质量提高,以及信息自动填补等方面提供关键技术支撑,进而为提高数据库信息利用率提供技术参考,为积极推进国家电子政务信息建设做出有益探索.
本文以涵蓋各類單位動態基本信息的全國組織機構代碼數據庫為基礎,依託噹前自然語言自動處理技術的成功經驗和研究成果,探究實現大規模機構信息自由文本數據的信息抽取、切分詞優化、統計分類推斷、屬性關聯分析等方法.為“全國組織機構代碼共享平檯”實現覈心字段動態自動翻譯、知識髮現、數據質量提高,以及信息自動填補等方麵提供關鍵技術支撐,進而為提高數據庫信息利用率提供技術參攷,為積極推進國傢電子政務信息建設做齣有益探索.
본문이함개각류단위동태기본신식적전국조직궤구대마수거고위기출,의탁당전자연어언자동처리기술적성공경험화연구성과,탐구실현대규모궤구신식자유문본수거적신식추취、절분사우화、통계분유추단、속성관련분석등방법.위“전국조직궤구대마공향평태”실현핵심자단동태자동번역、지식발현、수거질량제고,이급신식자동전보등방면제공관건기술지탱,진이위제고수거고신식이용솔제공기술삼고,위적겁추진국가전자정무신식건설주출유익탐색.