信息技术
信息技術
신식기술
INFORMATION TECHNOLOGY
2014年
4期
196-200
,共5页
徐树振%罗学礼%王森%杨莉%段嘉杰%张德刚
徐樹振%囉學禮%王森%楊莉%段嘉傑%張德剛
서수진%라학례%왕삼%양리%단가걸%장덕강
Solr%非结构化数据%Hadoop%搜索引擎%全文检索
Solr%非結構化數據%Hadoop%搜索引擎%全文檢索
Solr%비결구화수거%Hadoop%수색인경%전문검색
Solr%unstructured data%Hadoop%search engine%full-text search
随着信息化的高速发展,企业内部各业务系统中非结构化数据的数据量急剧膨胀,使得信息的搜索工作变得极为繁琐。建设该企业级非结构化数据检索平台,在Linux计算机集群上部署Hadoop开发框架以及Solr全文检索系统,将各业务系统中的非结构化数据进行集中式的存储、管理,并且提供统一的搜索服务。介绍了Solr 的原理,并使用它搭建非结构化数据的中文搜索引擎,通过测试证明了该搜索引擎具有良好的搜索性能。通过检索平台,用户能够快速而高效地获取精确的搜索结果。
隨著信息化的高速髮展,企業內部各業務繫統中非結構化數據的數據量急劇膨脹,使得信息的搜索工作變得極為繁瑣。建設該企業級非結構化數據檢索平檯,在Linux計算機集群上部署Hadoop開髮框架以及Solr全文檢索繫統,將各業務繫統中的非結構化數據進行集中式的存儲、管理,併且提供統一的搜索服務。介紹瞭Solr 的原理,併使用它搭建非結構化數據的中文搜索引擎,通過測試證明瞭該搜索引擎具有良好的搜索性能。通過檢索平檯,用戶能夠快速而高效地穫取精確的搜索結果。
수착신식화적고속발전,기업내부각업무계통중비결구화수거적수거량급극팽창,사득신식적수색공작변득겁위번쇄。건설해기업급비결구화수거검색평태,재Linux계산궤집군상부서Hadoop개발광가이급Solr전문검색계통,장각업무계통중적비결구화수거진행집중식적존저、관리,병차제공통일적수색복무。개소료Solr 적원리,병사용타탑건비결구화수거적중문수색인경,통과측시증명료해수색인경구유량호적수색성능。통과검색평태,용호능구쾌속이고효지획취정학적수색결과。
With the rapid development of information technology , volume of unstructured data in the business systems within the enterprise expands rapidly , making the search for information extremely cumbersome .An unstructured data retrieval platform for the entire enterprise , which is built by deploying on a Linux computer cluster with Hadoop development framework and Solr full text retrieval system .The platform centralizes storage and management of the unstructured data from each business system , and provides a unified search service .This paper introduces the principle of Solr , and a Chinese search engine for unstructured data is built with Solr .The test proved that the search engine has a good search performance .By the retrieval platform , users can quickly and efficiently get accurate search results .