井冈山大学学报(自然科学版)
井岡山大學學報(自然科學版)
정강산대학학보(자연과학판)
JOURNAL OF JINGGANGSHAN UNIVERSITY(SCIENCE AND TECHNOLOGY)
2013年
2期
60-64
,共5页
Spring MVC%Lucene%Tika%文档元数据%全文检索
Spring MVC%Lucene%Tika%文檔元數據%全文檢索
Spring MVC%Lucene%Tika%문당원수거%전문검색
spring MVC%lucene%tika%document metadata%full text retrieval
介绍了利用Lucene结合Tika实现站点内容的全文检索设计的编程过程.用Tika获取文档的元数据以及文档内容的文本提取.用Lucene实现文档的索引创建和检索服务,结合实例详细分析了Lucene API的具体使用特点.利用Spring MVC实现搜索服务的Web访问处理.可对网站的HTML、PDF、word、PPT、mht等各种类型的文档提供统一的内容检索服务.在该论文研究基础上可建立个性化的内容搜索服务系统.
介紹瞭利用Lucene結閤Tika實現站點內容的全文檢索設計的編程過程.用Tika穫取文檔的元數據以及文檔內容的文本提取.用Lucene實現文檔的索引創建和檢索服務,結閤實例詳細分析瞭Lucene API的具體使用特點.利用Spring MVC實現搜索服務的Web訪問處理.可對網站的HTML、PDF、word、PPT、mht等各種類型的文檔提供統一的內容檢索服務.在該論文研究基礎上可建立箇性化的內容搜索服務繫統.
개소료이용Lucene결합Tika실현참점내용적전문검색설계적편정과정.용Tika획취문당적원수거이급문당내용적문본제취.용Lucene실현문당적색인창건화검색복무,결합실례상세분석료Lucene API적구체사용특점.이용Spring MVC실현수색복무적Web방문처리.가대망참적HTML、PDF、word、PPT、mht등각충류형적문당제공통일적내용검색복무.재해논문연구기출상가건립개성화적내용수색복무계통.
The programming process of full text retrieval design exploiting Lucene and Tika is introduced. Tika is used for get Metadata and extract text from documents. The index creating and retrieval service is realized by Lucene, we analyze the specific characteristics of Lucene API. Web access processing of search service is implemented using Spring MVC. The service can provide uniform retrieval service for documents in forms of HTML, PDF, WORD, PPT, mht and so on in web sites. Personalized content retrieval service system can be created based on this paper.