计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
35期
67-70
,共4页
多文档自动文摘%MapReduce%并行计算
多文檔自動文摘%MapReduce%併行計算
다문당자동문적%MapReduce%병행계산
多文档文摘是将同一主题下的多个文本描述的主要的信息按压缩比提炼为一个文本的自然语言处理技术,它可以从全局的角度对网络信息进行挖掘.在面对飞速增长的网络资源时,如何准确、高效地从海量数据源内进行自动文摘处理,是多文档自动文摘面临的主要难题之一.MapReduce是Google提出的一种分布式并行计算方法,它可以部署在任意一个普通商用计算机组成的集群上,能够有效地协调集群内各计算机的计算任务,充分利用计算机集群的处理能力,能够对海量数据进行有效的分析处理.提出了一个有效的实验模型,将MapReduce分布式并行框架应用在多文档自动文摘技术中.实验结果表明,MapReduce在保证文摘质量的前提下,能够有效地提高文摘抽取过程的处理性能.
多文檔文摘是將同一主題下的多箇文本描述的主要的信息按壓縮比提煉為一箇文本的自然語言處理技術,它可以從全跼的角度對網絡信息進行挖掘.在麵對飛速增長的網絡資源時,如何準確、高效地從海量數據源內進行自動文摘處理,是多文檔自動文摘麵臨的主要難題之一.MapReduce是Google提齣的一種分佈式併行計算方法,它可以部署在任意一箇普通商用計算機組成的集群上,能夠有效地協調集群內各計算機的計算任務,充分利用計算機集群的處理能力,能夠對海量數據進行有效的分析處理.提齣瞭一箇有效的實驗模型,將MapReduce分佈式併行框架應用在多文檔自動文摘技術中.實驗結果錶明,MapReduce在保證文摘質量的前提下,能夠有效地提高文摘抽取過程的處理性能.
다문당문적시장동일주제하적다개문본묘술적주요적신식안압축비제련위일개문본적자연어언처리기술,타가이종전국적각도대망락신식진행알굴.재면대비속증장적망락자원시,여하준학、고효지종해량수거원내진행자동문적처리,시다문당자동문적면림적주요난제지일.MapReduce시Google제출적일충분포식병행계산방법,타가이부서재임의일개보통상용계산궤조성적집군상,능구유효지협조집군내각계산궤적계산임무,충분이용계산궤집군적처리능력,능구대해량수거진행유효적분석처리.제출료일개유효적실험모형,장MapReduce분포식병행광가응용재다문당자동문적기술중.실험결과표명,MapReduce재보증문적질량적전제하,능구유효지제고문적추취과정적처이성능.