计算机与应用化学
計算機與應用化學
계산궤여응용화학
Computers and Applied Chemistry
2015年
7期
885-888
,共4页
闫奕霖%田生伟%禹龙%孙霞
閆奕霖%田生偉%禹龍%孫霞
염혁림%전생위%우룡%손하
并行计算%化学信息学%海量数据%连续属性离散化%哈希
併行計算%化學信息學%海量數據%連續屬性離散化%哈希
병행계산%화학신식학%해량수거%련속속성리산화%합희
parallel computation%chemoinformatics%massive data%discretization of continuous features%hash
针对海量数据环境下单机检索低效问题,建立了对海量化合物快速检索的分布式计算模型,提出了基于分治策略的分段哈希算法.对于如分子量、脂水分配系数(logP)等不适于用哈希检索的连续数值型数据,设计了连续属性离散化模型进行离散化处理.实验结果表明,在对化合物大文件进行检索时,该模型可快速有效地检索范围信息,避免了对海量数据的重复检索,大幅降低了化合物检索的内存及时间,具有稳定的可扩展性和高效性.
針對海量數據環境下單機檢索低效問題,建立瞭對海量化閤物快速檢索的分佈式計算模型,提齣瞭基于分治策略的分段哈希算法.對于如分子量、脂水分配繫數(logP)等不適于用哈希檢索的連續數值型數據,設計瞭連續屬性離散化模型進行離散化處理.實驗結果錶明,在對化閤物大文件進行檢索時,該模型可快速有效地檢索範圍信息,避免瞭對海量數據的重複檢索,大幅降低瞭化閤物檢索的內存及時間,具有穩定的可擴展性和高效性.
침대해량수거배경하단궤검색저효문제,건립료대해양화합물쾌속검색적분포식계산모형,제출료기우분치책략적분단합희산법.대우여분자량、지수분배계수(logP)등불괄우용합희검색적련속수치형수거,설계료련속속성리산화모형진행리산화처리.실험결과표명,재대화합물대문건진행검색시,해모형가쾌속유효지검색범위신식,피면료대해량수거적중복검색,대폭강저료화합물검색적내존급시간,구유은정적가확전성화고효성.