计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2014年
9期
1980-1992
,共13页
汤文%张春明%谭光明%张佩珩%孙凝晖
湯文%張春明%譚光明%張珮珩%孫凝暉
탕문%장춘명%담광명%장패형%손응휘
高通量测序技术%短序列比对%Hash索引%现场可编程门阵列%异构体系结构
高通量測序技術%短序列比對%Hash索引%現場可編程門陣列%異構體繫結構
고통량측서기술%단서렬비대%Hash색인%현장가편정문진렬%이구체계결구
high-throughput sequencing%short reads mapping%Hash-index%field programmable gate array (FPGA)%heterogeneous architecture
自2008年1月高通量测序技术应用以来,测序的通量和成本都在不断下降.然而基因数据的爆发式增长速度已经超过了摩尔定律,对海量数据的计算处理能力成为制约基因测序应用推广的瓶颈.以基于Hash索引的重测序算法为目标,对计算和访存行为进行分析,从而提出了一个现场可编程门阵列(field programmable gate array,FPGA)作为协处理器的架构,并在Convey公司的HC-lex平台上进行了设计与实现.其基本处理单元内部采用全流水的设计及FIFO隔离计算模块和访存模块,可以完整执行重测序算法的核心流程.通过将基本处理单元和访存端口的一对一绑定,在4块Xilinx Virtex-6 LX760上实现了64路并行处理流程,总平均读内存带宽可达22.59 GBps.与8核Intel Xeon处理器相比,可以提升28.5倍的性能.
自2008年1月高通量測序技術應用以來,測序的通量和成本都在不斷下降.然而基因數據的爆髮式增長速度已經超過瞭摩爾定律,對海量數據的計算處理能力成為製約基因測序應用推廣的瓶頸.以基于Hash索引的重測序算法為目標,對計算和訪存行為進行分析,從而提齣瞭一箇現場可編程門陣列(field programmable gate array,FPGA)作為協處理器的架構,併在Convey公司的HC-lex平檯上進行瞭設計與實現.其基本處理單元內部採用全流水的設計及FIFO隔離計算模塊和訪存模塊,可以完整執行重測序算法的覈心流程.通過將基本處理單元和訪存耑口的一對一綁定,在4塊Xilinx Virtex-6 LX760上實現瞭64路併行處理流程,總平均讀內存帶寬可達22.59 GBps.與8覈Intel Xeon處理器相比,可以提升28.5倍的性能.
자2008년1월고통량측서기술응용이래,측서적통량화성본도재불단하강.연이기인수거적폭발식증장속도이경초과료마이정률,대해량수거적계산처리능력성위제약기인측서응용추엄적병경.이기우Hash색인적중측서산법위목표,대계산화방존행위진행분석,종이제출료일개현장가편정문진렬(field programmable gate array,FPGA)작위협처리기적가구,병재Convey공사적HC-lex평태상진행료설계여실현.기기본처리단원내부채용전류수적설계급FIFO격리계산모괴화방존모괴,가이완정집행중측서산법적핵심류정.통과장기본처리단원화방존단구적일대일방정,재4괴Xilinx Virtex-6 LX760상실현료64로병행처리류정,총평균독내존대관가체22.59 GBps.여8핵Intel Xeon처리기상비,가이제승28.5배적성능.