计算机系统应用
計算機繫統應用
계산궤계통응용
APPLICATIONS OF THE COMPUTER SYSTEMS
2015年
5期
253-256
,共4页
倒排文件%按页存储%磁盘I/O层%堆文件管理器%记录
倒排文件%按頁存儲%磁盤I/O層%堆文件管理器%記錄
도배문건%안혈존저%자반I/O층%퇴문건관리기%기록
inverted file%storage by pages%disk I/O layer%heap file manager%records
页是磁盘与内存进行数据交换的基本单位,它在操作系统、数据库管理系统以及倒排文件的数据组织中占据十分重要的地位。为减少倒排索引的磁盘 I/O 读写开销,提出了一种倒排文件按页存储的构建方法,实现了按页读写文件。该方法主要包括磁盘I/O层设计、页管理器设计以及堆文件管理器设计三个部分,实现了页大小可变的分块式数据文件管理,支持页内定长记录、变长记录的组装以及超长数据记录的跨页存储。经实验测试,结果表明该方法是行之有效的,可以将其应用到实际的垂直搜索引擎中。
頁是磁盤與內存進行數據交換的基本單位,它在操作繫統、數據庫管理繫統以及倒排文件的數據組織中佔據十分重要的地位。為減少倒排索引的磁盤 I/O 讀寫開銷,提齣瞭一種倒排文件按頁存儲的構建方法,實現瞭按頁讀寫文件。該方法主要包括磁盤I/O層設計、頁管理器設計以及堆文件管理器設計三箇部分,實現瞭頁大小可變的分塊式數據文件管理,支持頁內定長記錄、變長記錄的組裝以及超長數據記錄的跨頁存儲。經實驗測試,結果錶明該方法是行之有效的,可以將其應用到實際的垂直搜索引擎中。
혈시자반여내존진행수거교환적기본단위,타재조작계통、수거고관리계통이급도배문건적수거조직중점거십분중요적지위。위감소도배색인적자반 I/O 독사개소,제출료일충도배문건안혈존저적구건방법,실현료안혈독사문건。해방법주요포괄자반I/O층설계、혈관리기설계이급퇴문건관리기설계삼개부분,실현료혈대소가변적분괴식수거문건관리,지지혈내정장기록、변장기록적조장이급초장수거기록적과혈존저。경실험측시,결과표명해방법시행지유효적,가이장기응용도실제적수직수색인경중。
Page is the basic unit of data exchange between disk and memory, in operating systems, database management systems, and inverted file’s data organization, it occupies a very important position. To reduce the inverted index’s disk I/O read and write overhead, proposing a method that the inverted file storages by pages, and achieving to read and write files by page. This method mainly contains three parts, including disk I/O layer design, page manager design, and heap file manager design, achieving variable page size’s data file management using block, supporting for the fixed-length records, variable-length records storage assembly in the page and super long data record’s cross-page storage. The experimental test results show that the method is effective, and it can be applied to actual vertical search engine.