论文导读:Fast scans and joins using flash drives

[ShahHWG08]Mehul A. Shah, Stavros Harizopoulos, Janet L. Wiener, Goetz Graefe: Fast scans and joins using flash drives. DaMoN 2008:17-24

温馨提示:“论文导读”旨在推荐他人发表的本领域相关论文。本论文摘要由厦门大学计算机系林子雨老师(http://www.cs.xmu.edu.cn/linziyu)翻译,如果您对该论文细节感兴趣,可以阅读英文原文(全文PDF版权归出版商所有,因此需要到出版商网站下载该论文PDF)。

【摘要】随着访问内存和磁盘的时间的差距逐渐扩大,闪存是磁盘的很好替代者。本文讨论了一种可选的数据布局,以及使用闪存存储的系统中的连接算法。本文所有的算法都是充分利用闪存快速的随机读。本文把传统的顺序IO算法转变成顺序IO和随机IO的混合,从而在更少的时间内处理更少的数据。本文在一个普通的闪存设备上的测试表明,一个列式的数据页布局方式,要比传统的基于行的布局方式更快。本文提出了一个新的算法,RARE-join,它被设计成面向基于列的页布局,并且把它和传统的哈希连接算法做了比较。实验分析显示,RARE-join在许多实际应用中都具有较高的性能,当连接选择谓词较小的时候,只有一部分列会被投影到连接结果中。

【林子雨推荐理由】该论文充分利用了PAX页布局方式,首先构建一个连接索引,然后,只会获取那些计算连接结果所需要的页和列,大大减少了IO开销。