论文导读:向小岩博士论文《闪存数据库若干关键问题研究》

林子雨温馨提示:论文PDF有版权,请到百度搜索下载该论文,该博士论文可以在CNKI上下载。

闪存数据库若干关键问题研究

中国科学技术大学 向小岩

 
【摘要】: 闪存诞生于20世纪80年代末,是一种新型的固态存储介质,具有高速、非易失、低功耗、高抗震、小巧轻便等特性。闪存的优良特性使得它成为突破磁盘局限性 的首选存储介质。近几年来,闪存已经被广泛应用于各种嵌入式系统和便携式设备;同时,随着闪存容量的快速增长和价格的不断下降,闪存已经成为一种新的重要 的二级存储设备,并开始应用于企业级计算环境中。 日益多样和复杂的应用对闪存上的数据管理提出了许多新的挑战,采用数据库技术来管理闪存中的数据,即建立闪存数据库,成为应对闪存数据管理方面挑战的首选 途径。由于闪存具有许多与磁盘显著不同的特性,将传统的基于磁盘的数据库技术直接移植到闪存上并不能较好地发挥闪存的性能优势。因此,从闪存的物理特性入 手,针对数据库的数据存取特点,研究闪存数据库领域的相关问题,具有重要的理论意义和应用价值。 本论文总结了闪存数据库领域已有的研究成果,并在存储管理、索引和事务恢复等方面展开了研究。 论文首先介绍了闪存的物理特性及其广泛应用,接着分别介绍了闪存的两种主要类型:NOR闪存和NAND闪存,并分析了两者物理特性的异同和应用方式的差 别。 索引是提高数据库性能的关键技术之一。针对已有的索引方法中系统故障后结点转换表重建代价大的问题,论文结合NOR闪存和NAND闪存的物理特性,提出基 于复合闪存存储结构的可靠B+树索引实现方法,结合快照和日志两种机制,实现了系统故障后索引结点转换表的快速重建。 存储管理是闪存数据库研究的基础。论文针对数据库的数据存取特点,提出了基于分离日志的存储管理方法,提高了数据更新性能。同时,将该方法和换位更新方法 相结合,进一步提出了自适应的存储管理方法,在提高更新性能的同时较好地兼顾了读取性能,能够适应变化的负载。 事务恢复是闪存数据库的重要组成部分。论文针对已有的闪存事务恢复方法在运行开销和提交代价等方面的不足,提出了基于分离日志的事务恢复方法,在减少事务 提交代价的同时提供了较好的恢复性能。 本论文主要在以下几个关键问题上做出了新贡献: (1)在复合闪存存储结构的基础上,提出了一种可靠的B+树索引实现方法,结合快照和日志两种机制,实现了系统故障后索引结点转换表等关键数据结构的快速 重建。 (2)提出了自适应的闪存存储管理方法,结合了基于日志的更新方法和换位更新方法的优点,在提高数据更新性能的同时较好地兼顾了读取性能,能够适应变化的 负载。 (3)提出了基于分离日志的事务恢复方法,减少了事务提交代价,并提供了较好的故障恢复性能。

【关键词】:闪存 闪存数据库 存储管理 索引 事务恢复
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP311.13
 

【目录】:

  • 摘要5-7
  • ABSTRACT7-16
  • 第1章 绪论16-32
  • 1.1 引言16-17
  • 1.2 闪存数据库17-28
  • 1.2.1 概述17-19
  • 1.2.2 闪存数据库存储管理19-25
  • 1.2.3 闪存数据库索引管理25-26
  • 1.2.4 闪存数据库并发控制机制26
  • 1.2.5 闪存数据库事务恢复机制26-27
  • 1.2.6 闪存数据库查询优化机制27-28
  • 1.3 本文的工作28-29
  • 1.3.1 尚未解决的关键问题28
  • 1.3.2 研究内容28-29
  • 1.4 本文的组织29-32
  • 第2章 闪速存储器32-40
  • 2.1 引言32
  • 2.2 闪存及其应用32-35
  • 2.2.1 闪存的优良特性32-34
  • 2.2.2 闪存的广泛应用34-35
  • 2.3 闪存的物理特性35-38
  • 2.3.1 闪存芯片的类型35-36
  • 2.3.2 NOR与NAND型闪存的特性比较36-38
  • 2.4 小结38-40
  • 第3章 基于复合闪存存储结构的可靠B+树索引40-58
  • 3.1 引言40
  • 3.2 相关研究40-44
  • 3.2.1 散列索引41
  • 3.2.2 B树类索引41-44
  • 3.3 可靠的B+树索引实现方法RBFTL44-48
  • 3.3.1 基本思路44-45
  • 3.3.2 结点转换表快照和更新日志的记录45-47
  • 3.3.3 结点转换表的快速重建47-48
  • 3.4 复合存储结构的可行性分析48-49
  • 3.5 数据分析49-52
  • 3.5.1 BFTL的重建机制50
  • 3.5.2 FlashDB的重建机制50
  • 3.5.3 RBFTL的重建机制50-52
  • 3.6 实验与分析52-55
  • 3.6.1 实验设计52-53
  • 3.6.2 结点转换表重建时间53-54
  • 3.6.3 运行开销54-55
  • 3.7 小结55-58
  • 第4章 自适应的闪存存储管理方法58-76
  • 4.1 引言58
  • 4.2 相关研究58-61
  • 4.2.1 换位更新方法58-59
  • 4.2.2 基于日志的更新方法59-61
  • 4.3 基于分离日志的闪存存储管理方法OPL61-64
  • 4.3.1 分离日志61-62
  • 4.3.2 数据更新过程62-63
  • 4.3.3 数据读取过程63-64
  • 4.4 自适应的闪存存储管理方法OPL+64-68
  • 4.4.1 基本思路64-65
  • 4.4.2 数据更新和读取过程65-66
  • 4.4.3 自适应模式转换66-68
  • 4.5 实验与分析68-74
  • 4.5.1 实验设计68-69
  • 4.5.2 日志空间大小的影响69-71
  • 4.5.3 读写操作比例的影响71-73
  • 4.5.4 自适应模式转换和表项压缩机制的影响73-74
  • 4.6 小结74-76
  • 第5章 基于分离日志的事务恢复方法76-98
  • 5.1 引言76
  • 5.2 相关研究76-81
  • 5.2.1 传统的基于日志的恢复方法76-77
  • 5.2.2 基于影子分页的恢复方法77-79
  • 5.2.3 IPL的恢复方法79-81
  • 5.3 OPL的事务恢复81-90
  • 5.3.1 事务对已有算法的影响81-84
  • 5.3.2 日志分布表快照84-85
  • 5.3.3 全局合并85-87
  • 5.3.4 故障恢复87-90
  • 5.4 OPL+的事务恢复90-93
  • 5.5 实验与分析93-96
  • 5.5.1 实验设计93-94
  • 5.5.2 实验数据94-96
  • 5.6 小结96-98
  • 第6章 结束语98-100
  • 6.1 本文的主要工作98
  • 6.2 主要贡献和创新点98-99
  • 6.3 下一步工作99-100
  • 参考文献100-108
  • 致谢108-110
  • 在读期间发表的学术论文110-112
  • 在读期间参加的科研项目112