实验室暑假第四次讨论会

数据库实验室林子雨老师小组2012—2013学年暑假

第四次小组会议会议纪要

会议时间:2013年8月31日(星期六)上午9点到11:30

会议地点:厦门大学海韵园科研二号楼303室

与会者:林子雨、刘颖杰、叶林宝

会议纪要撰写:叶林宝

会议内容:

厦门大学计算机系数据库实验室林子雨老师小组2012—2013学年暑假第四次小组会议在2013年8月31日召开,会议首先由叶林宝汇报了模糊决策树研究论文,林子雨老师做了论文创新思路指导;然后由刘颖杰同学汇报关于闪存数据库索引研究方向的1篇论文,报告过程中,林子雨老师针对这篇论文谈了自己的看法,并提出一些指导。

1.刘颖杰同学作关于论文《Lazy-Adaptive Tree: An Optimized Index Structure for Flash Devices》的汇报。

 

刘颖杰同学此次的报告介绍了论文的主要思路,Lazy-Adaptive Tree依然是以b+tree为基础的,其以缓存更新已减少写次数为出发点,使用了级联缓存(Cascaded Buffers)和动态缓存(Adaptive Buffering)两个创新方法,以求数据库在缓存上发挥更好的效果

 

论文要点:

(1)级联缓存(Cascaded Buffers)

该算法中已K为层数确定子树大小,从而将一棵完整的b+tree分为若干子树,每一棵子树分配一个buffer用以缓存自身以及下级子树的更新信息

(2)动态缓存(Adaptive Buffering)

该算法通过实时计算各子树buffer清空的代价以及保留buffer的代价来判断何时将缓存中的数据递次更新到下一层,以此动态保证索引树的效率

(3)文章中也对该索引结构的效率问题进行了数学方面相关的论证

 

2 叶林宝简要介绍了近期通过阅读论文的一些想法,同时就这些想法和大伙进行了讨论。

(1)决策树的研究方向有以下:

1) 用于决策树建模的启发式(例如信息熵、基尼系数等)

2) 推理机制(怎样利用已建好的模型准确的进行分类)

3) 数据预处理(数据离散化、脏数据、丢失数据等)

4) 其他,和其他机器学习方法融合,如应用粗糙集、神经网络、SVM等

(2)会议讨论了如何抓取论文的创新点,以及所谓的“创新”的可行度。