活动概况|进度表|签到表|出勤和处罚办法|动员书|启动仪式|娱乐休闲|活动开支|小组讨论会|大扫除|总结大会|相册
7月19日 | 7月20日 | 7月21日 | 7月22日 | 7月23日 | 7月24日 | 7月25日 | 7月26日 | 7月27日 | 7月28日 |
7月29日 | 7月30日 | 7月31日 | 8月1日 | 8月2日 | 8月3日 | 8月4日 | 8月5日 | 8月6日 | 8月7日 |
8月8日 | 8月9日 | 8月10日 | 8月11日 | 8月12日 | 8月13日 | 8月14日 | 8月15日 | 8月16日 | 8月17日 |
8月18日 | 8月19日 | 8月20日 | 8月21日 | 8月22日 | 8月23日 | 8月24日 | 8月25日 | 8月26日 | 8月27日 |
8月28日 | 8月29日 | 8月30日 | 8月31日 | 9月1日 | 9月2日 | 9月3日 | 9月4日 | 9月5日 | 9月6日 |
9月7日 | 9月8日 | 9月9日 | 9月10日 |
日期 | 林子雨 | 赖明星 | 刘颖杰 | 备注 | |||
上午 | 下午 | 上午 | 下午 | 上午 | 下午 | ||
7月19日(周四) | 正常 | ||||||
7月20日(周五) | 小组第1次讨论会 | ||||||
7月21日(周六) | 休息日 | 休息日 | 休息日 | 休息日 | 休息日 | 休息日 | 休息日 |
7月22日(周日) | 休息日 | 休息日 | 休息日 | 休息日 | 休息日 | 休息日 | 休息日 |
7月23日(周一) | 正常 | ||||||
7月24日(周二) | 正常 | ||||||
7月25日(周三) | 正常 | ||||||
7月26日(周四) | 正常 | ||||||
7月27日(周五) | 小组第2次讨论会 | ||||||
7月28日(周六) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
7月29日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
7月30日(周一) | 正常 | ||||||
7月31日(周二) | 正常 | ||||||
8月1日(周三) | 刘颖杰迟到10分钟 | ||||||
8月2日(周四) | 正常 | ||||||
8月3日(周五) | 小组第3次讨论会 | ||||||
8月4日(周六) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
8月5日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
8月6日(周一) | 正常 | ||||||
8月7日(周二) | 正常 | ||||||
8月8日(周三) | 正常 | ||||||
8月9日(周四) | 正常 | ||||||
8月10日(周五) | 小组第4次讨论会 | ||||||
8月11日(周六) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 小组五缘湾休闲游活动 |
8月12日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
8月13日(周一) | 赖明星请假考驾照 | ||||||
8月14日(周二) | 赖明星请假考驾照,刘颖杰上午迟到20分钟 | ||||||
8月15日(周三) | 赖明星请假考驾照 | ||||||
8月16日(周四) | 正常 | ||||||
8月17日(周五) | 小组第5次讨论会 | ||||||
8月18日(周六) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
8月19日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
8月20日(周一) | 正常 | ||||||
8月21日(周二) | 正常 | ||||||
8月22日(周三) | 正常 | ||||||
8月23日(周四) | 正常 | ||||||
8月24日(周五) | 小组第6次讨论会 | ||||||
8月25日(周六) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
8月26日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
8月27日(周一) | 赖明星请假考驾照 | ||||||
8月28日(周二) | 赖明星请假考驾照 | ||||||
8月29日(周三) | 赖明星请假考驾照 | ||||||
8月30日(周四) | 正常 | ||||||
8月31日(周五) | 林子雨老师请假送孩子去医院,赖明星请假考驾照,小组第6次会议 | ||||||
9月1日(周六) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
9月2日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
9月3日(周一) | 正常 | ||||||
9月4日(周二) | 正常 | ||||||
9月5日(周三) | 正常 | ||||||
9月6日(周四) | 正常 | ||||||
9月7日(周五) | 活动总结大会 | ||||||
9月8日(周六) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
9月9日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
9月10日(周一) | 休息 | 休息 | 教师节,打扫卫生,奋战活动结束 |
序号 | 活动内容 | 参加人员 | 地点 | 花销 |
1 | 活动启动晚宴“碳烤活鱼” | 林子雨、赖明星、刘颖杰、殷耀明 | 厦大学生公寓 | 120元 |
2 | 五缘湾休闲游 | 林子雨、赖明星、刘颖杰、殷耀明 | 五缘湾 | 350元(其中打车费120元) |
3 | 活动结束晚宴和观影 | 林子雨、赖明星、刘颖杰、殷耀明 | 万达广场 | 290元(其中打车费50元) |
8月11日(周六)下午大家一起到五缘湾搞活动放松一下,其中要辛苦同学们完成的一项”艰巨任务“是,帮老师完成地瓜园的“罢园”工作,也就是把几垄地瓜全部挖出来,挖出来的地瓜可以作为我们的休闲食品。其他休闲活动项目暂时保密。
时间安排:请三位同学保存各自的联系方式和老师的联系方式,周六中午睡个午觉后,下午2点三个人一起出发,3点左右到达五缘湾。
五缘湾活动总结报告
2012年8月11日周六下午,数据库实验室林子雨老师、赖明星同学、刘颖杰同学、殷耀明同学为庆祝暑期学习计划的阶段性顺利在厦门五缘湾举行了庆祝活动。
活动内容由林子雨老师策划、筹备,主要活动内容包括:暴雨来临前抢收地瓜、雨中登高俯瞰五缘湾、桥下草原中赏乐品茶、现实版的泰坦尼克、海边沙滩月黑风高烤地瓜、海钓基地旁吃烧烤闲聊等。期间,林子雨老师带领我们参观了五缘湾的主要风景,并为我们介绍了五缘湾及其周边的相关建设和发展情况。活动一直在惊喜和欢乐中度过。
在此,特别感谢林老师为活动的开展所做的周到细致的准备工作,这是那些开心时光的保障。我们没有受到外界各种因素的影响,即使下雨也没有影响到活动有条不紊的进行。不一样的态度,不一样的人生。生活并不只是单调机械地学习、工作。它可以有很多美好的方式。这是一次良好的有意义的体验。
希望林老师和三位同学在接下来的暑期学习、生活中一直保持激情、保持斗志。(此总结由殷耀明同学撰写)
2012年8月11日夜晚,林子雨师生在五缘湾海钓基地旁吃烧烤 | 2012年8月11日下午,林子雨师生在五缘大桥上听泰坦尼克号主题曲 |
2012年8月11日下午林子雨老师师生在五缘大桥下避雨听曲品茶闲聊 | 8月11日下午赖明星同学站在五缘大桥上俯瞰游艇帆船港感受海的博大情怀 |
活动结束仪式晚宴和观影
2012年9月7日晚,奋战活动总结大会后到万达广场看电影《敢死队2》 | 2012年9月7日晚,奋战活动总结大会后到万达广场抢购安踏三折货 |
次数 | 时间 | 参加者 | 内容 | 备注 |
1 | 2012年7月20日下午2点30分到6点 | 林子雨、赖明星、刘颖杰、殷耀明 | (1)赖明星做综合考试报告;(2)刘颖杰做论文报告;(3)林子雨老师做点评。 | |
2 | 2012年7月27日下午2点30分到5点 | 林子雨、赖明星、刘颖杰、殷耀明 | (1)林子雨老师做闪存数据库论文调研报告;(2)赖明星做闪存数据库论文讲解报告;(3)刘颖杰汇报“坦克大战”JAVA程序编写。 | |
3 | 2012年8月3日下午2点30分到5点30分 | 林子雨、赖明星、刘颖杰、殷耀明 | (1)林子雨老师继续做闪存数据库论文调研报告;(2)赖明星做闪存数据库论文讲解报告;(3)刘颖杰讲解关键词查询论文。 | |
4 | 2012年8月10日下午2点30分到5点30分 | 林子雨、赖明星、刘颖杰、殷耀明 | (1)林子雨老师继续做闪存数据库论文调研报告;(2)赖明星做闪存数据库论文讲解报告;(3)刘颖杰讲解关键词查询论文。 | |
5 | 2012年8月17日下午2点30分到6点 | 林子雨、赖明星、刘颖杰、殷耀明、韩静 | (1)林子雨老师继续做闪存数据库论文调研报告;(2)赖明星做闪存数据库论文讲解报告;(3)刘颖杰讲解TANK游戏编程。 | |
6 | 2012年8月24日下午2点30分到5点30分 | 林子雨、赖明星、刘颖杰、殷耀明、韩静 | (1)林子雨老师继续做闪存数据库论文调研报告;(2)赖明星做闪存数据库论文讲解报告;(3)刘颖杰讲解关键词查询论文。 | |
7 | 2012年8月31日下午2点30分到5点 | 林子雨、赖明星、刘颖杰、殷耀明、韩静 | (1)赖明星做闪存数据库论文讲解报告;(2)刘颖杰讲解关键词查询论文。(3)林子雨老师做点评。 | |
8 | 2012年9月7日下午3点到5点20分 | 林子雨、赖明星、刘颖杰、殷耀明、韩静 | (1)赖明星同学展示论文翻译成果、做成果和心得汇报;(2)刘颖杰同学展示论文翻译成果、做成果和心得汇报;(2)林子雨老师做成果和心得汇报,并对本次活动进行总结,对同学表现进行点评。 | 总结大会 |
林子雨老师团队第3次小组讨论会,将于8月3日(本周五)下午2点30分在科研2-303举行,欢迎感兴趣的老师和同学参加!
周五下午的讨论会可能会影响到其他在303房间同学的正常学习,提前告知,还请见谅!
林子雨老师团队的暑假活动主页:https://dblab.xmu.edu.cn/post/477/
会议时间:2012年8月3日(周五),下午2点30分
会议地点:厦门大学海韵园科研2号楼303
会议内容:
(1)赖明星同学做一篇论文汇报,讲解论文的相关背景知识和核心思想;
(2)刘颖杰同学做一篇论文汇报,讲解论文的相关背景知识和核心思想 ;
(3)讨论会过程中,林子雨老师将针对两位同学讲解的内容进行适当的点评以及内容上的拓展!
感谢数据库各位老师、同学的关注!
会议纪要:
会议时间:2012年08月03日14时30分到17时30分
会议地点:厦门大学海韵园科研二号楼303室
与会者:林子雨、赖明星、刘颖杰
会议内容:
会议首先由林子雨老师作了题为《数据库领域前沿研究调研报告》的报告,这次报告是上一次报告的补充与完善,主要增加了以下知识:
1. 动态盘的内部构造
2. FTL 的功能和实现机制
3. 块的合并操作
4. BAST机制的写操作过程
林子雨老师首先通过一张很形象的图给我们介绍了动态盘的内部结构,主要包括控制器,FTL,SRAM和闪存块,并分别介绍了它们的作用,然后介绍了FTL的各种实现机制,之后又通过林老师自己画的图,重点介绍了块的合并操作,包括切换合并、部分合并和全合并,并解释了为什么全合并操作代价非常之高。最后详细介绍了FTL在BAST机制下的写操作过程,通过这样一个写过程,帮助大家理解动态盘的存储步骤。
林子雨老师的报告持续了一个半小时,之后由赖明星同学作题为《FlashStore:High Throughput Persistent Key-Value Store》的论文阅读报告,赖明星同学根据论文的介绍顺序介绍了一下相关背景、闪存特性和两个Key-Value 存储的应用程序。之后重点介绍了FlashStore的框架和组成部分,且分别介绍了各组成部分的功能,并通过模拟一次读操作和一次写操作来加深理解。中间大家还对FlashStore中使用的两个巧妙方法进行讨论了:
1. Bloom Filter
Bloom filter 采用的是哈希函数的方法,将一个元素映射到一个 m 长度的阵列上的一个点,当这个点是 1 时,那么这个元素在集合内,反之则不在集合内。这个方法的缺点就是当检测的元素很多的时候可能有冲突,解决方法就是使用 k 个哈希 函数对应 k 个点,如果所有点都是 1 的话,那么元素在集合内,如果有 0 的话,元素则不在集合内。
2. Cuckoo Hashing
Cuckoo Hashing 也是采用类似于Bloom Filter的思想,通过使用多个hash函数,提高hash表的使用率。
在对以上两个问题讨论完以后又分析了FlashStore 的多线程并发问题,然后又简单的分析了灾难恢复问题,最后通过几张图表分析了FlashStore带来的性能提升以及资源有效利用等。
赖明星同学的报告持续了一小时,报告结束以后得到了林子雨老师的充分肯定,最后由刘颖杰同学作题为《Aggregate Keyword Search on Large Relational Databases》的论文阅读报告。
刘颖杰同学通过一个实例演示了什么是聚集关键词查询,然后给出了聚集关键词查询的查询公式Q=(D,C,W),并通过一颗树来演示了该公式的使用方法,最后通过分析采样算法来加深大家对公式的理解,由于时间问题,刘颖杰同学的报告将在下次继续补充。
林子雨老师团队第4次小组讨论会,将于8月10日(本周五)下午2点30分在科研2-303举行,欢迎感兴趣的老师和同学参加!
周五下午的讨论会可能会影响到其他在303房间同学的正常学习,提前告知,还请见谅!
林子雨老师团队的暑假活动主页:https://dblab.xmu.edu.cn/post/477/
会议时间:2012年8月10日(周五),下午2点30分
会议地点:厦门大学海韵园科研2号楼303
会议内容:
(1)赖明星同学做一篇论文汇报,讲解论文的相关背景知识和核心思想;
(2)刘颖杰同学做一篇论文汇报,讲解论文的相关背景知识和核心思想 ;
(3)讨论会过程中,林子雨老师将针对两位同学讲解的内容进行适当的点评以及内容上的拓展!
感谢数据库各位老师、同学的关注!
会议纪要:
数据库实验室林子雨老师小组第四次小组会议会议纪要
会议时间:2012年08月11日14时30分到17时30分
会议地点:厦门大学海韵园科研二号楼303室
与会者:林子雨、赖明星、刘颖杰、殷耀明
会议内容:
本次小组会议与前两次一样,还是由林子雨老师先对数据库领域前沿研究进行补充、介绍,然后由赖明星同学作论文阅读报告,赖明星同学本次介绍的论文题目是《A Log Buffer-Based Flash Translation Layer Using Fully Associative Sector Translation》,最后由刘颖杰同学对上次会议的论文报告进行补充。
- 林子雨老师作题为《数据库领域前沿研究调研报告》的报告
林子雨老师这次的补充大体上可以分为两块内容,一部分分析了研究基于闪存的DBMS的必要性,另一部分讲解了基于闪存的DBMS 的技术路线。
基于闪存的DBMS的必要性主要是分析闪存的特性和数据库索引的特性,其中闪存的特性有读写效率不对称,写前需要先擦除,擦除操作的代价比读操作高两个数量级,还有重要的一点就是闪存的擦除操作是有限制的,到达一定程度以后可能会不稳定,这就需要我们尽量减少擦除操作。数据库索引的特性就是数据的访问更随机,一次修改的数据量更小,很可能不足闪存的一页数据,无论从减少闪存的写操作还是提高闪存空间利用率考虑,都需要对数据库相关模块进行调整,使其更适合闪存存储。
基于闪存的DBMS的技术路线主要可以分为以下三种:
1. 对数据库相应模块进行,使其更适合闪存
2. 设计适用于数据库的FTL
3. 完全重新设计数据库,使其能充分利用闪存的优点
- 赖明星同学作题为《A Log Buffer-Based Flash Translation Layer Using Fully Associative Sector Translation》的论文阅读报告
赖明星同学此次的报告可以分为以下三部分。
首先是对著名的FTL映射模式BAST进行详细的介绍,分析它的缺点。通过具体实例的分析,讲解了BAST的运作过程,并且发现了BAST的两个缺点:块抖动和空间利用率不足。
随后作者根据BAST的缺点提出了自己的FTL映射模式FAST,FAST是Fully Associative Sector Translation 的缩写,意思是使用全关联的映射。FAST为了充分利用数据访问的连续性,将日志块分成顺序写日志块和随机写日志块,并通过实例分析讲解了何时将数据写到随机写日志块和顺序写日志块,并讲解了写的具体过程,作者还分析了FAST引入的全合并操作,全合并操作是最耗时的合并操作,因为我们选择擦除的日志块可能包含了不同数据块的数据,为了擦除选中的日志块,我们要合并所有相关的数据块。
最后作者从理论和实验上对BAST和FAST进行了比较,比较的焦点主要在擦除操作,因为擦除操作最耗时,如果我们能节省擦除的次数,就能够提高闪存的读写速度,还能提高闪存的寿命,通过分析,作者得出FAST较优的结果。
- 刘颖杰同学对题为《Aggregate Keyword Search on Large Relational Databases》的论文报告进行补充
刘颖杰同学此次的报告是上一次的补充,主要补充了如下内容:
- 详细分析了产生最小聚集匹配的《The fast maximum-join algorithm》算法。
通过实例讲解了算法的运行过程。
会议纪要:
数据库实验室林子雨老师小组第五次小组会议会议纪要
会议时间:2012年08月17日14时30分到18时00分
会议地点:厦门大学海韵园科研二号楼303室
与会者:林子雨、赖明星、刘颖杰、殷耀明、韩静
会议内容:
厦门大学计算机系数据库实验室林子雨老师小组第五次小组会议如期召开,会议首先由林子雨老师对数据库领域前沿知识进行补充、介绍,这次介绍的主题是《闪存扮演的不同角色》,随后由刘颖杰同学作题为《tank代码详解及java的io编程规范》的学习汇报,汇报详细介绍tank代码架构,然后通过简易记事本代码讲解java的io编程规范,最后由赖明星同学作题为《An efficient index buffer management scheme for implementing a B-tree on NAND flash memory》的论文阅读报告,本次报告共持续了三个半小时,下面是详细内容。
- 林子雨老师作题为《数据库领域前沿研究调研报告》的报告
林老师此次报告的副标题为《闪存扮演的不同角色》,此次报告主要分析了闪存在今后的可能的应用方向,并且通过多个实例讲解了闪存的应用。闪存的角色有如下几种:
- 直接替代硬盘,作为独立的存储系统
- 与硬盘并列构成混合的存储系统
将闪存与硬盘并列构成混合的存储系统主要是指将随机写集中的数据写入到硬盘中,将随机读集中的数据存储在闪存中,并通过相关算法来预测数据时随机写的还是线性写的,这种方法的关键就在于数据随机性的预测。
- 作为硬盘和内存之间的缓存
- 刘颖杰同学作题为《tank代码详解及java的io编程规范》的学习汇报
刘颖杰同学此次的报告包括三部分的内容:(1)Tank游戏的源代码分析(2)系统的设计原则(3)Java中的io编程规范,以下是详细内容。
- Tank游戏的源代码分析
刘颖杰同学对Tank游戏的源代码进行了详细分析,从不同方面进行了介绍,包括Tank的系统设计、详细设计和具体实现。
- 系统的设计原则
此次报告并没有对代码的设计原则进行详细介绍,仅对Tank中用到的部分原则进行了简单说明,其中报告:(1)分层原则(2)模块化原则(3)接口实现分离原则(4)细节隐藏原则(5)依赖倒置原则。
- Java 中的io编程规范
刘颖杰同学对Java中的io编程规范进行的详细讲解,并通过一个记事本实例对Java中不同的io编码方式进行了比较。在报告最后,韩静同学对此次进行了一点补充,补充的主要知识是Java中,需要手动实现窗口关闭按钮的相应事件。
- 赖明星同学作题为《An efficient index buffer management scheme for implementing a B-tree on NAND flash memory》的论文阅读报告
在此次会议的最后由明星同学作论文阅读报告,该报告的主要内容是分析如何在闪存上建立有效的B-Tree索引,此次报告共分析了两种在闪存上建立B-tree索引的方法,一种是BFTL,一种是IBSF,其中,后者是前者的改进。
- BFTL
BFTL 是建立在应用程序与闪存之间的一个中间层,由保留缓存区和地址转换表组成,保留缓冲区用于缓冲插入的索引单元,然后将若干索引单元写入同一页中,以此来减少空间的浪费,以及每次B-tree修改时的写操作次数。并且由于,一个节点的各个索引单元可能存在于不同的页中,为了快速的找到相应的页,在BFTL中间层上建立了一个地址转换表。
由于BFTL的内在特性,它有一些显著的缺点:(1)需要多次读操作来构造一个节点(2)地址转换表占用很多空间(3)存在无用的索引单元。基于以上缺点,论文提出了一种全新的方法,称为IBSF。
- IBSF
IBSF也是位于应用程序与闪存中的一个中间层,与BFTL不同的是,它只有一个索引缓冲区,索引缓冲区用于存储各个索引单元,索引单元反应了B-Tree的变动。并通过插入策略、删除策略和提交策略来管理索引缓冲区。IBSF与BFTL的显著区别在于IBSF将同一节点的不同单元存储于同一页中,当读取一个节点的时候只需要一次读操作,因为提高了效率。
在此报告最后,小组成员对此论文中存在的问题进行了热烈讨论,讨论的主要内容有索引缓冲区里的数据如何与闪存中的数据保持一致性,当出现断电等情况,能否恢复索引。
会议纪要:
数据库实验室林子雨老师小组第六次小组会议会议纪要
会议时间:2012年08月24日14时30分到17时30分
会议地点:厦门大学海韵园科研二号楼303室
与会者:林子雨、赖明星、刘颖杰、殷耀明、韩静
会议内容:
厦门大学计算机系数据库实验室林子雨老师小组第六次小组会议如期召开,会议首先由刘颖杰同学作题为《A Hidden Markov Model Approach to Keyword-Based Search over Relational Databases》的论文阅读报告,随后由赖明星同学作题为《Flashing Up the Storage Layer》的论文阅读报告,最后由林子雨老师作题为《数据库领域前沿研究调研报告》的报告,此次报告补充的主要内容是面向缓存的替换策略。下面是详细内容。
- 刘颖杰同学作题为《A Hidden Markov Model Approach to Keyword-Based Search over Relational Databases》的学习汇报
在此次会议中刘颖杰同学作论文阅读报告,该报告的主要内容是分析在无法获得数据库实例细节的情况下,如何利用有限的数据实现关系数据库上的关键词查询功能,此次报告探讨了通过隐式马尔科夫模型的架构,分析有序关键词序列得到SQL语句形式的解释并返回查询结果,同时利用HITS算法,根据返回结果的权威值进行排序的实现方式。
- 隐式马尔科夫模型(Hidden Markov Model)
隐马尔可夫模型(Hidden Markov models,HMM)是马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。所以,隐马尔可夫模型是一个双重随机过程,具有一定状态数的隐马尔可夫链和显示随机函数集。其中马尔科夫链描述了状态的转移, 一般用转移概率矩阵描述;而一般随机过程描述状态和观测序列间的关系,用观察概率矩阵描述。
在本例中,将用户输入的有序查询序列作为可观察到的向量,将关键词对应的数据库部件作为需要推测的输出,通过隐式马尔科夫模型中提出的推测方式,即transition概率和emission概率寻找最大可能的序列,从而得到所要的SQL语句。
- HITS算法
HITS算法常用于分析网页的重要性。
算法对返回的匹配页面计算两种值,一种是枢纽值(Hub Scores),另一种是权威值(Authority Scores)这两个值是相互依存、相互影响的。所谓枢纽值,指的是页面上所有导出链接指向页面的权威值之和。权威值指的是所有导入链接所在的页面的枢纽值之和。
本例中由于数据库模型中的表与网页有想通之处,即数据库中各个表也存在作为枢纽指向其他表以及本身内容的权威性两个性质,所以将HITS算法引入,以此对每张表的权威性做一个计算从而优化HMM模型中的相关数据。
- 赖明星同学作题为《 Flashing Up the Storage Layer》的论文阅读报告
赖明星同学此次的论文报告可以分为四个部分,先是开门见山的提出论文思想和解决的问题,其后对论文中解决相应问题的算法进行了详细分析,最后给出实验结果,具体内容如下:
- 论文思想
论文作者通过对闪存的读写操作和硬盘的读写操作进行比较分析发现,闪存虽然读操作非常快,但是它的随机写操作还不如硬盘。论文的主要思想就是将读密集的数据存储于闪存之中,将写密集的数据存储于硬盘当中,如此形成了闪存和硬盘位于存储结构同一层的存储方式。由于论文采用了闪存和硬盘共同作为第二存储设备,所以论文的关键就在于页的存放,如何判断页放置于闪存还是硬盘是论文的讨论重点。
- 页的存放
页的存放是指将页存放于闪存之中,还是存放于硬盘之中,并且根据之后的工作负载进行相应的调整,页的调整就是一个典型的双状态转移模型。论文提出的三种页的存放算法分别是:(1)保守算法(2)乐观算法(3)混合算法。其中,保守算法只考虑页的物理操作,对每一次的物理操作进行记录,当代价超过某一上限,就将其转移到另一种存储设备上,乐观算法只考虑页的逻辑操作,对页的读写操作进行计数,最后根据读写计数器,以及不同存储设备的读写代价判断将该页存储于那种存储设备。混合算法则是上面两种算法的结合,不仅考虑物理操作还考虑逻辑操作。
- 页的替换
页的替换用于管理缓冲,与传统的缓冲管理策略不同的是,论文中提出的缓冲管理策略不仅考虑到页的新旧(时间戳),还考虑了页的替换代价。其基本思想是将缓冲区分为按时间戳排序的时间区和按替换代价排序的代价区,每次新来一页都将该页插入到时间区,每次替换一页,都从代价区进行替换,在代价区进行替换的时候,按照代价的大小,从小到大进行替换。
- 实验结果
论文对这种闪存与硬盘共同作为第二存储的存储结构进行的广泛的实验,包括对使用硬盘、闪存和两者都使用的时间开销进行评估,以及对不同的页存放算法进行比较,最后讨论了时间区和代价区的分配比例。
- 林子雨老师作题为《数据库领域前沿研究调研报告》的报告
林老师此次报告的副标题为《面向缓存的替换策略》,此次报告详细介绍了基于闪存的存储结构中,面向缓存的替换策略,具体内容如下:
- 基于闪存存储结构中面向缓存的替换策略的考虑因素
- CFLRU 缓存替换策略
- CFDC 缓存替换策略
因为闪存的读写效率不一致,所以在基于闪存的存储结构中,缓存的替换策略不能像以前一样只考虑命中率,需要考虑缓存替换时,不同数据的替换代价。随后林老师介绍了一种缓存替换策略CFLRU,分析了CFLRU的缺点,并介绍了它的改进替换策略CFDC。
数据库实验室林子雨老师小组第七次小组会议会议纪要
会议时间:2012年08月31日14时30分到17时
会议地点:厦门大学海韵园科研二号楼303室
与会者:林子雨、赖明星、刘颖杰、殷耀明、韩静
会议内容:
厦门大学计算机系数据库实验室林子雨老师小组第七次小组会议如期召开,会议首先由赖明星同学作题为《AD-LRU: An efficient buffer replacement algorithm for flash-based databases》的论文阅读报告,随后由刘颖杰同学作题为《Keyword Search over Relational Databases: A Metadata Approach》的论文阅读报告,最后由对报告进行点评,并对两位同学接下来的工作进行了初步安排。下面是详细内容。
- 赖明星同学作题为《AD-LRU: An efficient buffer replacement algorithm for flash-based databases》的论文阅读报告
赖明星同学此次的报告的主要内容是介绍一种面向闪存数据库的缓存管理算法。首先介绍了闪存的特性,以及为何不能采用已有的面向硬盘的缓存管理算法,其次详细介绍了一种简单的面向闪存的缓存管理算法,即CF-LRU算法,通过详细分析CF-LRU的优缺点,找出了设计面向闪存数据库的缓存管理算法应该考虑的因素,然后详细介绍了论文的重点,即AD-LRU算法,最后分析了AD-LRU算法的性能,以及是否考虑到了相关因素,最后对两个算法进行了比较分析。
- CF-LRU算法
CF-LRU算法是第一个面向闪存的缓存管理算法,该算法基于LRU算法,但是考虑到了闪存的读写效率不一致的特性。CF-LRU算法的思想就是引入一个窗口,该窗口存放包括最旧的页在内的一部分较旧的页,典型的LRU算法替换最旧的页,而CF-LRU选择窗口中替换代价最小的页。
由于CF-LRU基于LRU,只是简单的考虑到闪存的读写效率不一致的特性,所以它也有LRU算法的缺点以及自身的一些局限性,包括(1)窗口大小很难适应所有的工作负载,需要动态调整(2)冷的脏页可能存在缓存中存在很久,降低了命中率(3)没有考虑访问频率。
- 设计面向闪存数据库的缓存管理算法需要考虑的因素
通过对CF-LRU算法的分析,可以归纳出一个优秀得面向闪存的管理算法应该考虑的因素,包括以下四部分(1)访问时间(2)访问频率(3)考虑闪存的读写不一致的特性(4)抗污染。
- AD-LRU算法
AD-LRU算法将缓存区分为两部分,即冷区和热区,冷区存放那些只引用过一次的页,热区存放那些引用过多次的页,在冷区和热区中分别LRU算法。并且冷区和热区的大小是动态调整的,当发生替换操作的时候,首先在冷区中做替换,如果冷区的大小达到一个系统预先设定的下届,则替换操作发生在热区。
- 刘颖杰同学作题为《Keyword Search over Relational Databases: A Metadata Approach》的论文阅读报告
刘颖杰同学在做论文阅读报告前还介绍了自己这周的学习情况,主要介绍了(1)linux系统的文件权限管理,特别是文件夹的读、写、执行权限的作用(2)操作系统的分区问题,包括boot引导区,主分区,逻辑分区以及它们各自的作用。
刘颖杰同学此次论文报告的主要内容是介绍如何使用Metadata方法来解决关系数据库中关键词查询问题。首先通过分析之前相关研究的缺陷,以及关键词查询的过程,提出了在数据库返回信息较少的情况下如果得出较好的查询结果,算法最后也是通过产生sql语句实现关键词查询技术。此次报告还重点介绍了基于关键词的数据库查询中,关键词与表名和属性之间相互影响,并通过计算“上下文影响”更新相应权重。
会议最后由林子雨老师做点评,并对两位同学接下来一段时间的学习进行的简单的规划。规划包括下周的论文翻译工作,本次活动结束时的成果展览,开学时的实验室大扫除,以及接下来一个月来明星同学的论文学习方向。
宣传海报:
会议纪要:
数据库实验室林子雨老师小组第八次小组会议会议纪要
会议时间:2012年09月07日15时00分到17时
会议地点:厦门大学海韵园科研二号楼303室
与会者:林子雨、赖明星、刘颖杰、殷耀明、韩静
会议纪要撰写:赖明星
会议内容:
厦门大学计算机系数据库实验室林子雨老师小组2012年暑假拼血奋战50天活动总结大会于2012年9月7日顺利召开,会议主要由林子雨老师、赖明星同学和刘颖杰同学展示活动成果、介绍活动心得。此外,赖明星同学和刘刘颖杰同学还展示了翻译的论文,并于展示期间介绍了翻译论文的心得。
赖明星同学的活动成果和和心得
赖明星同学的活动成果:
- 深入阅读了14篇论文,并作了笔记,为后续研究打下基础。
- 学习了版本控制软件Git的使用。
- 完成每周的会议纪要。
- 搭建了一个个人博客,并写了3篇编程相关的文章。
- 做了6次与闪存数据库相关的论文阅读报告及1次研究生一年级学习的学会汇报。
- 翻译了一篇论文,并对论文严格按照软件学报要求排版,为后续研究打下基础。
赖明星同学的活动心得:
- 如果没有林老师,没有林老师这样的行事风格,我们一定没有这么难忘的暑假
- 如果没有暑假拼血奋战50天活动,我一定看不了这么多论文
- 这个暑假除了学习以外还有两点收获:1. 每周的论文阅读报告,使得我的表达能力得到一定程度的提升 2. 会议纪要撰写能力大大提高,现在看自己第一次的会议纪要和最后一次的纪要,就像别人看到减肥前与减肥后的心情。
- 增进了师生友谊,在拼血奋战50天活动中,师生并肩作战,积极交流,相亲相爱,形如一家。
- 在拼血奋战50天活动中,共进行了3次娱乐活动,拍下照片无数。活动细节在官方网站详细记录,留存美好记忆,记录成长瞬间,以后需要学习林老师的这种做事风格。
赖明星同学的论文翻译心得:
- 写论文和读论文没有想象中难,很多事情当你真的去做了你才会发现,它根本没有你想象中那么难。
- 写作套路都差不多,很多论文写作套路都是在第一节介绍背景知识,第二节介绍相关工作,第三节介绍自己的算法,第四节进行实验分析,最后在第五节进行总结。
- 对于搞研究,编程能力也很重要,一个好的idea因为自身编程能力的原因,不能实现,是很遗憾的。
刘颖杰同学的活动成果和心得
刘颖杰同学的活动成果:
- 做了4次论文阅读报告和3次编程学习的报告
- 阅读了5篇关系数据库关键词查询方面的论文,阅读java相关书籍,并学习Servlet及Jsp编程,通过实例进行练习。
- 学习Linux,熟悉了Linux基本操作,对文件系统和磁盘划分有了较好的理解。
- 翻译了一篇论文,并对论文严格按照软件学报要求排版,为后续研究打下基础
- 撰写每周会议的宣传海报
刘颖杰同学的活动心得:
- 受林老师的影响,工作习惯有了可观的改变,工作观念不断向职业化靠拢,学习效率较活动开始之前有了不小的提高。这是本次活动最有意义也是最大的收获!
- Java方面,Linux方面都有了不小的进步,在实验室有着良好的学习环境能够让自己安心读书,一个多月下来感觉基础学习还是做得不错的。
- 虽然所看论文数量有限,但还是对于这一块有了一定的认识和了解,也能够找到自己感兴趣的地方,更好得规划研究生生活。
林子雨老师的活动成果和心得
林子雨老师的活动成果:
- 作了5次关于闪存数据库的论文调研报告。
- 阅读了大量闪存数据库的研究论文,撰写了5万字读书笔记,为后续研究打下基础。
- 制作了本科生课程《计算机导论之数据库篇》的教学PPT。
- 通过阅读多本相关教材,对研究生课程《分布式数据库》教学内容进行大量改版。
- 策划、组织并参与了团队多次活动,包括团队活动启动仪式,五缘湾休闲游、总结活动等。
- 制作维护团队暑假奋战活动网站。
- 因事假请假半天,其他时间全部在岗,无迟到、无早退。
林子雨老师的活动心得:
- 培养了学生多方面的能力。在50天时间里,师生三人发扬了刻苦拼搏的精神,并肩奋战,努力学习和工作,锻炼了学生多方面的能力,包括放弃暑假休息毅然投入学习的决心和毅力、长时期坚持出勤的良好习惯、阅读论文做报告的能力、撰写宣传海报和会议纪要的能力、规范行事的能力、团队协同工作的能力等等。
- 收获了知识:通过大量阅读文献,撰写读书笔记,听取报告,收获了大量新的知识。
- 增进了师生情谊。大家一起学习,一起娱乐,师生情谊与日俱增。
- 扩大了团队影响力。通过暑假奋战活动,让更多人了解了林子雨老师的团队,树立了良好的对外形象,团队影响力不断增加。
会议最后,大家一起浏览活动的官方网站,回顾活动中的点点滴滴,我们欣喜的看到,有四周时间,达到了无人请假、无人迟到、无人早退的全勤记录,网页的访问数量以及团队的影响力也与日剧增。
至此,我们的活动在在欢庆祥和的气氛中圆满落下帷幕。
(本会议纪要由赖明星同学撰写)
教师节卫生大扫除标志着本次奋战50天活动圆满落幕
数据库实验室2012年教师节卫生大扫除活动总结
时间:2012年09月10日上午9点到12点
地点:厦门大学海韵园科研二号楼303室
劳动参加者:林子雨、赖明星、刘颖杰、殷耀明、林维仲
活动总结撰写者:刘颖杰
2012年9月10日教师节一早,林子雨老师携带吸尘器早早得来到了实验室,在他的带动下,数据库实验室大扫除活动开始了。参与该次活动的有林维仲,赖明星,殷耀明,刘颖杰四位同学,他们各自分工,共同合作,在林老师的组织下,快速有序得对实验室进行清洁工作。
赖明星同学首先拿来水桶及抹布,打好水后,与刘颖杰、殷耀明同学开始擦拭机位桌面;随后,林子雨老师与刘颖杰同学共同清理了实验室摆放废旧电脑的角 落,将旧电脑摆放在暂时没有使用的机位上,将角落的柜子重新安置、摆放整齐,并将角落的灰尘清扫擦拭干净;在这期间实验室全体成员对暂时无人使用的柜子进 行了挨个检查清理,将可以回收的用具留下,将柜子中的东西清除,以便后来的同学使用方便。在机位清扫完毕后,大家共同将柜子暂时移出实验室,随后对地面进 行了清扫。林维仲同学、赖明星同学和殷耀明同学用扫把将较大的灰尘杂物扫除,然后刘颖杰同学、林维仲同学、殷耀明同学在林子雨老师的帮助下用吸尘器将实验 室地面不易扫起得灰尘清理掉,赖明星同学随后提来了水并用拖把将地面较脏的地方拖洗干净。最后,大家共同将柜子移回实验室并尽量按照序号摆放整齐。
活动从早上9:00一直持续到中午12:00,打扫结束后实验室的面貌焕然一新。东西摆放整齐后,实验室布局显得井井有条,空间也感觉顿时宽敞了很 多,这为大家提供了一个更好的学习工作环境!大家看到自己的劳动成果,虽然身体疲惫,但内心很有成就感,通过这次活动,也让实验室全体成员增强了保持实验 室环境卫生的意识,在今后的学习工作中大家会共同维护实验室的规章制度,营造良好的实验室氛围!当然,在打扫过程也发现了一些问题:原本每台桌椅都贴有编 号标签,但随着学生的使用,很多标签渐渐脱落了,这导致我们在打扫的过程中只能随机摆放部分桌椅等办公用具,如果柜子摆放混乱则将影响到部分同学的使用, 这一点我们将在今后采用新的方案进行预防。
总体上,本次活动完成顺利、效果显著,取得了令人满意的成功!
(撰写者:刘颖杰)
热烈庆祝本次奋战活动圆满成功,顺利落幕!