活动概况|进度表|签到表|出勤奖惩办法|动员书|启动仪式|娱乐休闲|活动开支|小组讨论会|每周总结和预告|相册
热烈庆祝本次活动圆满落下帷幕!
(扫一扫二维码,本网页支持手机模式访问)
2014年7月1日,厦门大学数据库实验室,“林子雨老师团队拼血奋战70天”正式拉开序幕……
时间跨度2个月11周累计73天,拼血苦战50个工作日;8人参与过活动, 4人全程参与,其中,1人全勤;举行10次小组讨论会,8人做过报告,生成10份会议纪要,12份 报告PPT;发布10份奋战活动总结与预告,50份奋战活动出勤通报;制作1个活动主页,设计1张活动海报;举行9次聚餐,1次熬夜看巴西世界杯决赛,1次集体看电影;开 展1次实验室卫生大扫除;召开1次活动动员大会,1次总结大会,颁发4枚奖章……这,就是我们的暑假奋战活动!
本次活动,形式独特,开展有序,执行有力,成果丰硕,锻炼了队伍,凝聚了力量,提升了能力。我们用实际行动证明了,这是一支能吃苦、能战斗的坚强团 队,一支满怀激情、勇往直前的拼搏团队,一支脚踏实地、求知若渴的学习团队,一支劳逸结合、欢声笑语的快乐团队,也是一支师生并肩、互励互勉的和谐团队。 我们把汗水洒在键盘缝隙间,我们把满腔心血倾注在科研楼,但是,我们时刻铭记铮铮誓言“流汗、流血、不流泪”。我们年轻,我们爱拼,我们师生共同写下一段 刻骨铭心的拼血奋战岁月!
2014年9月10日,暑假奋战活动圆满落下帷幕……活动的落幕却不是奋斗的终止,新学期悄然来临,同学们短暂休整后,再次斗志昂扬踏上新的征程……
——林子雨 2014年9月11日
周一 | 周二 | 周三 | 周四 | 周五 | 周六 | 周日 | |
第1周 | 7月1日 | 7月2日 | 7月3日 | 7月4日 | 7月5日 | 7月6日 | |
第2周 | 7月7日 | 7月8日 | 7月9日 | 7月10日 | 7月11日 | 7月12日 | 7月13日 |
第3周 | 7月14日 | 7月15日 | 7月16日 | 7月17日 | 7月18日 | 7月19日 | 7月20日 |
第4周 | 7月21日 | 7月22日 | 7月23日 | 7月24日 | 7月25日 | 7月26日 | 7月27日 |
第5周 | 7月28日 | 7月29日 | 7月30日 | 7月31日 | 8月1日 | 8月2日 | 8月3日 |
第6周 | 8月4日 | 8月5日 | 8月6日 | 8月7日 | 8月8日 | 8月9日 | 8月10日 |
第7周 | 8月11日 | 8月12日 | 8月13日 | 8月14日 | 8月15日 | 8月16日 | 8月17日 |
第8周 | 8月18日 | 8月19日 | 8月20日 | 8月21日 | 8月22日 | 8月23日 | 8月24日 |
第9周 | 8月25日 | 8月26日 | 8月27日 | 8月28日 | 8月29日 | 8月30日 | 8月31日 |
第10周 | 9月1日 | 9月2日 | 9月3日 | 9月4日 | 9月5日 | 9月6日 | 9月7日 |
第11周 | 9月8日 | 9月9日 | 9月10日 |
日期 | 蔡珉星 | 李雨倩 | 谢荣东 |
罗道文 | 备注 | ||||
上午 | 下午 | 上午 | 下午 | 上午 | 下午 | 上午 | 下午 | ||
7月1日(周二) | |||||||||
7月2日(周三) | |||||||||
7月3日(周四) | 回家 | 回家 | 接待 | 接待 | |||||
7月4日(周五) | 回家 | 回家 | |||||||
7月5日(周六) | 回家 | 回家 | 讨论会,聚餐,看世界杯 | ||||||
7月6日(周日) | 休息 | 休息 | 休息 | 休息 | 回家 | 回家 | 休息 | 休息 | 休息 |
7月7日(周一) | 休息 | 休息 | 休息 | 休息 | 回家 | 回家 | 休息 | 休息 | 休息 |
7月8日(周二) | 回家 | 回家 | |||||||
7月9日(周三) | 回家 | 回家 | |||||||
7月10日(周四) | 回家 | 回家 | |||||||
7月11日(周五) | 回家 | 回家 | |||||||
7月12日(周六) | 回家 | 回家 | 讨论会 | ||||||
7月13日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
7月14日(周一) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
7月15日(周二) | |||||||||
7月16日(周三) | |||||||||
7月17日(周四) | |||||||||
7月18日(周五) | |||||||||
7月19日(周六) | 探亲 | 探亲 | 讨论会 | ||||||
7月20日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
7月21日(周一) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 |
7月22日(周二) | 回家 | 回家 | |||||||
7月23日(周三) | 回家 | 回家 | |||||||
7月24日(周四) | 回家 | 回家 | |||||||
7月25日(周五) | |||||||||
7月26日(周六) | |||||||||
7月27日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
7月28日(周一) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
7月29日(周二) | |||||||||
7月30日(周三) | |||||||||
7月31日(周四) | |||||||||
8月1日(周五) | |||||||||
8月2日(周六) | |||||||||
8月3日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
8月4日(周一) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
8月5日(周二) | |||||||||
8月6日(周三) | |||||||||
8月7日(周四) | |||||||||
8月8日(周五) | 罗道文按时出勤但忘记签到算迟到 | ||||||||
8月9日(周六) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
8月10日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
8月11日(周一) | |||||||||
8月12日(周二) | 接待 | 接待 | 谢荣东有同学来厦门要接待 | ||||||
8月13日(周三) | |||||||||
8月14日(周四) | |||||||||
8月15日(周五) | |||||||||
8月16日(周六) | |||||||||
8月17日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
8月18日(周一) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
8月19日(周二) | |||||||||
8月20日(周三) | |||||||||
8月21日(周四) | |||||||||
8月22日(周五) | |||||||||
8月23日(周六) | |||||||||
8月24日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
8月25日(周一) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
8月26日(周二) | 回家 | 回家 | 罗道文请假回家 | ||||||
8月27日(周三) | 回家 | 回家 | |||||||
8月28日(周四) | 回家 | 回家 | |||||||
8月29日(周五) | 回家 | 回家 | |||||||
8月30日(周六) | 回家 | 回家 | |||||||
8月31日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
9月1日(周一) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | |
9月2日(周二) | |||||||||
9月3日(周三) | |||||||||
9月4日(周四) | |||||||||
9月5日(周五) | |||||||||
9月6日(周六) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 中秋节三天放假 |
9月7日(周日) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 中秋节三天放假 |
9月8日(周一) | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 休息 | 今天是中秋节 |
奋战活动结束 | 结束 | 结束 | 结束 | 结束 | 结束 | 结束 | 结束 | 结束 | 奋战活动结束 |
奋战第1周总结和下周活动预告 |
各位同学好!
我们顺利完成了第1周的奋战活动,第1周总结如下:
(1)工作:7月5日下午举行了小组讨论会,蔡珉星、李雨倩同学完成了综合考试,两位同学认真制作了综合考试PPT并进行了精彩的讲解,让每个人都受益匪浅,向两位同学表示感谢!李雨倩同学撰写了会议纪要。
(2) 娱乐活动:7月5日,林子雨老师和叶林宝、蔡珉星、李雨倩、罗道文同学到厦大学生公寓大排档聚餐,吃水煮活鱼;7月6日凌晨,林子雨老师和叶林宝、蔡珉 星、罗道文同学一起在实验室观看了巴西世界杯足球比赛直播,实验室宽带网络、高清投影仪、央视付费高清服务,三者很给力,让大家感受到了不一样的实验室生 活,不一样的世界杯观战体验。
(3)出勤:蔡珉星、李雨倩全勤,谢荣东请假3天,罗道文请假1天。
第2周的奋战活动计划安排内容如下:
(1)蔡珉星学习MapReduce编程实践;李雨倩学习如何用Mapreduce实现数据库中的连接(join)操作。
(2)7月12日周六上午9点举行小组讨论会,蔡珉星做一个关于MapReduce编程实践的报告,李雨倩做一个关于如何用Mapreduce实现数据库中的连接(join)操作的报告。
|
奋战第2周总结和下周活动预告 |
各位同学好!
我们顺利完成了第2周的奋战活动,第2周总结如下:
(1)工作:7月12日上午举行了小组讨论会,蔡珉星同学做了题为《MapReduce编程简介》的报告,李雨倩同学做了题为《MapReduce连接》的报告,从这周开始,两位同学正式开始进入论文研究阶段,要在暑假完成大量学术资料阅读工作!蔡珉星同学撰写了会议纪要。
(2)娱乐活动:本周没有开展娱乐活动。
(3)出勤:蔡珉星、李雨倩、罗道文全勤,谢荣东请假5天。
第3周的奋战活动计划安排内容如下:
(1)蔡珉星学习MapReduce编程实践和MapReduce连接算法方面的论文;李雨倩学习如何用Mapreduce实现数据库中的连接(join)操作。
(2)7月19日周六上午9点举行小组讨论会,叶林宝同学做一个自选主题报告,蔡珉星做一个关于MapReduce连接算法优化论文的报告,李雨倩做一个关于如何用Mapreduce实现排序操作的报告。
|
奋战第3周总结和下周活动预告 |
各位同学好!
我们顺利完成了第3周的奋战活动,第3周总结如下:
(1)工作:7月19日上午举行了小组讨论会,蔡珉星同学做了题为《分布式数据仓库查询优化》的报告,李雨倩同学就上次《MapReduce连接》的报告做了题为《MapReduce排序》的补充报告,叶林宝同学做了题为《域名解析》的报告,李雨倩同学撰写了会议纪要。
(2)娱乐活动:7月19日周六中午到厦大西村麻辣物语举行聚餐活动,活动支出239元。
(3)出勤:蔡珉星、李雨倩、谢荣东全勤,罗道文7月19日请假1天。
第4周的奋战活动计划安排内容如下:
(1)2014年7月26日周六上午,开小组讨论会,李雨倩做论文讲解报告,1.5小时左右。
(2)2014年7月26日周六上午,开小组讨论会,谢荣东做编程方面的报告,1小时左右。
|
奋战第4周总结和下周活动预告 |
各位同学好!
我们顺利完成了第4周的奋战活动,第4周总结如下:
(1)工作:7月26日下午举行了小组讨论会,林子雨老师介绍了2014厦门大学“晋情溢厦”暑期社会实践队在晋江的实习活动情况,李雨倩同学做了题为《MapReduce连接优化》的报告,谢荣东同学做了题为《JAVA多线程编程演示》的报告,蔡珉星同学撰写了会议纪要。
(2)娱乐活动:7月26日周六傍晚到厦大学生公寓大排档举行聚餐活动,活动支出230元。
(3)出勤:李雨倩、谢荣东、罗道文全勤,蔡珉星7月22日、23日和24日共请假3天。
第5周的奋战活动计划安排内容如下:
(1)2014年8月2日周六下午3点,开小组讨论会,蔡珉星做论文讲解报告,1.5小时左右。
(2)2014年8月2日周六下午3点,开小组讨论会,罗道文做编程方面的报告,1小时左右。
特别指出:以后组会调整到周六下午3点举行,因为,如果放在上午举行,大家就会觉得一天工作就要结束了,下午就会没有什么学习效率,为了充分利用时间,以后下午开会。
|
奋战第5周总结和下周活动预告 |
各位同学好!
我们顺利完成了第5周的奋战活动,第5周总结如下:
(1)工作:8月2日下午举行了小组讨论会,罗道文同学做了题为《B+树索引和MySQL数据库索引》的报告,蔡民星做了题为《Partition类和布隆过滤器》的报告,李雨倩同学撰写了会议纪要。
(2)娱乐活动:8月2日周六傍晚到厦大学生公寓五满堂面馆举行聚餐活动,活动支出104元。
(3)出勤:蔡珉星、李雨倩、谢荣东、罗道文全勤,蔡珉星忘记签到一次。
第6周的奋战活动计划安排内容如下:
(1)2014年8月9日周六下午3点,开小组讨论会,李雨倩做论文讲解报告,1.5小时左右。
(2)2014年8月9日周六下午3点,开小组讨论会,谢荣东做自选主题报告,1.5小时左右。
|
奋战第6周总结和下周活动预告 |
各位同学好!
我们顺利完成了第6周的奋战活动,第6周总结如下:
(1)工作:8月12日(周二)上午补充举行了第6周的小组讨论会(第6周周六8月9日老师有事情无法回厦门),李雨倩同学做了题为《MapReduce连接优化》的报告,马驰同学做了题为《Machine Learning》的报告,蔡珉星同学撰写了会议纪要。
(2)娱乐活动:本周没有娱乐活动。
(3)出勤:蔡珉星、李雨倩、谢荣东全勤,罗道文忘记签到一次,算作迟到,按照规定接受迟到处罚。
第7周的奋战活动计划安排内容如下:
(1)2014年8月16日周六下午3点,开小组讨论会,蔡珉星做论文讲解报告,1.5小时左右。
(2)2014年8月16日周六下午3点,开小组讨论会,曾聪做关于HBase数据库的主题报告,1.5小时左右。
|
奋战第7周总结和下周活动预告 |
各位同学好!
我们顺利完成了第7周的奋战活动,第7周总结如下:
(1)工作:8月16日下午5点20分和晚上8点10分举行了小组讨论会,曾聪同学做了题为《HBase简介》的报告,蔡珉星同学做了题为《-数据倾斜情况下基于MapReduce的join算法优化》的报告,李雨倩同学撰写了会议纪要。
(2)娱乐活动:8月16日周六傍晚到厦大学生公寓大排档举行聚餐活动,活动支出240元。
(3)出勤:蔡珉星、李雨倩、罗道文全勤,谢荣东8月12日(周二)请假一天。
第8周的奋战活动计划安排内容如下:
(1)2014年8月23日周六下午3点,开小组讨论会,李雨倩做论文讲解报告,1.5小时左右。
(2)2014年8月23日周六下午3点,开小组讨论会,叶林宝做自选主题报告,1.5小时左右。
|
奋战第8周总结和下周活动预告 |
各位同学好!
我们顺利完成了第8周的奋战活动,第9周总结如下:
(1)工作:这周由于林子雨老师有事情周末无法回厦门,没有举行小组讨论会,讨论会内容会放在第9周补。
(2)娱乐活动:无。
(3)出勤:蔡珉星、李雨倩、谢荣东和罗道文全勤。
第9周的奋战活动计划安排内容如下:
这个周六(8月30日)会上午和下午都开讨论会,主要是为了弥补第8周的报告。
(1)2014年8月30日周六上午9点,开小组讨论会,李雨倩做论文讲解报告,1.5小时左右。
(2)2014年8月30日周六上午9点,开小组讨论会,谢荣东做自选主题报告,1小时左右。
(3)2014年8月30日周六下午3点,开小组讨论会,蔡珉星做论文讲解报告,1.5小时左右。
注:第9周,罗道文同学请假一周。
|
奋战第9周总结和第10周活动预告 |
各位同学好!
我们顺利完成了第9周的奋战活动,第9周总结如下:
(1)工作:2014年8月30日(星期六)上午9点到11点,林子雨老师团队举行本学期第9次小组讨论会。蔡珉星同学做了题为《skew join相关论文》的报告,谢荣东同学做了题为《Android手机开发》的报告,蔡珉星同学撰写了会议纪要。
(2)娱乐活动:2014年8月30日(星期六)上午讨论会结束后,师生(林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、曾聪)到厦大学生公寓大排档聚餐。
(3)出勤:蔡珉星、李雨倩、谢荣东全勤,罗道文同学本周请假一周。
第10周和11周的奋战活动计划安排内容如下:
(1)第10周不开组会:由于正好是遇到中秋节放假,因此,9月6日(周六)、9月7日(周日)和9月8日(周一),放假三天。不开组会。9月5日(周五)最后一天签到奋战,请大家坚持工作到9月5日下午5点。9月6日开始不用签到,奋战所有工作日结束。
(2)第11周:奋战工作日已经全部结束,第11周不用签到。我们将在第11周周六(9月13日)上午9点举行奋战活动总结大会并进行卫生大扫除,下午和晚上集体娱乐活动。在9月13日上午9点举行的奋战活动总结大会上,蔡珉星、李雨倩、谢荣东、罗道文都要制作PPT介绍自己的奋战活动战果和活动感受,请大家提前做好准备。
|
总结大会预告 |
各位同学好!
本周六(9月13日)上午9点举行2014暑假奋战活动总结大会+大扫除,请各位同学参加。具体安排如下:
(一)上午9点召开奋战活动总结大会
(1)林子雨老师开场白;
(2)蔡珉星、李雨倩、谢荣东、罗道文同学依次做总结报告(需要PPT),介绍自己的奋战成果和心得感受;
(3)林子雨老师给同学颁奖,授予刘颖杰同学“实验室勇士荣誉勋章”、授予叶林宝同学“优秀科研荣誉勋章”、授予蔡珉星同学“优秀报告荣誉勋章”、授予李雨倩同学“2014暑假奋战荣誉勋章”;
(4)林子雨老师发表总结讲话。
(二)实验室卫生大扫除
林子雨老师携带吸尘器,和同学们一起对实验室卫生进行彻底清扫,迎接新学期。
(三)到中华城越城记吃鱼锅,庆祝李雨倩同学获得“2014暑假奋战荣誉勋章”。
|
2014年7月6日凌晨师生共看巴西世界杯 | 2014年7月6日凌晨师生共看巴西世界杯 |
2014年9月12日万达广场看电影《不怕飓风》 | 2014年7月19日厦大西村“麻辣物语”聚餐 |
2014年9月13日中山路中华城“战锅演义”聚餐 | 2014年8月2日晚上厦大学生公寓五满堂面馆 |
序号 | 活动内容 | 参加人员 | 时间地点 | 花销 |
1 | 活动启动仪式午餐“越城记鱼锅” | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文 | 2014年6月28日中午厦门中山路中华城五楼越城记 | 250元 |
2 | 师生聚餐庆祝奋战第一周顺利结束 | 林子雨、叶林宝、蔡珉星、李雨倩、罗道文 | 2014年7月5日晚上厦大学生公寓大排档 | 150元 |
3 | 师生共看巴西世界杯足球比赛 | 林子雨、叶林宝、蔡珉星、罗道文 | 2014年7月6日凌晨厦大数据库实验室 | 100元 |
4 | 师生聚餐 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东 | 2014年7月19日中午厦大西村“麻辣物语” | 250元 |
5 | 师生聚餐 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、曾聪 | 2014年7月26日晚上厦大学生公寓大排档 | 230元 |
6 | 师生聚餐 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、曾聪 | 2014年8月2日晚上厦大学生公寓五满堂面馆 | 104元 |
7 | 师生聚餐 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、曾聪、马驰 | 2014年8月16日晚上厦大学生公寓大排档 | 240元 |
8 | 师生聚餐 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、曾聪 | 2014年8月30日中午厦大学生公寓大排档 | 230元 |
9 | 看电影《不惧风暴》 | 林子雨、蔡珉星、李雨倩、谢荣东、罗道文 | 2014年9月12日晚上厦门湖里万达广场 | 300元 |
10 | 师生聚餐 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文 | 2014年9月13日厦门中山路中华城“战锅演义” | 358元 |
林子雨老师团队2014年暑假拼血奋战70天活动
小组讨论会安排表
奋战第几周 | 日期 | 汇报人 | 汇报内容 | 备注 |
第1周 | 2014年7月5日周六 | 蔡珉星 | 综合考试报告 | 1小时 |
2014年7月5日周六 | 李雨倩 | 综合考试报告 | 1小时 | |
2014年7月5日周六 | 谢荣东 | 学习计划和指标汇报 | 5分钟 | |
2014年7月5日周六 | 罗道文 | 学习计划和指标汇报 | 5分钟 | |
第2周 | 2014年7月12日周六 | 李雨倩 | 论文讲解汇报 | 1.5小时 |
2014年7月12日周六 | 蔡珉星 | MapReduce编程专题报告 | 1.5小时 | |
第3周 | 2014年7月19日周六 | 蔡珉星 | 论文讲解汇报 | 1.5小时 |
2014年7月19日周六 | 叶林宝 | 自选主题报告 | 1小时 | |
第4周 | 2014年7月26日周六 | 李雨倩 | 论文讲解汇报 | 1.5小时 |
2014年7月26日周六 | 谢荣东 | 编程方面的专题报告 | 1小时 | |
第5周 | 2014年8月2日周六 | 蔡珉星 | 论文讲解汇报 | 1.5小时 |
2014年8月2日周六 | 罗道文 | 编程方面的专题报告 | 1小时 | |
第6周 | 2014年8月9日周六 | 李雨倩 | 论文讲解汇报 | 1.5小时 |
2014年8月9日周六 | 谢荣东 | 自选主题报告 | 1小时 | |
第7周 | 2014年8月16日周六 | 蔡珉星 | 论文讲解报告 | 1.5小时 |
2014年8月16日周六 | 曾聪 | HBase数据库 | 1.5小时 | |
第8周 | 2014年8月23日周六 | 李雨倩 | 论文讲解报告 | 1.5小时 |
2014年8月23日周六 | 叶林宝 | 自选主题报告 | 1小时 | |
第9周 | 2014年8月30日周六 | 蔡珉星 | 论文讲解报告 | 1.5小时 |
2014年8月30日周六 | 罗道文 | 自选主题报告 | 1小时 |
次数 | 时间 | 参加者 | 内容 | 备注 |
1 | 2014年6月28日上午9点到11点30分 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文 | 林子雨老师做2014年暑假奋战70天活动动员讲话 | 查看会议纪要 |
2 | 2014年7月5日周六下午3点到5点40分 | 林子雨、叶林宝、蔡珉星、李雨倩、罗道文 | 蔡珉星、李雨倩综合考试 | 查看会议纪要 |
3 | 2014年7月12日周六上午9点到12点 | 林子雨、叶林宝、蔡珉星、李雨倩、罗道文、曾聪 | 蔡珉星同学做了题为《MapReduce编程简介》的报告,李雨倩同学做了题为《MapReduce连接》的报告 | 查看会议纪要 |
4 | 2014年7月19日周六上午9点到12点 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、曾聪 | 蔡珉星同学做了题为《分布式数据仓库查询优化》的报告,李雨倩同学就上次《MapReduce连接》的报告做了题为《MapReduce排序》的补充报告,叶林宝同学做了题为《域名解析》的报告 | 查看会议纪要 |
5 | 2014年7月26日周六下午3点到5点30分 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、曾聪 | 林子雨老师介绍了2014厦门大学“晋情溢厦”暑期社会实践队在晋江的实习活动情况,李雨倩同学做了题为《MapReduce连接优化》的报告,谢荣东同学做了题为《JAVA多线程编程演示》的报告 | 查看会议纪要 |
6 | 2014年8月2日周六下午3点到5点30分 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、曾聪 | 罗道文同学做了题为《B+树索引和MySQL数据库索引》的报告,蔡珉星做了题为《Partition类和布隆过滤器》的报告。讨论会结束后,师生到厦大学生公寓五满堂面馆聚餐 | 查看会议纪要 |
7 | 2014年8月12日周二上午9点到11点30分 | 林子雨、叶林宝、蔡珉星、李雨倩、罗道文、马驰 | 李雨倩同学做了题为《MapReduce 连接优化》的报告,马驰做了题为《Machine Learning》的报告 | 查看会议纪要 |
8 | 2014年8月16日周六下午5点20分到6点30分(上半场),晚上8点10分到9点20分(下半场) | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、曾聪、马驰 | 曾聪同学做了题为《HBase简介》的报告,蔡珉星同学做了题为《-数据倾斜情况下基于MapReduce的join算法优化》的报告。讨论会上半场结束后,师生到厦大学生公寓大排档举行聚餐,然后回到实验室继续举行下半场讨论会 | 查看会议纪要 |
9 | 2014年8月30日周六上午9点到11点 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、曾聪 | 蔡珉星同学做了题为《skew join相关论文》的报告,谢荣东同学做了题为《Android手机开发》的报告。讨论会结束后,师生到厦大学生公寓五满堂面馆聚餐 | 查看会议纪要 |
10 | 2014年9月13日周六上午9点到10点40分 | 林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、曾聪 | 总结奋战成果,对相关同学进行表彰 | 查看会议纪要 |
热烈庆祝蔡珉星同学获得“优秀报告荣誉勋章”(奖金200元)
颁奖词:蔡珉星,男,厦门大学计算机科学系2013级硕士研究生,指导老师林子雨。该同学在2014年7月到9月的”林子雨老师团队2014暑假拼 血奋战70天活动“中也做了多次精彩的报告,为了表彰蔡珉星同学,特此颁发“优秀报告荣誉勋章”一枚,希望蔡珉星同学再接再厉,不断取得新的成绩!
讨论会预告和会议纪要
第1次小组会议 | 会议纪要:数据库实验室林子雨老师小组2014年暑假第一次小组会议
会议时间:2014年6月28日上午9点到11点30分
会议地点:厦门大学海韵园科研二号楼303室
与会者:林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文
会议纪要撰写:林子雨
会议内容:
2014 年6月28日(周六)上午9点到11点,厦门大学数据库实验室林子雨老师团队2014年暑假拼血奋战70天动员大会,在厦门大学海韵园科研2号楼 303举行。动员会上,林子雨老师向参加本次奋战活动的同学介绍了活动计划、内容安排和相关注意事项,要求同学们充分利用好宝贵的暑假时间,合理紧凑安排 学习计划,力争在专业知识和编程功底上有较大幅度提升,确保本次活动的顺利完成。 会议明确了下周小组讨论会工作安排:(1)蔡珉星和李雨倩同学做综合考试报告;(2)谢荣东和罗道文介绍下一阶段工作计划。 动员会结束后,师生6人前往厦门中山路中华城举行了启动仪式聚餐活动。从 今天开始到9月10日,林子雨老师团队为期70天的暑假奋战活动正式拉开序幕。 |
第2次小组会议 | 讨论会预告:
大家好!
周六上午老师有事情,所以,只能定在下午。
林子雨老师团队2014年暑假拼血奋战70天第2次小组讨论会
时间地点:2014年7月5日周六下午3点,科研2-303
参加人员:林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文
内容安排:(1)蔡珉星、李雨倩两位同学做综合考试报告;(2)谢荣东、罗道文两位同学做下一阶段学习计划介绍(最好和蔡珉星一样,利用暑假时间集中学习MapReduce分布式编程);
请蔡珉星、李雨倩、谢荣东、罗道文四位同学做好准备!
综合考试预告:
主题:蔡珉星和李雨倩同学进行综合考试报告 地点:厦门大学数据库实验室科研2-303 所谓“综合考试”,并非是一次传统意义的笔试,而是一次针对个人过去一年工作的总结和汇报。通过综合考试,学生需要让老师了解:
(1)不同课程的学习收获和效果,可以单独分列出每门课程,给出课程名称、主讲教师、对教师的评价(对林子雨老师不做评价)、课程主要内容、自己学习课程的收获、自己对课程的意见。
(2)在研究生一年级的学习阶段,学生进行了哪些方面的课外知识的学习,需要进行系统归类,介绍每类知识的主题、知识核心内容、参考书籍、自己的学习目的和自己的收获。
(3)通过前一阶段的学习,自己的优势和长处在哪里?自己的弱项在哪里?
(4)对过去一年,给予自己一个总体评价,以及对自己未来的简单规划,包括事业规划和学习规划。
要求:
(1)制作一个PPT,内容原则上不少于30页,PPT首页封面必须加上我们奋战的宣传LOGO(在奋战活动主页有图片);
(2)给林子雨老师和其他同学汇报,每个人汇报时间在1小时左右;
请即日开始准备PPT,制作完成以后发送给我。这种汇报,会让你们从中受益,请一定认真准备。
谢荣东、罗道文制定学习计划和指标:
谢荣东,罗道文:
本周六(7月5日)下午3点,请你们汇报暑假奋战学习计划和指标(指标就是明确自己要投入多少时间,完成多少任务,达到什么效果),每个人制作一个简单的PPT,老师会存档,9月10日奋战活动结束的时候,会验收!
建议你们把暑假学习重点放在MapReduce分布式编程,蔡珉星会搭建环境,大家一起学习交流,效率会比较高。
另外,暑假期间,会让你们阅读一些英文论文,给大家做论文汇报,你们可以提前准备一下,你们可以看关系数据库的关键词查询论文或者基于XML文档的关键词查询等方面的论文。
暑假奋战活动是很认真严肃的,一定要严格约束和要求自己,有事情不能到实验室时,一定要提前请假。
会议纪要:
林子雨老师团队2014年暑假拼血奋战70天活动第2次小组讨论会会议纪要 会议时间:2014年7月5日周六下午3点到5点40分 会议地点:厦门大学海韵园科研二号楼303室 与会者:林子雨、叶林宝、蔡珉星、李雨倩、罗道文 会议纪要撰写:李雨倩 蔡珉星、李雨倩两位同学做综合考试报告。活动结束后,师生一起到厦大学生公寓大排档举行聚餐活动。 以下为会议主要内容: (1) 课程分析:对研一学期所有课程内容、学习收获和效果进行了总结,并对授课老师进行了评价; (2) 课外学习:系统介绍了研一学期学习的课外知识、参考书籍、学习心得及自己的收获; (3) 自我评价:通过研一学期的学习,总结了自己的优势和不足。 (4) 未来规划:通过对自己优势及不足的分析,对自己未来的学习及工作进行了规划。 (5) 老师点评:林子雨老师就两位同学所做汇报进行了精彩点评,并对两位同学过去一年的努力进行肯定,并希望所有同学在未来的学习中更加努力。
|
第3次小组会议 | 会议纪要:
林子雨老师团队2014年暑假拼血奋战70天活动第3次小组讨论会会议纪要 会议时间:2014年7月12日周六上午9点到12点 会议地点:厦门大学海韵园科研二号楼303室 与会者:林子雨、叶林宝、蔡珉星、李雨倩、罗道文、曾聪 会议纪要撰写:蔡珉星 蔡珉星同学做了题为《MapReduce编程简介》的报告,李雨倩同学做了题为《MapReduce连接》的报告,以下为会议的主要内容:
(1) 蔡珉星同学的报告《MapReduce编程简介》首先介绍了Hadoop、MapReduce的背景知识,接着介绍了MapReduce的编程思想–以 分而治之的方式来处理大数据计算任务,并介绍了MapReduce的两个抽象编程接口Map(映射)和Reduce(规约)。然后以三个实例:单词统计、 提取最高气温、文档倒排索引,结合代码与运行过程,详细的介绍了如何编程实现MapReduce。
(2) 李雨倩同学的报告《MapReduce连接》介绍的是如何使用MapReduce来实现数据库中的连接(join)操作,首先简要的回顾了数据库中连接的 概念,接着介绍了MapReduce中的三种连接策略:重分区连接、复制连接、半连接。其中重分区连接是在Reduce端进行连接的,适用于连接两个或多 个大型数据集;复制连接和半连接是在Map端进行连接的,复制连接适用于待连接的数据集中有一个数据集小到可以完全放在缓存中,半连接则适用于虽然有一个 数据集非常大,但这个数据集可以通过过滤后,小到可以放在缓存中的情景。报告结合代码讲解了这三种策略的不同,并分析了其各自的适用场景。
|
第4次小组会 |
林子雨老师团队2014年暑假拼血奋战70天活动第4次小组讨论会会议纪要 会议时间:2014年7月19日周六上午9点到12点 会议地点:厦门大学海韵园科研二号楼303室 与会者:林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、曾聪 会议纪要撰写:李雨倩 2014年7月19日(星期六)上午9点到12点,林子雨老师团队举行本学期第4次小组讨论会。蔡珉星同学做了题为《分布式数据仓库查询优化》的报告,李雨倩同学就上次《MapReduce连接》的报告做了题为《MapReduce排序》的补充报告,叶林宝同学做了题为 《域名解析》的报告以下为会议的主要内容: (1) 蔡珉星同学的报告《基于统计方法的分布式数据仓库查询优化的设计与实现》首先介绍了数据偏斜问题,接着介绍了具体查询优化,包括group by查询优化与join查询优化,最后介绍了系统的设计与实现。 (2)李雨倩同学就上次报告《MapReduce连接》做了补充报告《MapReduce排序》。就连接策略之一的重分区连接中有关排序问题进行了分析。 (3)叶林宝同学的报告《域名解析》介绍了DNS、CDN相关知识。具体内容分为以下三部分:DNS以及域名解析的基本概念、CDN原理、域名解析的相关工具。 |
第5次小组会议 |
林子雨老师团队2014年暑假拼血奋战70天活动第5次小组讨论会会议纪要 会议时间:2014年7月26日周六下午3点到5点30分 会议地点:厦门大学海韵园科研二号楼303室 与会者:林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、曾聪 会议纪要撰写:蔡珉星 会议报告PPT下载:请到本文附件中下载报告PPT。 2014年7月26日(星期六)下午3点到5点30分,林子雨老师团队举行本学期第5次小组讨论会。林子雨老师介绍了2014厦门大学“晋情溢厦” 暑期社会实践队在晋江的实习活动情况,李雨倩同学做了题为《MapReduce连接优化》的报告,谢荣东同学做了题为《JAVA多线程编程演示》的报告。 讨论会结束后,师生到厦大学生公寓大排档举行聚餐活动。以下为详细内容: (1)李雨倩同学的报告《MapReduce连接优化》介绍了基于传统MapReduce的连接算法,代表技术有标准重分区算法、改进的标准重 分区算法、广播算法、半连接算法、分片半连接算法,接着还介绍了非等值连接算法、相似度连接算法,主要是介绍了这些算法的主要思想以及优势。
(2)谢荣东同学的报告《JAVA多线程编程演示》首先介绍了进程和线程的基本概念,接着介绍了JAVA中进程和线程的操作,其中创建多线程主 要是通过继承Thread类或实现Runnable接口来实现的,并结合火车票售票窗口的实例进行讲解。最后,谢荣东同学为我们展示了他这两周学习 JAVA的成果–坦克大战程序。
|
第6次小组会议 |
林子雨老师团队2014年暑假拼血奋战70天活动第6次小组讨论会会议纪要 会议时间:2014年8月2日周六下午3点到5点30分 会议地点:厦门大学海韵园科研二号楼303室 与会者:林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、曾聪 会议纪要撰写:李雨倩 会议报告PPT下载:请到本文附件中下载报告PPT。 2014年8月2日(星期六)下午3点到5点30分,林子雨老师团队举行本学期第6次小组讨论会。罗道文同学做了题为《B+树索引和MySQL数据 库索引》的报告,蔡珉星做了题为《Partition类和布隆过滤器》的报告。讨论会结束后,师生到厦大学生公寓五满堂面馆聚餐。以下为详细内容: (1)罗道文同学的报告《B+树索引和MySQL数据库索引》首先介绍了B树以及B+树的特点及原理,并模拟分析了B树查询、插入与删除过程,阐述 了两者的主要区别。然后介绍了MySQL存储引擎MyISAM和InnoDB的B+树索引,内容包括两者的主键索引和辅助索引的具体实现及区别。 (2)蔡珉星同学的报告《Partition类和布隆过滤器》首先结合前几周讲的重分区连接算法介绍了Partition类及其具体实现。接着介绍 了半连接过程中出现的问题——万一提取的用户集不够小,不能放入内存。最后介绍了解决该问题的一个方法——使用布隆过滤器的半连接算法,并对布隆过滤器的 原理、存在的问题及应用场景做了相关阐述。 |
第7次小组会议 |
林子雨老师团队2014年暑假拼血奋战70天活动第7次小组讨论会会议纪要 会议时间:2014年8月12日周二上午9点到11点30分 会议地点:厦门大学海韵园科研二号楼303室 与会者:林子雨、叶林宝、蔡珉星、李雨倩、罗道文、马驰 会议纪要撰写:蔡珉星 会议报告PPT下载:请到本文附件中下载报告PPT。 2014年8月12日(星期二)上午9点到11点30分,林子雨老师团队举行本学期第7次小组讨论会。李雨倩同学做了题为《MapReduce 连接优化》的报告,马驰做了题为《Machine Learning》的报告。以下为详细内容: (1)李雨倩同学的报告《MapReduce 连接优化》继续了上一次报告的内容,首先介绍了相似度连接算法以及算法的实现流程。接着介绍了多表连接算法,即多个表进行连接,比较具有代表性的是星型连 接和链式连接。然后对多表等值连接算法以及对该算法如何进行优化做了详细的阐述。 (2)马驰同学的报告《Machine Learning》基于Coursera的公开课,对机器学习作了一番介绍。首先阐述了机器学习的定义,并介绍了两种机器学习算法:监督学习算法、非监督 学习算法。接着又介绍了线性回归算法,包括单变量的情况和多变量的情况,对算法的实现原理做了一番阐述,并介绍了当中Cost Function的概念,以及如何利用梯度下降来求解。报告以清晰的图表让同学们了解了机器学习的基本概念和算法。 |
第8次小组会议 |
林子雨老师团队2014年暑假拼血奋战70天活动第8次小组讨论会会议纪要 会议时间:2014年8月16日周六下午5点20分到6点30分(上半场),晚上8点10分到9点20分(下半场) 会议地点:厦门大学海韵园科研二号楼303室 与会者:林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、曾聪、马驰 会议纪要撰写:李雨倩 会议报告PPT下载:请到本文附件中下载报告PPT。 2014年8月16日周六下午5点20分到6点30分(上半场),晚上8点10分到9点20分(下半场),林子雨老师团队举行本学期第8次小组讨论 会。曾聪同学做了题为《HBase简介》的报告,蔡珉星同学做了题为《-数据倾斜情况下基于MapReduce的join算法优化》的报告。讨论会上半场 结束后,师生到厦大学生公寓大排档举行聚餐,然后回到实验室继续举行下半场讨论会。以下为详细内容: (1)曾聪同学的报告《Hbase简介》先从总体上介绍了Hbase在Hadoop架构中的角色与作用,并介绍了Hbase的特点、数据模型、基本 概念以及它的物理模型。接着详细阐述了Hbase的物理存储细节,以及客户端对数据或模式访问的具体实现步骤。最后介绍了Hbase的工作流程—— Region定位、更新过程、region分配、region server上下线与master上下线。 (2)蔡珉星同学的报告《数据倾斜情况下基于MapReduce的Join算法优化》首先简单介绍了基于MapReduce的Join算法,以及对 现在数据倾斜情况下Join算法存在优化思路进行了分析——改进Partition。接着以具体实例介绍了如何在两表连接中对Partition进行改进 以避免数据倾斜的问题,提出了两种解决方法——采样和简单范围分区。最后针对基于MapReduce Join算法的另一个优化点——如何在MapReduce框架中的Copy阶段减少网络传输量,介绍了一个解决算法LEEN。 |
第9次小组会议 |
林子雨老师团队2014年暑假拼血奋战70天活动第9次小组讨论会会议纪要 会议时间:2014年8月30日周六上午9点到11点 会议地点:厦门大学海韵园科研二号楼303室 与会者:林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、曾聪 会议纪要撰写:蔡珉星 会议报告PPT下载:请到本文附件中下载报告PPT。 2014年8月30日(星期六)上午9点到11点,林子雨老师团队举行本学期第9次小组讨论会。蔡珉星同学做了题为《skew join相关论文》的报告,谢荣东同学做了题为《Android手机开发》的报告。讨论会结束后,师生到厦大学生公寓大排档聚餐。 (1) 谢荣东同学的报告《Android手机应用开发》首先介绍了Google的开源手机系统Android的发展历程,接着阐述了Android的平台架构层 次–Linux Kernel、Libraries、Android Runtime、Application Framework和Application,以及比较重要的几个开发组件。然后对Android的开发环境做了一番介绍,接着讲解了Hello World实例的开发流程,最后对进行了一个简单的Demo演示。 (2)蔡珉星同学的报告《Skew Join相关论文》介绍了自己阅读关于数据倾斜情况下,基于MapReduce的Join算法相关论文的收获。首先详细讲解了论文《Efficient outer join data skew handling in parallel DBMS》是如何解决多表Outer join中可能会产生的数据倾斜问题–通过对中间结果中包含NULL值的数据进行单独处理,避免数据倾斜情况的发生。接着简要介绍了其他几篇论文中,解 决倾斜问题的核心思想。 |
总结大会 |
林子雨老师团队2014年暑假拼血奋战70天活动总结大会会议纪要 会议时间:2014年9月13日周六上午9点到10点40分 会议地点:厦门大学海韵园科研二号楼303室 与会者:林子雨、叶林宝、蔡珉星、李雨倩、谢荣东、罗道文、 会议纪要撰写:李雨倩 2014年9月13日(周六)上午9点到10点40分,林子雨老师团队举行2014年暑假拼血奋战70天活动总结大会。会议主要分以下几项内容: (1)会议第一项:林子雨老师为总结大会致辞,总结了2014年暑假拼血奋战70天活动的活动成果。 (2)会议第二项:由蔡珉星、李雨倩、谢荣东、罗道文同学做2014年暑假拼血奋战70天活动总结报告。主要内容涉及以下四个方面:出勤情况、学习内容、奋战成果、心得感受 。 (3)会议第三项:林子雨老师分别为刘颖杰、叶林宝、蔡珉星、李雨倩同学颁奖,并致颁奖辞。 (4)会议最后一项:林子雨老师发表总结讲话,肯定了2014年暑假拼血奋战70天活动中同学们的努力,并对未来工作做了相应展望。 |
活动总结和感言
(一)林子雨老师总结和感言
1、 活动简介
暑假拼血奋战活动,是林子雨老师独创的实验室师生暑假工作学习模式,目的在于为同学们创造一个浓厚的暑假学习氛围,在老师的指导下,明确学习目标,制定学习计划,提高学习效率,提升个人能力。
为了保障奋战活动顺利有效开展,最大程度提升奋战活动效果,林子雨老师设计了科学合理的一整套活动实施方案,内容涵盖活动口号、宣传海报、活动网站、讨论会、娱乐活动、启动仪式、卫生大扫除、总结大会等,同时设计了严格规范的相关制度,力求形成“以自我约束为主、以外在约束为辅、压力动力双重驱动”的高效学习机制。
经过这个暑假的检验,再次验证了这种工作学习模式的可行性和有效性。在70天的奋战活动中,同学们表现出了吃苦耐劳的优秀品质,大家全情投入,忘我学习,互相勉励,携手同行。一篇篇论文,一行行代码,一页页教材,都记录下了同学们成长的印迹;一个个电话,一封封邮件,一条条微信,都诉说着师生互励互勉的动人故事。温馨的环境,奋战的氛围,同学们坐在一起,彼此影响带动,一起学习进步,共同书写了一段永生难忘的大学生涯学习经历。
2、 活动亮点
本次暑假奋战活动,氛围良好,开展有序,执行有力,富有成效。活动全程具备以下几个突出亮点:
(1) 活动时间跨度大。相比于2012年的50天暑假奋战活动,本次暑假奋战活动时间持续2个月11周累计73天,苦战50个工作日。辛苦程度大大超过以往,需要大家在毅力上承受更多的考验。
(2) 活动参与人员多。2012年暑假奋战只有林子雨老师和赖明星、刘颖杰同学三人参与,本次奋战活动增加到四名同学,即蔡珉星、李雨倩、谢荣东、罗道文,另有叶林宝、曾聪、马驰同学参加了多次小组讨论会和聚餐活动。人数的增加,为活动带来了人气,扩大了活动影响,也进一步强化了同学们学习和沟通的主观意愿。
(3) 对学生的能力锻炼效果好。奋战全程,每个同学都亲自主讲至少两个学术报告,锻炼了口才,深化了对知识的理解。蔡珉星、李雨倩同学连续两个月连续大量阅读论文,基本建立了对研究领域的框架性认识,熟悉了论文写作套路。谢荣东、罗道文同学以案例开发为切入点,认真学习编程知识,在编程实战能力上有了较大的提升。
(4) 师生互动充分。通过小组讨论会、聚餐、看电影以及电话、邮件、微信等多种沟通方式,老师和学生间实现了全程无障碍沟通和交流,老师及时指导,学生及时反馈,形成了充分有效的互动。
(5) 活动战果丰硕。蔡珉星、李雨倩同学通过大量的论文阅读,在科研能力上有了明显的提升;谢荣东、罗道文同学通过案例开发,在编程实践能力上获得了长足的进步。
3、 未来展望
一分耕耘,一份收获。同学们放弃了暑假的休息时间,换来的是沉甸甸的成长果实。在这个暑假,我们一起学习,一起生活,共同走过70天,这里饱含着艰辛,这里也充满着美好。回首过去的70个日日夜夜,我们感慨于挑灯夜战、奋勇拼搏的点点滴滴;回首过去的70个夜夜日日,我们同样欣喜于携手同行、互帮互助的青春友谊。奋战岁月,让我们每个人都成为全新的自己。奋战岁月,我们不只是留下足迹,更是塑造一种精神,一种以学为乐、分秒必争的精神,以这种精神为鼓舞,我们必将开启更加值得期待的明天。
(二)蔡珉星总结和感言
1、出勤情况
请假三天(7月22号-7月24号),其余奋战时间均按时出勤。
2、学习内容
从时间上可以分为两个阶段:7月1号到7月27号,7月29号到9月9号。
1) 7月1号到7月27号
因为参加阿里巴巴的大数据竞赛,且距离比赛结束还有最后一个月,因此这个阶段主要是投入到该比赛中,同时当了小学期课程《高级C语言》的助教。
在该阶段,除了学习推荐系统的相关知识,并编程实现外,也做了4题Leetcode上的题目,不过觉得算法类的知识容易遗忘,因此决定还是等到快找实习时再继续做题。
同时在该阶段,阅读了《Hadoop权威指南》,搭建了Hadoop集群,并写了关于搭建Hadoop集群的教程。
2) 7月29号到9月9号
阿里巴巴的大数据竞赛结束之后,就全心投入到阅读关于数据倾斜情况下基于MapReduce的Join算法的相关论文。
在这个阶段一共阅读了48篇论文,且以精读为主,其中至少有30篇是精读的。
不过长时间的阅读论文也带来了一定的疲惫感,因此还重温了PHP官方手册,以及阅读了《PHP核心技术与最佳实践》一书,并了解了下目前较为热门的微信公众号开发,巩固提升了自己Web开发方面的知识。
3、奋战成果
- 阅读了48篇论文,其中精读至少有30篇。
- 一共做了6次报告:《厦大数据库实验室综合考试》、《MapReduce编程简介》、《分布式数据仓库查询优化》、《Partition类和布隆过滤器》、《数据倾斜情况下基于MapReduce的Join算法优化》、《Skew Join相关论文》。
- 阅读了两本书籍:《Hadoop权威指南》、《PHP核心技术与最佳实践》。
- 完成了阿里巴巴大数据竞赛,成绩第60名(初赛7500个队伍,复赛600个队伍)。
- 在自己的博客上发布了20篇文章。
- 掌握了微信公众平台的开发。
4、心得感受
以往的暑假,虽然在家里也会看点书、学点知识,但跟这次的奋战活动相比,效率、成效显然是差了不少的。
70天的奋战,首先是纠正了我的作息规律,以往都是晚睡晚起,奋战期间都做到早起,按时出勤。并且在奋战期间也有注意锻炼身体,保持至少每周至少一次的锻炼。
阅读论文期间,特别是后半阶段开始阅读《PHP核心技术与最佳实践》,能深切体会到专注对于提升的帮助。以前学习一样东西,通常都是拖长战线,陆陆续续的学习,并不能起到很好的效果。此次奋战,集中精力学习,确实对知识的掌握会更为有效,例如论文,虽然看英文的论文稍有些吃力,体现在阅读速度较慢,一些专业词汇表达的意思也不能理解得很到位,但随着论文阅读数量的增加,这些不太清楚的地方会再次出现,渐渐地对其就会有了一定的理解。而对于MapReduce的连接算法和MapReduce任务的执行流程,也随着论文的阅读,了解了一些以往所不知道的细节,从而有了更为深入的掌握。
研一已经过去了,很快也就会迎来实习、招聘,我也应当以这种专注的状态,继续学习更多知识。
总之,这次的奋战,对我有很大的帮助。
(三)李雨倩总结和感言
1、论文学习
精读论文(29)
Ø综述入门类(8篇)
[1][大牛译著系列]Hadoop MapReduce 连接
[2][大牛译著系列]Hadoop MapReduce 排序
[3][大牛译著系列]Hadoop MapReduce 性能调优
[4][计算机科学与探索]MapReduce 优化技术综述
[5] [SIGMOD ‘08 ] ColumnStores vs. RowStores:How Different Are They Really?
[6][Springer-Verlag Berlin Heidelberg 2013]Comparison and Performance Analysis of Join Approach in MapReduce .
[7][硕士论文]达梦数据库哈希连接算法的研究.
[8][计算机学报]基于星型模式的一个多路top-k join算法.
Ø传统MapReduce连接(13篇)
[1][SIGMOD’10]A comparison of join algorithms for log processing in MapReduce
[2] [SIGMOD ‘11]Processing theta-joins using MapReduce
[3][SIGMOD ‘10]Efficient parallel set-similarity joins using MapReduce
[4][IEEE Transactions]Optimizing multiway joins in a MapReduce environment.
[5] [SKG ‘10]Join optimization in the MapReduce environment for column- wise data store
[6] [VLDB’12]Efficient multi- way theta-join processing using MapReduce
[7 ] [软件学报]MapReduce 框架下基于R-树的k-近邻连接算法
[8] [计算机技术与发展]基于MapReduce 的多路连接优化方法研究
[9] [计算机科学与探索]混合存储下的MapReduce 启发式多表连接优化
[10][计算机研究与发展] 基于MapReduce的连接聚集查询算法研究
[11] [计 算 机 学 报] 基于MapReduce 快速kNN Join 方法
[12] [计 算 机 学 报]面向MapReduce的非对称分片复制连接算法优化技术研究
[13] [小型微型计算机系统]云环境下基于二维节点矩阵的分级多表连接
Ø索引MapReduce连接(5篇)
[1][SIGMOD’11]leveraging columnar storge for scalable join processing in the Map-Reduce framework
[2] [VLDB’10]HadoopDB: an architectural hybrid of MapReduce and DBMS technologies for analytical workloads
[3][VLDB’09]Hadoop++:making a yellow elephant run like a cheetah (without it even noticing)
[4][VLDB’11]CoHadoop: flexible data placement and its exploitation in Hadoop
[5][VLDB’11]Tenzing a SQL implementation on the MapReduce framework
Ø改进MapReduce连接(3篇)
[1][SIGMOD’07]Map-Reduce-Merge:simplified relational data processing on large clusters
[2][IEEE Transactions]Map-Join-Reduce: toward scalable and efficient data analysis on large clusters
[3][DASFAA’12]ComMapReduce: an improvement of MapReduce with lightweight communication mechanisms
泛读论文(35篇)
Ø综述入门类(7篇)
[1][计算机工程]对象关系数据库中一个基于连接谓词索引的连接算法.
[2][微计算机应用]分布式数据库中多元连接查询优化的研究.
[3][计算机研究与发展]海量空间数据的并行Top-k连接查询.
[4][计算机科学]外包数据库中的哈希连接一致性算法
[5][计算机工程与设计]一般关系数据库多表智能连接算法及应用
[6][国防科技大学学报]一个基于引用的高效连接算法 .
[7][重庆理工大学学报( 自然科学)]应用半连接的分布式数据库查询优化算法.
ØKNN连接+连接阶段调度(5篇)
[1] Efficient Parallel kNN Joins for Large Data in MapReduce
[2]Efficient Processing of k Nearest Neighbor Joins using MapReduce
[3]Joint optimization of overlapping phases in MapReduce
[4]Joint Scheduling of MapReduce Jobs with Servers Performance Bounds and Experiments
[5]Joint Scheduling of Processing and Shuffle Phases in MapReduce Systems
Ø过滤(5篇)
[1]A MapReduce-based Filtering Algorithm for Vector Similarity Join
[2]Join Processing Using Bloom Filter in MapReduce
[3]Join processing with threshold-based filtering in MapReduce
[4]Optimizing Distributed Joins with Bloom Filters Using MapReduce
[5]Toward Intersection Filter-Based Optimization for Joins in MapReduce
ØTheta连接+多路连接(7篇)
[1]Binary Theta-Joins using MapReduce Efficiency Analysis and Improvements
[2]Cache Conscious Star-Join in MapReduce Environments
[3]Distributed Matrix Factorization with MapReduce using a series of Broadcast-Joins
[4]Matrix Chain Multiplication via Multi-way Join Algorithms in MapReduce
[5]SEJ An Even Approach to Multiway Theta-Joins using MapReduce
[6]Three-Way Joins on MapReduce An Experimental Study
[7]Binary Two MRJs for Multi-way Theta-Join in MapReduce
Ø相识度连接(11篇)
[1]Efficient Graph Similarity Join with Scalable Prefix-Filtering Using MapReduce
[2]Efficient Similarity Joins on Massive High-Dimensional Datasets Using MapReduce
[3]Exploiting MapReduce-based Similarity Joins
[4]Fuzzy Joins Using MapReduce
[5]MapReduce-based Similarity Join for Metric Spaces
[6]MassJoin A MapReduce-based Method for Scalable String Similarity Joins
[7]MELODY-JOIN Efficient Earth Mover’s Distance Similarity Joins Using MapReduce
[8]Parallel Top-K Similarity Join Algorithms Using MapReduce
[9]PHiDJ Parallel Similarity Self-Join for High-Dimensional Vector Data with MapReduce
[10]Set similarity join on massive probabilistic data using MapReduce
[11]Strategic and suave processing for performing similarity joins using MapReduce
2、其他学习
( 1)继续学完了J2EE课程
http://study.163.com/course/courseMain.htm?courseId=320027#/courseMain
(2)看完了《数据结构与算法分析(Java语言描述)》
3、学习收获
能力收获
出勤情况:全勤
Ø对MapReduce连接有了一定的认识。
Ø锻炼了读英文文献的能力。
Ø锻炼了集中精力学习的能力。
更多收获
这次奋战让我养成了良好的学习和生活习惯。它让我收获的不仅是知识,更多的是以后学习工作的态度。
4、心得感受
1.这个暑假是我学业生涯17年中最有意义、最有收获的 一次。以前的暑假都会完全放松下来,最后什么也没学到,这个暑假很充实,让我终身难忘!
2. 感谢老师每周抽出时间陪我们开组会给我们学习动力;感谢师兄师弟们一个假期的陪伴,默默的支持与鼓气,让我一直坚持到奋战的最后一天。
3.以前很害怕看英语的东西,因为自己英文水平差看起来有点吃力。但是大部分需要看的文献都是英文的,所以硬着头皮看了下去,结果感觉越来越轻松,自己的英语阅读水平有了显著提升。
(四)谢荣东总结和感言
1、出勤情况
全程参与2014暑假奋战70天活动(2014.7.1-2014.9.10)。请假9天(7.3~7.12回家,8.12接待)。出勤61天,出勤期间无迟到、无早退。
2、学习内容
第1周~第5周: 学习JAVASE相关知识,观看学习视频 《韩顺平循序渐进JAVA学习视频》,阅读书籍《疯狂JAVA讲义》。
第6周~第9周:学习HTML5网页制作,阅读《HTML5从入门到精通》;学习Android编程,阅读《Android4高级编程》。
韩顺平视频地址:http://www.youku.com/playlist_show/id_15118419.html
书籍列表: 《疯狂JAVA讲义》、 《HTML5从入门到精通》、《Android4高级编程》
3、奋战成果
JAVA学习
- 内容:通过学习JAVASE相关课程,我熟悉了JAVA面向对象编程,了解了基本的类、方法、接口、继承的使用;并学习了Swing图像编程,能编写简单的图形程序,监听、处理事件。
- 成果:编写了坦克大战游戏程序
HTML5及Android学习
- 内容:学习了HTML5的基本语法,文本处理、图片处理、视频音频处理、网页跳转、前后台连接等。Android4编程学习程度较浅,主要是了解了Android基本架构,了解了以后继续学习Android编程的路线。
- 成果:一个简单的HTML页面。
4、心得感受
通过暑假奋战70天长时间、高强度的学习,我成长了很多。学习上,我集中学习了JAVASE技术、HTML5网页编程、Android4基础编程,掌握了基本的编程技巧和方法,能根据具体的需要编写程序,为我研究生阶段的学习与科研奠定了基础。精神上,我戒除了懒惰、浮躁的习气,一改往日晚上睡不着白天睡不醒的习惯,养成了早起早睡、勤于锻炼的生活习惯,提升了精力、改善了气质、强健了体魄。通过对技术的学习,我掌握了制定计划、循序渐进、脚踏实地、勤于记录的学习方法。这些都为我的研究生阶段及以后的学习生活打下了坚实的基础。
这70天对我来说意义非凡,不仅增长了技术、学习了知识,而且磨练了意志、改善了习惯。总的来说,我感谢这70天的学习生活带给我的改变,感谢林老师给我们创造的良好的学习氛围和学习环境,也感谢这70天来一起奋战的3位师兄弟和师姐的陪伴,我们互相帮助、互相鼓励、一起坚持、一起成长,才顺利完成这70天的奋战。
(五)罗道文总结和感言
1.出勤情况
暑期奋战总共70天,按时出勤63天;7月3日,由于招待同学,请假一天;8月8日上午,由于忘记签到,算迟到一次;由于这次迟到,我损失惨重,首先,接下来一个星期,8点半之前到实验室;其次,请实验室一条水煮鱼;最后,本来还可能拿500奖学金的希望也破碎了。所以,特此说明,以此为戒!8月26日~8月30日,请假回家。
2.学习内容
暑期奋战总共70天,学习内容如下:►学习了linux脚本,参考书籍为《linux脚本攻略》。►学习python的基本语法以及使用。python真是一门简洁语言,使用方便,语法简单。
►同时复习了C++和学习一些算法;
3.奋战成果
暑期奋战70天,总的来讲,还是收获蛮大的:
首先,学习linux脚本,了解linux系统相关的操以及相关命令的使用,例如grep,sed,awk等等。为以后,深入学习linux系统打好基础;
其次,再学习python过程中,我切实感受到语言相通。了解json这门语言,因为json其实就是python的字典;其次当初在学spring框架的时候,不了解@注释的用法,其实就是和python的修饰函数类似;最后,学习python过程中,顺道把正则表达式学习了一遍,至少已达到会使用,会看懂正则表达式了。
最后,复习了C++和学习一些算法。
4.心得体会
这次暑期奋战70天,有收获,有汗水。
在奋战一开始的时候,由于之前没有这样的体验,所以我带着新鲜感,全身心的投入暑期奋战中。那时候,每天都充满能量的起床,吃早饭,来实验室,看书;虽然每一天都重复同样的生活,但是并没有感到累,感到厌烦。所以前期看书的效率也是最高,收获最大。
总的来说,这次暑期奋战是很有意义的,如果没有这次奋战,我可能在家就荒废了两个月,但是在实验室,我最起码学到一些东西,同时也加深了与实验室师兄师姐之间的友谊,多认识几个朋友。
期待明年的暑期奋战!
实验室卫生大扫除迎接新学期
数据库实验室2014年暑假奋战卫生大扫除活动总结
热烈庆祝本次活动圆满落下帷幕!