《大数据技术基础》2013班级主页
主讲教师:林子雨
E-mail: ziyulin@xmu.edu.cn 个人主页:http://www.cs.xmu.edu.cn/linziyu
2013班级概况|名单|课程历史|公告板|重要资源|海报|记事表|推荐阅读|下载专区|相册
课程历史
备注:林子雨老师从2013年9月开始主讲《大数据技术基础》课程,之前林子雨主讲的研究生课程《分布式数据库技术》今后不再开课,如果需要查看历史班级授课情况,请访问《分布式数据库技术》课程网页。
2013班级概况
学期 | 课程名称 | 授课对象 | 班级人数 | 授课时间与地点 | 助教 | 班歌 | 班曲 | |
2013-2014秋季学期 | 大数据技术基础 | 计算机科学系2013级研究生 | 59 | 每周六下午5、6、7节,厦大海韵教学楼207教室 | 赖明星 | 《存在》 | 《琵琶语》 |
学生名单
栾钦波、蔡辉虎、蔡媛媛、常旺、陈坤源、陈日伟、陈晓锋、郭锡朝、黄芳芳、黄守辉、蒋琪凌、李培、李欣悦、李友、李雨倩、李逸尘、刘敏、卢畅、彭雨龙、唐璐、王菁菁、瓮升霞、吴凡、吴鸿腾、谢思发、袁思思、赵忠龙、蔡珉星、蔡志鹏、陈佳晶、陈俊捷、陈艺清、何宝琴、黄华强、黄文颖、李金金、李舒婷、李子铭、林晓翠、林一奇、刘齐、刘晓娟、潘思宇、齐飞、涂锦灿、王骏钰、王晓然、王玉成、魏陈强、吴伟伟、徐超、杨李冬、杨志伟、应文涛、张晨、张鹏飞、张润、郑涛、周斌
团队名单
团队 | 队长 | 队员 | 队员 | 队员 |
第1团队 | 吴凡 | 蔡媛媛 | 陈佳晶 | 王菁菁 |
第2团队 | 蔡志鹏 | 吴鸿腾 | 吴伟伟 | 李舒婷 |
第3团队 | 李友 | 杨李冬 | 陈晓峰 | 黄守辉 |
第4团队 | 陈坤源 | 陈日伟 | 黄芳芳 | 蒋琪凌 |
第5团队 | 刘晓娟 | 赵忠龙 | 陈俊捷 | 陈艺清 |
第6团队 | 郭锡朝 | 李逸尘 | 周斌 | 瓮升霞 |
第7团队 | 刘齐 | 涂锦灿 | 林一奇 | |
第8团队 | 黄文颖 | 齐飞 | 李子铭 | 李金金 |
第9团队 | 徐超 | 王骏钰 | 应文涛 | 郑涛 |
第10团队 | 魏陈强 | 李培 | 谢思发 | 杨志伟 |
第11团队 | 张鹏飞 | 张润 | 蔡辉虎 | 彭雨龙 |
第12团队 | 唐璐 | 何宝琴 | 黄华强 | 卢畅 |
第13团队 | 常旺 | 王玉成 | 袁思思 | 李雨倩 |
第14团队 | 蔡珉星 | 潘思宇 | 王晓然 | 林晓翠 |
第15团队 | 刘敏 | 李欣悦 | 张晨 |
选课海报
班级公告板
序号 | 发布时间 | 内容 |
1 | 2013年7月4日 | 老师开始备课了…… |
2 | 2013年7月4日 | 大数据与云计算国际学术会议BDCC2013,欢迎访问 |
3 | 2013年7月4日 | 欢迎访问厦门大学云计算与大数据研究中心 |
4 | 2013年7月5日 | 温馨提示:本课程可以不用购买教材 |
5 | 2013年8月1日 | 推荐:MIT公开课视频,包括上百门大学课程 |
6 | 2013年8月20日 | 老师和助教开始设计课程期中作业 |
7 | 2013年8月29日 | 推荐同学们在自己的手机上安装“厦门智能交通手机客户端”(下载地址),可以使用手机软件快速招到出租车,查询各路公交车当前到达哪个站,厦门市区道路路况和路口视频。 |
8 | 2013年9月20日 | 老师和助教顺利完成期中作业设计工作 |
9 | 2013年9月27日 | 发布2013班级学生名单 |
10 | 2013年9月28日 | 第一次课顺利完成。请到“下载专区”下载期中作业说明。课堂照片已经放入班级相册。 |
11 | 2013年9月28日 |
现在,正式启动本课程第一个重要任务——组建团队。具体规则如下:
(1)每个团队共有4名队员,包括1名队长和3名普通成员。由于班级一共有61人,会产生15个团队,最终会多1位同学,老师会在产生15个团队后决定这位同学增加到哪个团队。
(2)每个团队男女随意组合,也就是说,全是男生,或者全部是女生,也都可以。不过,大家最好适当注意性别搭配。
(3)请在本周日(9月29日)晚上9点之前,完成团队组建,并由队长发送团队名单(在名单中仍然要注明谁是队长)给老师邮箱,老师收到邮件一定会给予回复。剩余无法成功组队的同学,在截止时间之前也请给老师发送邮件,告诉老师你找不到团队可以加入。
(4)对于在截止时间到了以后,仍然没有完成组队的同学,由老师决定剩余同学如何组队,老师一般会采取男女搭配和随机组合相互结合的方法完成组队。
(5)团队组建完毕后,队长就可以立即给老师发送邮件,老师根据收到邮件的先后顺序给每个团队分配编号,老师期待第1号团队的荣耀诞生。在第14支团队诞生之前,老师不接受超过4人的组队。当4人团队数量达到14个,剩余一个团队老师可以接受超过4人组队时,如果还有必要,老师会发邮件通知大家。
|
12 | 2013年9月29日 | 班级团队组建完成,每个团队为荣誉而战,合作完成期中作业 |
13 | 2013年9月29日 | 根据厦门大学国庆放假安排,我们需要在10月5日上第2次课,在10月7日上第3次课,请大家一定要注意上课时间。 |
14 | 2013年10月4日 | 10月5日(周六,明天)下午567节课程内容安排是第1章“大数据概述”。 |
15 | 2013年10月5日 | 今日课件和教材已经在班级网站发布,请到“下载专区”下载。 |
16 | 2013年10月6日 | 10月7日(周一,明天)下午567节课程内容安排是第2章“大数据关键技术与挑战”。 |
17 | 2013年10月7日 | 今日课件和教材(第2章大数据关键技术与挑战)已经在班级网站发布,请到“下载专区”下载。 |
18 | 2013年10月8日 | 正式确定团队分组名单。 |
19 | 2013年10月17日 | 10月19日(周六)下午567节,继续把第2章“大数据关键技术与挑战”的剩余内容讲完,然后开始第3章Hadoop讲解。 |
20 | 2013年10月19日 | 今日课件和教材(第3章Hadoop)已经在班级网站发布,请到“下载专区”下载。 |
21 | 2013年10月21日 | 课外活动推荐(致动漫爱好者):2013年厦门国际动漫节(10月25日-10月28日,访问动漫节官方网站)。每年老师都会把这个活动推荐给班级的动漫爱好者,往年有同学去参加过,反映不错。如果你是动漫爱好者,这个机会不容错过。 |
22 | 2013年10月25日 | 10月26日(周六)下午567节,讲解第4章MapReduce。 |
23 | 2013年10月26日 | 今日课件和教材(第4章MapReduce)已经在班级网站发布,请到“下载专区”下载。 |
24 | 2013年10月30日 |
《大数据技术基础》2013班级各位同学,大家好!
老师主讲的研究生课程《大数据技术基础》2013班级,设立有1000元的班级活动经费(老师自己投入)。老师每年都是把班级活动安排在10月末到11月初的第一个周六,太早的时候老师与大家都很陌生,再晚一周天气都会变得很冷,只有这周是最佳时间。
因为本周六学校举行运动会,周六下午无法上课(本周课程可能会调整到本周日晚上上课),所以,现在确定于本周六(11月2日)上午举行班级第一次活动,本次活动经费预算500元,使用班级活动经费,“不需要”同学自己出钱。
类似学生活动,老师已经举办过多次,具有丰富的接待经验。精心的安排,一定可以带给同学全新的周末休闲体验。
本次活动说明如下:
1、活动时间地点:2013年11月2日(周六),上午9点到下午3点(根据具体活动情况,有可能持续到下午4点多)。
2、活动地点:厦门五缘湾(中国第一爱情湾,厦门最佳家庭休闲游目的地,城市湾居生活典范)
3、活动内容:(1)登高28楼天台,全景俯瞰五缘湾,体会台湾设计大师的传奇作品;(2)参观老师自家“菜园”,亲自“偷菜”
,用于后面的野炊活动和喂天鹅活动;(3)漫步海上木栈道,感受碧波万顷的五缘湾内弯风情,尽览五缘湾游艇码头靓丽海岸线;(4)参观五缘湾游艇码头,贴近时尚浪漫的顶级湾居生活;(5)游走五缘湾湿地公园,喂黑天鹅,走迷宫木栈道;(6)午餐时间接受老师宴请,共享融入老师巧妙心思的“野炊大餐”(备注:老师准备了炉火工具,能不能快速把炭火烧起来,就看同学的了)。
4、活动交通:请同学打车在周六上午9点之前到达五缘湾;活动结束后,老师亲自驾车送同学回学校。活动过程各个地点之间切换,全部通过乘坐老师的汽车来完成。
5、活动人员要求:参加本次活动的同学,总共4人,两男两女,必须保证周六上午8点到下午5点之间可以全程参与活动,不能中途离开。
6、活动人员产生办法:同学收到本邮件以后,就可以开始报名,必须使用同学自己的电子邮箱发送报名电子邮件给老师,不接受短信、打电话等其他方式报名。电子邮件中,只要写上自己的“名字和性别”就可以了。老师会根据自己邮件客户端收到的邮件的时间先后顺序,选择前两名男生和前两名女生。老师自己指导的两个硕士研究生不参与本次活动,因为,老师以后会另外找其他时间带他们去五缘湾活动。另外,参加学校运动会的同学,可能没有时间参与这次班级活动,这里向这些同学表示歉意,因为,只有这周活动是最合适的,往后再过一周,天气会变得很冷,就不适合搞班级户外活动了,还请同学们给予理解。谢谢!
本次活动全程高清照相,相片入班级相册。现在报名开始了,老师期待同学的报名电子邮件,如果没有人报名,老师就要“抓壮丁”了,呵呵。谢谢大家的积极参与,让我们共同创造多姿多彩的研究生生活!
|
25 | 2013年10月30日 | 11月2日(周六)班级五缘湾活动名单产生:刘晓娟(女)、李金金(女)、陈日伟(男)、李培(男)。 |
26 | 2013年11月1日 | 《大数据技术基础》因为校运会本周“停课一次”。
校运会期间,全校停课三天(周五、周六和周日)。此前老师一直在努力申请调课(因为少一周课,就会少讲一些内容),打算把本周六下午的课,调整到本周日晚上。但是,经过李雨倩同学和相关部门反复沟通后,发现遇到两个问题:(1)周日晚上运动员可能聚餐;(2)周日全校停课,教室多媒体不给开(没有投影仪和电脑用),无法上课,申请其他上课场地很麻烦。所以,老师最终决定放弃调课,本周“停课一次”。谢谢大家!
|
27 | 2013年11月2日 | 班级今日五缘湾师生游的照片已经发布,请点击这里访问。参加本次活动的人员包括:林子雨老师和刘晓娟(女)、李金金(女)、陈日伟(男)、李培(男)等四位同学。 |
28 | 2013年11月5日 |
课外活动推荐:推荐给对游艇感兴趣的同学,这是厦门一年一度的国际游艇盛会,“中国水上第一展”,每年都会举行“游艇宝贝”大赛和相关高端奢侈品展示。门票价格往年好像是50元一张。官方网站:http://www.xmboatshow.com
11月8日至11日,第六届中国(厦门)国际游艇展览会将在五缘湾游艇港隆重举行。届时,全球顶尖的游艇领军企业将携旗下产品齐聚厦门,您将有机会近距离一睹难得一见的高端游艇,并领略不同以往的海洋休闲生活方式。
六年磨一剑,如今的中国(厦门)国际游艇展已名列全国三大游艇展之一,每年吸引着数以万计的人潮,享有中国水上第一展的美誉。今年的游艇展仍将保持水陆联动一体的特色,现场将有351个泊位,30000多平方米的水上展区。
|
29 | 2013年11月5日 | 本周六(11月9日)下午567节课程内容预告:讲解第5章HDFS和第6章Zookeeper。 |
30 | 2013年11月9日 | 第5章HDFS和第6章Zookeeper教材PDF和讲义PPT已经发布,请到“下载专区”下载。 |
31 | 2013年11月11日 | 本周六(11月17日)下午567节课程内容预告:讲解第7章HBase。 |
32 | 2013年11月16日 | 期中作业必须于2013年11月23日(厦门大学教学周第十周周六)21点00分之前提交。 |
33 | 2013年11月21日 | 本周六(11月23日)下午567节课程内容预告:讲解第8章流计算。 |
34 | 2013年11月23日 | 第8章流计算教材PDF和讲义PPT已经发布,请到“下载专区”下载。 |
35 | 2013年11月27日 | 本周六(11月30日)下午567节课程内容预告:讲解第9章图计算。 |
36 | 2013年11月30日 | 第9章图计算教材PDF和讲义PPT已经发布,请到“下载专区”下载。 |
37 | 2013年12月5日 | 本周六(12月7日)下午讲解第10章NoSQL数据库和第11章云数据库。 |
38 | 2013年12月7日 | 第10章NoSQL数据库和第11章云数据库教材PDF和讲义PPT已经发布,请到“下载专区”下载。 |
39 | 2013年12月10日 | 本周六(12月14日)下午讲解第12章Google Spanner。 |
40 | 2013年12月13日 | 本周六下午的上课教室被四六级考试占用,周末期间调课和教室申请手续无法办理,经过努力无法申请到周日的教室,所以取消周六下午课程。 |
41 | 2013年12月15日 | 由于周六(12月14日)的课程由于四六级考试而取消,无法安排其他时间补课,因此,请同学们自学第12章Google Spanner的内容,教材PDF和讲义PPT已经发布,请到“下载专区”下载。 |
42 | 2013年12月15日 | 第13章Google Dremel教材PDF和讲义PPT已经发布,请到“下载专区”下载。 |
43 | 2013年12月15日 | 12月21日(周六)下午567节讲解第13章Google Dremel;12月28日(周六)下午567节举行期中作业答辩,请各个团队做好答辩准备。下周,老师会发布一个完整版本的教材PDF,供大家复习。 |
44 | 2013年12月17日 |
大数据技术基础2013班级各位同学,大家好!
12月28日(周六)举行大数据技术基础期中作业答辩,要求如下:
(1)每个团队选择一个报告人,制作简单的PPT,上台讲解自己团队的工作,只需要讲解与MySQL性能测试相关的部分,包括调优点和遇到的问题。讲解尽量详细,要让没有采用该调优点的同学明白该调优点的意义,以及为什么修改该调优点以后能够获得整体性能的提升,讲解遇到的问题时,要让没有遇到该问题的同学知道你们遇到了什么问题,这个问题是怎么解决的;
(2) 每个团队上台报告不超过10分钟;
(3)每个团队每个队员都到场参加答辩,请队长注意通知队员参加答辩;
(4)老师和助教(赖明星同学)会现场提问,可能会问团队里面的任何一个同学,必须由该同学本人回答,团队内其他同学不能代替回答;提问的内容不限于MySQL性能测试,还可能会包括VISIO、MATLAB和ORIGIN;期中作业虽然讲求分工完成,但是,要求每个同学都熟悉全部作业内容;
(5) 期中作业目前已经完成初步批改,老师会根据答辩情况,如果有必要会对批改成绩进行适当调整。
注意:
答辩当天助教会带笔记本到现场,笔记本中安装了windows 7系统和Ubuntu 12.04 LTS系统,并且已下载好putty(用于SSH连接,也可以切换到Ubuntu 12.04进行SSH连接)。答辩当天需要当场演示,在笔记本上做实验的同学,请自带笔记本。在windows下使用虚拟机完成实验的同学,请将自己的电脑设置好远程连接,到时候通过助教的笔记本远程连接到你自己的电脑进行操作。通过Wubi安装(或者硬盘安装和U盘安装)Linux的同学,可以使用SSH连接到自己的电脑上进行远程操作。所以,请务必准备好演示过程,不知道怎么进行远程连接的同学,可以向助教(me@mingxinglai.com)寻求帮助。
祝大家答辩顺利!
|
45 | 2013年12月18日 | 《大数据技术基础》教材完整版已经发布,一个PDF文件包含了所有章节内容,请到“下载专区”下载。 |
46 | 2013年12月21日 |
《大数据技术基础》期末考试时间地点:2014年1月4日(周六)下午2点30分厦大曾厝垵学生公寓教学楼205教室。
考试内容涉及教材13章内容,每章内容都有考题,没有选择题,全部是问答题,请大家认真复习。考试内容不会超出教材知识范围,请大家按照老师已经发布的教材PDF进行复习(可以到班级网站“下载专区”下载教材PDFhttps://dblab.xmu.edu.cn/post/1090)。
下面就期末考试做几点说明:
(1)考试坚决杜绝作弊,老师和助教会严格执行考场纪律。请大家一定不要携带复习资料开始考试,特别是,现在的智能手机都可以保存课件PPT,请大家务必保持关机状态,考试中途不准看手机,看时间也不行,考试时间非常充沛,而且老师也会提醒时间,同学们也可以主动问老师时间。作弊一定不及格。
(2)老师采用“匿名”方式批改试卷,改卷时看不到试卷上同学的名字,确保改卷过程公平公正,所以,请大家一定把名字写在装订线以内,答题区域不准出现个人信息。
(3)考试成绩发布时,试卷肯定已经提交给教学秘书,如果对分数有疑问,请一定“不要”直接向老师询问(因为如果只是问我,试卷已经提交给学院,我没办法让你亲眼看到试卷批改结果,还是无法消除同学的疑问的),请按照学校规定的流程,找教学秘书核查试卷。老师对试卷分数统计和录入非常认真(大家应该能够了解我的做事风格),会前后仔细核对3遍以上,助教也会帮助核对,所以,基本上不会出现分数统计错误或录入错误。
最后,祝大家考试顺利,只要认真听课,认真复习,取得好成绩是不难的!
|
47 | 2013年12月21日 | 期末考试复习范围正式发布,已经发送电子邮件给同学们,请大家根据复习范围认真做好期末复习工作。复习任务较重,请大家抓紧时间复习。 |
48 | 2013年12月23日 | 本周六(12月28日)下午567节,主要内容是进行期中作业答辩,同时,老师会让助教顺便介绍找工作体会。助教赖明星同学今年拿到了“网易游戏”的OFFER,相信他的找工作经历会让大家有所收获!这堂课上,老师会用单反相机为同学们采集一些课堂照片,保存大家研究生时代的美好记忆。 |
49 | 2013年12月28日 | (1)期中作业答辩顺利结束,本学期最后一次课程结束。 (2)班级合影和今日课堂照片发布,请到班级相册下载。 (3)2014年1月4日(周六)下午2点30分在厦大曾厝垵学生公寓教学楼205教室举行期末考试。 |
50 | 2014年1月4日 | 期末考试顺利结束,老师开始批改考卷,请同学们等待成绩发布,需要一周多时间才能发布成绩。期末开始现场照片已经放入班级相册。 |
51 | 2014年1月11日 | 期末考试成绩正式发布,请大家到研究生院网站查询! |
重要资源
研究生教学秘书汤美榕老师联系方式: 电话:0592-2580023 E-mail:tmr@xmu.edu.cn
厦门大学校区平面图 | 厦门大学2013-2014学年校历 | 厦门市三维电子地图 |
林子雨制作的《图片厦门》 | 林子雨制作的《图片厦大》 | 林子雨撰写的《厦门三日游安排》 |
林子雨报告《论文是怎样炼成的》 | 厦门智能交通手机客户端下载 |
课程进度表
(蓝色表示未完成,绿色表示已完成,红色表示假期不上课,点击这里查看“厦门大学2013-2014学年校历”)
第1周 | 第2周 | 第3周 | 第4周 | 第5周 | 第6周 | 第7周 | 第8周 | 第9周 | 第10周 | 第11周 | 第12周 | 第13周 | 第14周 | 第15周 | 第16周 |
教育周 | 9月28日 | 10月5日 | 10月7日 | 10月19日 | 10月26日 | 11月2日 | 11月9日 | 11月16日 | 11月23日 | 11月30日 | 12月7日 | 12月14日 | 12月21日 | 12月28日 | 1月4日 |
每周课堂内容
教学周 | 日期 | 上课内容 |
第1周 | 2012.09.15-21 | 研究生新生入学教育周,不上课 |
第2周 | 2012年9月28日 | 课程介绍,布置期中作业,激励同学研究生三年做好学习计划,努力学习 |
第3周 | 2013年10月5日 | 第1章大数据概述 |
第4周 | 2013年10月7日 | 第2章大数据关键技术与挑战,讲完了大数据处理基本流程和大数据处理模型 |
第5周 | 2013年10月19日 | 讲完第2章大数据关键技术与挑战,讲完第3章Hadoop |
第6周 | 2013年10月26日 | 讲完第4章MapReduce |
第7周 | 2013年11月2日 | 学校运动会,本周停课一次 |
第8周 | 2013年11月9日 | 讲完第5章HDFS和第6章Zookeeper |
第9周 | 2013年11月16日 | 讲完第7章HBase |
第10周 | 2013年11月23日 | 讲完第8章流计算,公务员生活 |
第11周 | 2013年11月30日 | 讲完第9章图计算 |
第12周 | 2013年12月7日 | 讲完第10章NoSQL数据库和第11章云数据库 |
第13周 | 2013年12月14日 | 上课教室被四六级考试占用,周末期间调课和教室申请手续无法办理,经过努力无法申请到周日的教室,所以取消周六下午课程。同学们自学本章节内容。 |
第14周 | 2013年12月21日 | 讲完第13章Google Dremel |
第15周 | 2013年12月28日 | 举行了期中作业答辩,班级合影,助教与大家分享找工作经验 |
第16周 | 2014年1月4日 | 期末考试 |
推荐阅读
序号 | 题目 | 来源 |
1 | 《Google Spanner (中文版)》 | 林子雨2012年9月翻译 |
2 | 《Google Bigtable (中文版)》 | 林子雨2010年7月翻译 |
3 | 《第5届超大数据库会议XLDB2011大会报告(中文版)》 | 林子雨2012年5月翻译 |
4 | 《全球级的分布式数据库Google Spanner原理》 | EMC公司.颜开撰写的网文 |
4 | 《Hadoop Summit 2013见闻》 | 2013年6月27日网络文章 |
5 | 《Hadoop分布式文件系统:架构和设计要点》 | 2008年6月网络文章 |
6 | 《Hadoop实战入门手册》 | 2011年7月网络资料 |
7 | 《流计算:即时信息(入门级)》 | 2008年12月网络资料 |
8 | 《Yahoo! 流计算框架S4(介绍篇)》 | 2012年12月网络资料 |
9 | 《什么是流计算》 | 2009年1月网络资料 |
10 | 《IBM大数据平台简介》 | 2013年3月网络资料 |
11 | 《开放实时数据处理平台Twitter Storm》 | 网络资料 |
12 | 《MIT公开课视频》 | 包括上百门大学课程 |
13 | 《Architecture of a database system(英文版)》《Architecture of a database system(中文版)》 | Michael Stonebraker经典论文,2013年9月到11月林子雨老师团队翻译成中文版 |
14 | 《浅谈实时数据流计算》 | 2012年8月网络资料 |
15 | 《基于IBM InfoSphere Streams平台高性能流计算应用的构建》 | 2012年8月网络资料 |
16 | 《“NoHadoop”?——新一代海量数据架构分析》 | 2010年10月网络资料 |
17 | 《那些年Google公开的大数据领域论文》 | 2013年2月网络资料 |
18 | 《李开复:用大数据技术抓造谣传谣者》 | 2013年8月李开复的新浪微博 |
19 | 《大数据管理:概念、技术与挑战》 | 来自百度文库,中国人民大学孟小峰团队作品 |
20 | 《韩冀中:大数据存储与处理》 | 中科院韩冀中报告PPT |
21 | 《数据库分区实例演示》 | 2012年6月网络资料 |
22 | 《年度专题:2011大数据技术与产品回顾》 | 网络资料 |
23 | 《Beyond MapReduce:图计算框架概览》 | 2012年4月网络资料 |
24 | 《Pregel: A System for Large-Scale Graph Processing》 | SIGMOD2010大会英文论文 |
25 | 《在Hadoop上运行SQL:程序员需知晓的13种数据工具》 | CSDN资料 |
26 | 《SQL on Hadoop》 | 2013年9月网络微博资料 |
27 | 《上海推进大数据研究与发展三年行动计划(2013-2015年)》 | 2013年7月网络资料 |
28 | 《Hadoop之父Doug Cutting》 | 《程序员》杂志2013年第4期 |
29 | 《BBC:地平线,大数据时代》 | BBC制作的大数据应用宣传片 |
30 | 《2013大数据全球技术峰会PPT》 | 2013年4月网络资料 |
31 | 《Percolator:大数据集增量更新系统》 | 2010年10月网络资料 |
32 | 《Google Dremel原理– 如何能3秒分析1PB》 | 2013年4月,颜开的博客 |
33 | 《Google Dremel论文翻译导读》 | 2013年2月网络资料 |
34 | 《Hadoop新MapReduce框架Yarn详解》 | 2013年1月网络资料 |
35 | 《十个最有用的云数据库》 | 2012年12月网络资料 |
记事表
序号 | 时间 | 事情 |
1 | 2013年7月4日 | 班级网页开通,老师开始备课 |
2 | 2013年8月20日 | 老师和助教开始设计课程期中作业 |
3 | 2013年9月20日 | 老师和助教顺利完成期中作业设计工作 |
4 | 2013年9月29日 | 班级团队组建完成,每个团队为荣誉而战,合作完成期中作业 |
5 | 2013年10月30日 | 11月2日(周六)班级五缘湾活动名单产生:刘晓娟(女)、李金金(女)、陈日伟(男)、李培(男)。 |
6 | 2013年11月2日 | 五缘湾师生游活动顺利举行,请点击这里访问活动报道和照片。参加本次活动的人员包括:林子雨老师和刘晓娟(女)、李金金(女)、陈日伟(男)、李培(男)等四位同学。 |
7 | 2013年11月24日 | 顺利完成期中作业提交工作,班级全部团队都按时提交了期中作业。 |
8 | 2013年12月18日 | 《大数据技术基础》教材PDF完整版正式发布,供同学们期末复习。 |
9 | 2013年12月21日 | 确定期末考试时间和教室:2014年1月4日(周六)下午2点30分,厦大曾厝垵学生公寓教学楼205教室。 |
10 | 2013年12月21日 | 期末考试复习范围正式发布,通过电子邮件发送给同学们。 |
11 | 2013年12月28日 | 举行了期中作业答辩,老师和每个团队合影,班级合影。 |
12 | 2014年1月4日 | 期末考试 |
13 | 2014年1月11日 | 期末考试成绩发布 |
下载专区
资料下载
序号 | 下载文件 | 文件说明 |
1 | 《Hadoop实战》 | 来自网络,介绍了Hadoop项目、体系结构、分布式开发、计算模型和数据管理,班级FTP提供下载 |
2 | 《Hadoop权威指南中文版》 | 文件较大,通过班级FTP下载,课堂上公布FTP账号和密码 |
3 | 《HBase实战(中文试读版)》 | 只有前2章内容,更多内容需要购买书籍,班级FTP提供下载 |
4 | 《期中作业说明》 | 详细说明了期中作业内容 |
课件下载
《大数据技术基础》(林子雨 编写)是中国高校第一本大数据技术方面的教程,可以作为计算机专业研究生《大数据技术基础》课程的参考教材,由林子雨对大量网络资料和相关书籍内容进行阅读整理后编写而成, 深入浅出全面介绍大数据相关知识,全书内容包括大数据概述、大数据关键技术与挑战、NoSQL数据库、云数据库、Google Spanner、Hadoop、HDFS、HBase、MapReduce、Zookeeper、流计算、图计算和Google Dremel等。
整本教材下载
(点击这里下载整本教材PDF,一个PDF文件包含所有章节内容)
分章节下载
章节 | 标题 | 内容摘要 | 教材PDF | 讲义PPT |
第1章 | 大数据概述 | 大数据概念、大数据的产生和应用、大数据作用、大数据与大规模数据、海量数据的差别、典型的大数据应用实例、从数据库到大数据、大数据与云计算、大数据与物联网、对大数据的错误认识、大数据技术、大数据存储和管理技术、大数据生态系统 | 下载 | 下载 |
第2章 | 大数据关键技术与挑战 | 大数据处理基本流程、大数据处理模型、大数据关键技术(文件系统、数据库系统、索引和查询技术、数据分析技术)、大数据处理工具、大数据时代面临的挑战(大数据集成、大数据分析、大数据隐私问题、大数据能耗问题、大数据处理与硬件的协同、大数据管理易用性问题、性能测试基准) | 下载 | 下载 |
第3章 | Hadoop | Hadoop概述、Hadoop发展简史、Hadoop的功能与作用、为什么不用关系型数据库管理系统、 Hadoop的优点、Hadoop的应用现状和发展趋势、Hadoop项目及其结构、Hadoop的体系结构、Hadoop与分布式开发、Hadoop应用案例、Hadoop平台上的海量数据排序 | 下载 | 下载 |
第4章 | MapReduce | 分布式并行编程:编程方式的变革、MapReduce模型概述、Map和Reduce函数、MapReduce工作流程、并行计算的实现、实例分析:WordCount、新MapReduce框架Yarn | 下载 | 下载 |
第5章 | HDFS | HDFS的假设与目标、HDFS的相关概念、HDFS体系结构、HDFS命名空间、HDFS存储原理、通讯协议、数据错误与异常、从HDFS看分布式文件系统的设计需求 | 下载 | 下载 |
第6章 | Zookeeper | Zookeeper简介(系统架构、设计目的和特点)、Zookeeper的工作原理(选主流程、同步流程、工作流程)、Zookeeper的数据模型、Zookeeper的典型应用场景(统一命名服务、配置管理、集群管理、共享锁、队列管理) | 下载 | 下载 |
第7章 | HBase | HBase简介、HBase使用场景和成功案例、HBase和传统关系数据库的对比分析、HBase访问接口、HBase数据模型、HBase系统架构、HBase存储格式、读写数据、MapReduce on HBase | 下载 | 下载 |
第8章 | 流计算 | 流计算概述、流计算处理流程、流计算应用、流计算框架Storm | 下载 | 下载 |
第9章 | 图计算 | 图计算简介、Google Pregel简介、Google Pregel图计算模型、Pregel的C++ API、Pregel模型的基本体系结构、Pregel模型的应用实例、改进的图计算模型 | 下载 | 下载 |
第10章 | NoSQL数据库 | NoSQL简介、NoSQL现状、为什么要使用NoSQL数据库、NoSQL数据库的特点、NoSQL的五大挑战、对NoSQL的质疑、NoSQL的三大基石、NoSQL数据库与关系数据库的比较、典型的NoSQL数据库分类、NoSQL数据库开源软件 | 下载 | 下载 |
第11章 | 云数据库 | 云数据库概述、云数据库的特性、云数据库是海量存储需求的必然选择、云数据库与传统的分布式数据库、云数据库的影响、云数据库产品 、数据模型、数据访问方法、编程模型 | 下载 | 下载 |
第12章 | Google Spanner | Spanner背景、与BigTable、Megastore的对比、Spanner的功能、体系结构、Spanserver、Directory、数据模型、TrueTime、Spanner的并发控制 | 下载 | 下载 |
第13章 | Google Dremel | Dremel概述、Dremel的数据模型、嵌套列式存储、查询语言、查询的执行 | 下载 | 下载 |
相册
活动专辑:2013年11月2日五缘湾师生游,只有少量照片放入了下面的班级相册,请点击这里访问该活动所有照片。