林子雨主讲《大数据处理技术》2016班级主页

中国高校大数据课程公共服务平台LOGO(图上文下)

本班级是“中国高校大数据课程公共服务平台”的九大工程中的“6号子工程”

全力打造中国高校大数据教学示范班级

同步录制并免费发布在线课程频频

厦门大学《大数据处理技术》2016班级主页

时间地点:每周三晚上7点10分  两节课  海韵教学楼208教室

主讲人:厦门大学计算机科学系  林子雨  博士/助理教授

(E-mail: ziyulin@xmu.edu.cn, 个人主页:http://www.cs.xmu.edu.cn/linziyu)


课程简介|教师简介|示范班级|公告板|学生服务站|课程教材|讲义PPT下载|课后作业|在线课程视频|班级相册


热烈祝贺本班级课程圆满结束!

大数据处理技术2016春季学期班级主页二维码

(扫一扫手机访问本主页)

IMG_0558

IMG_0576

IMG_0563

大数据课堂2016年5月11日师生合影

(图 5月11日师生合影,老师为学生教材签名)

IMG_20160601_190800

(2016年6月1日晚 期末考试现场)

课程简介

课程名称:《大数据处理技术》(备注:之前名称为“大数据技术基础”,从2016年开始改名为“大数据处理技术”)

课程性质:校级研究生选修课

面向对象:校级选修课,面向全校各院系研究生同学开放,欢迎并建议计算机相关专业研究生同学选修

课程难度:入门级,零基础(课程采用林子雨编著的入门级精品教材,丰富的教材配套资源帮助学生实现“零基础”学习大数据)

授课教师:林子雨

开课学期:2016年春季学期(2月到6月)

课程学时:每周2节,共16周,32学时,2学分

上课时间:每周三晚上7点10分 两节课

上课教室:海韵教学楼208教室

课程助教:厦门大学数据库实验室2014级硕士研究生罗道文同学(E-mail: ldw972949726@163.com)

班级主页:https://dblab.xmu.edu.cn/post/5543/

课程紧紧围绕“构建知识体系、阐明基本原理、引导初级实践、了解相关应用”的指导思想,对大数据知识体系进行系统梳理,做到“有序组织、去粗取精、由浅入深、渐次展开”。课程共分四大部分,包括大数据基础篇、大数据存储篇、大数据处理与分析篇和大数据应用篇。在大数据基础篇中,第一章介绍大数据的基本概念和应用领域,并阐述大数据、云计算和物联网的相互关系;第二章介绍大数据处理架构Hadoop,由于Hadoop已经成为应用最为广泛的大数据技术,因此,本课程的大数据相关技术主要围绕Hadoop展开,包括Hadoop MapReduce、HDFS和HBase,因此,该章是后面其他章节(第三、四、七章)内容的基础。在大数据存储篇中,用五个章节(第三、四、五、六章)的内容,分别介绍了大数据存储相关技术的概念与原理,包括分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库和云数据库。在大数据处理与分析篇,首先在第七章介绍了大数据处理和分析的核心技术——分布式并行编程模型MapReduce,然后,在第八章和第九章分别介绍了大数据时代两种新兴的数据分析技术——流计算和图计算,最后在第十章简单介绍了可视化技术。在大数据应用篇,用三章(第十一、十二、十三)内容介绍了大数据在互联网、生物医学和物流等各个领域的典型应用。

大数据处理技术2016春季学期班级选课微信宣传片.png

点击这里观看选修课微信宣传片

欢迎选修大数据处理技术2016班级微信宣传片

扫一扫手机观看微信宣传片

 教师简介

厦门大学,计算机科学系,数据库实验室,林子雨

林子雨,男,1978年出生,博士(毕业于北京大学),现为厦门大学计算机科学系助理教授(或者“讲师”),海峡云计算与大数据应用研究中心副主任。中国高校首个“数字教师”提出者和建设者,O2O大数据教学理念提出者和践行者,中国高校首个大数据课程公共服务平台建设者,厦门大学数据库实验室负责人,厦门大学云计算与大数据研究中心主要建设者和骨干成员。于2001年获得福州大学水利水电专业学士学位,2005年获得厦门大学计算机专业硕士学位,2009年获得北京大学计算机专业博士学位。主要研究方向为数据库、数据仓库、数据挖掘、大数据、云计算和物联网,并以第一作者身份在《软件学报》《计算机学报》和《计算机研究与发展》等国家重点期刊以及国际学术会议上发表多篇学术论文。主讲厦门大学本科生课程《数据库系统原理》、《C语言程序设计》、《计算机基础》和和研究生课程《分布式数据库》、《大数据技术基础》,在教学过程中形成班级网站、结课仪式、师生互动等创新性教学模式方法,志愿编写了多本服务计算机系全体教师教学工作的教学指南;因在教学领域的突出贡献和学生的认可,成为2013年度厦门大学教学类奖教金获得者,并获得由厦门大学计算机系12级全体硕士研究生集体赠送的“铭记师恩牌匾”。志愿编写并免费发布了大数据专业教材《大数据技术基础》电子书,编著出版了中国高校第一本系统介绍大数据知识的专业教材《大数据技术原理与应用》,并建立了中国高校首个大数据课程公共服务平台,为高校教师开展大数据教学、学生学习大数据课程提供一站式服务。2009年从事教师职业以来,通过“数字教师”大平台,累计免费网络发布超过100万字研究资料,网络浏览量超过100万次。具有丰富的政府和企业信息化培训经验,曾先后给中国移动通信集团公司、福州马尾区政府、福建省物联网科学研究院、石狮市物流协会、厦门市物流协会、福建龙岩卷烟厂、泉州市中小企业等多家单位和企业开展信息化培训,累计培训人数达2000人以上。

示范班级

林子雨主讲厦门大学研究生课程《大数据处理技术》是“中国高校大数据课程公共服务平台”重点打造的示范班级,全程严格执行“林子雨精品大数据公开课六大质量标准”,旨在努力打造高校大数据教学实践标杆。

示范班级全程践行O2O教学理念,提供线上线下完整教学服务,学生在获得良好现场教学体验的同时,可以通过班级网站获得全方位课程指导和服务。示范班级标准元素包括:班级主页、微信群、标准教室、精心备课、精彩讲解、优雅形象、标准音质、完整服务、班级活动、班级合影、结课仪式等。

林子雨精品大数据公开课六大质量标准

班级学生名单(共33人)

祝涛、方泽鹏、冯辉、李瑞、林伟、阮榕城、唐伟杰、王路、王永、熊富海、张俊强、张谋钊、陈继文、陈立、邓称浩、黄洁、李根、李汉乾、刘癸新、栾华高、骆欣、癿春光、盛怿寒、薛倩、杨杰、杨颖、游乔贝、周熊、朱婷婷、谷华升、蔡志标、林晨晗、李寒

公告板

发布时间 内容
2015年12月22日 班级主页开通,选课宣传微信短片发布(MAKA软件制作)
2015年12月28日 制作张贴选课海报到学院行政楼门口
2016年1月14日 林子雨老师开始备课,制作全新教学PPT,整合最新大数据知识,完善大数据课程学生服务站各种资料
2016年2月14日 新学期已经于今天正式开学,本学期每周三晚7点海韵教学楼208教室上课,欢迎对大数据感兴趣的同学选修
2016年2月17日 今晚第一堂课正式开讲,本学期将在课堂同步录制在线课程视频,经过后期制作后,免费发布共享
2016年2月24日 根据第一章授课录音和PPT进行后期合成得到的第一章在线课程视频,已经发布,请点击这里访问在线课程视频
2016年2月24日 今晚是第二次课,顺利结束,完成了第二章大数据处理架构的讲解。请到“课后作业”栏目中下载作业说明。
2016年2月29日 根据第二章授课录音和PPT进行后期合成得到的第二章在线课程视频,已经发布,请点击这里访问在线课程视频
2016年3月2日 讲完第3章,今晚有研究生院派来的冯老师来现场听课。贵州师大杨柳老师也来旁听课程。
2016年3月3日 第三章分布式文件系统HDFS 在线课程视频已经制作发布,请点击这里访问在线课程视频
2016年3月10日 第四章分布式数据库HBase在线课程视频已经制作发布,请点击这里访问在线课程视频
2016年3月17日 第五章NoSQL数据库在线课程视频已经制作发布,请点击这里访问在线课程视频
2016年3月24日 第六章云数据库在线课程视频已经制作发布,请点击这里访问在线课程视频
2016年3月31日 第7章MapReduce在线课程视频已经制作发布,请点击这里访问在线课程视频
2016年4月3日 接下来的七章内容会和教材上的章节顺序有些差别。2015年8月1日出版发行的《大数据技术原理与应用》教材(第一版)共13章,针对2015、2016年大数据技术的新发展,2016年林子雨老师为教材新增了三个章节(将在下一版教材中放入教材),新增第14章基于Hadoop的数据仓库Hive、第15章Hadoop架构再探讨、第16章Spark,接下来会优先讲解新增的第14章、第15章和第16章内容,《大数据技术原理与应用》教材(第一版)中的第8章流计算、第9章图计算、第10章数据可视化、第11章大数据在互联网领域的应用——推荐系统,将放在后面讲解。
2016年4月6日 今晚讲完了教材新增的第14章基于Hadoop的数据仓库Hive,请到“大数据课程学生服务站”下载讲义PPT。另外,本章配套有学习指南,详细介绍了Hive安装配置和编程实践,欢迎到大数据课程学生服务站的学习指南栏目查看。
2016年4月7日 教材新增的第14章基于Hadoop的数据仓库Hive,属于2016年林子雨新编写的章节,不在第1版教材中,请点击这里下载本章教材PDF格式电子书。本章授课视频已经发布,欢迎点击这里观看
2016年4月13日 教材新增的第15章Hadoop架构再探讨,属于2016年林子雨新编写的章节,不在第1版教材中,请点击这里下载本章教材PDF格式电子书。本章授课视频已经发布,欢迎点击这里观看
2016年4月20日 教材新增的第16章Spark,属于2016年林子雨新编写的章节,不在第1版教材中,请点击这里下载本章教材电子书。本章授课视频已经发布,欢迎点击这里观看
2016年4月27日 今晚讲完了教材第8章流计算,讲义PPT已经更新,请到“大数据课程学生服务站”下载讲义PPT。本章授课视频已经发布,欢迎点击这里观看
2016年5月4日 今晚讲完了教材第9章图计算,讲义PPT已经更新,请到“大数据课程学生服务站”下载讲义PPT。本章授课视频已经发布,欢迎点击这里观看
2016年5月11日 今晚讲完了第13讲大数据在不同领域的应用,包含教材第11章、12章和13章的内容。下周复习和答疑。
2016年5月17日 期末考试安排在第16周6月1日周三晚上随堂考,教室就是平时上课的教室,请认真做好复习。
2016年6月2日 6月1日晚期末考试顺利结束,6月2日上午试卷批改结束,6月2日下午,期末最终成绩录入研究生系统并发布,本课程顺利结束!

课程进度表

(备注:课堂讲解的第一章到第七章,和教材章节顺序一致,但是,从第七章MapReduce结束以后,课堂内容会和教材上的章节顺序有些差别。2015年8月1日出版发行的《大数据技术原理与应用》教材(第一版)共13章,针对2015、2016年大数据技术的新发展,2016年林子雨老师为教材新增了三个章节(将在下一版教材中放入教材),新增第14章基于Hadoop的数据仓库Hive、第15章Hadoop架构再探讨、第16章Spark,接下来会优先讲解新增的第14章、第15章和第16章内容,《大数据技术原理与应用》教材(第一版)中的第8章流计算、第9章图计算、第10章数据可视化、第11章大数据在互联网领域的应用——推荐系统,将放在后面讲解)。

次数 日期 内容
1 2016年2月17日周三晚上7点10分到9点10分 课程介绍

第1章 大数据概述

2 2016年2月24日周三晚上7点10分到9点10分 第2章 大数据处理架构Hadoop
3 2016年3月2日周三晚上7点10分到8点50分 第3章 分布式文件系统HDFS
4 2016年3月9日周三晚上7点10分到9点10分 第4章 分布式数据库HBase
5 2016年3月16日周三晚上7点10分到8点50分 第5章 NoSQL数据库
6 2016年3月23日周三晚上7点10分到9点10分 第6章云数据库
7 2016年3月30日周三晚上7点10分到9点0分 第7章MapReduce
8 2016年4月6日周三晚上7点10分到9点10分 教材新增章节,第14章基于Hadoop的数据仓库Hive(下载电子书
9 2016年4月13日周三晚上7点10分到9点15分 教材新增章节,第15章Hadoop架构再探讨(下载电子书
10 2016年4月20日周三晚上7点10分到9点25分 教材新增章节,第16章Spark(下载电子书
11 2016年4月27日周三晚上7点10分到9点30分 第8章流计算
12 2016年5月4日周三晚上7点10分到9点30分 第9章图计算
13 2016年5月11日周三晚上7点10分到8点50分 第11章、12章和13章,大数据在不同领域的应用
14 2016年5月17日周三晚上 期末复习说明
15 2016年5月24日周三晚上 答疑
16 2016年6月1日周三晚上 期末考试

讲义PPT下载

请到“大数据课程学生服务站”下载最新版的讲义PPT。

大数据课程学生服务站:为学生学习大数据课程提供一站式服务,包括教材配套讲义PPT、教材配套学习指南、 教材配套上机练习题目、进阶学习、拓展阅读材料等。

课后作业

课后作业的形式是,同学下载作业说明,然后按照作业要求进行上机实践,并撰写电子版上机实验报告(WORD文档),并在指定日期之前发送给本班级助教罗道文同学(E-mail:ldw972949726@163.com)。上机报告的格式模板,已经包含在作业说明中,请单独拷贝出来放在一个新的WORD文档中,做成上机实验报告。

上机实验报告里面的具体内容,没有固定的格式,只要能够把自己上机操作的过程描述清楚,并放上一些运行过程和结果的截图,让老师能够看到确实完成了各个实验步骤,并且成功实现了实验预期效果。作业提交日期以本网页为准

章节 作业名称 作业下载 作业提交时间
第1章 大数据概述 无作业
第2章 大数据处理架构Hadoop 习题2-1 安装Hadoop 下载 2016年3月2日星期三下午5点之前提交给助教
第3章 分布式文件系统HDFS 习题3-2 HDFS Java API编程实践 下载 2016年3月9日星期三下午5点之前提交给助教
第4章 分布式数据库HBase 习题4-2 HBase Shell命令和Java API编程实践 下载 2016年3月16日星期三下午5点之前提交给助教
第5章 NoSQL数据库 习题5-2 熟悉MongoDB的基本操作 下载 2016年3月23日星期三下午5点之前提交给助教
第6章云数据库 无作业
第7章MapReduce 习题7-3 编写MapReduce程序实现词频统计 下载 2016年4月6日星期三下午5点之前提交给助教
第8讲第14章基于Hadoop的数据仓库Hive 无作业
第9讲第15章Hadoop架构再探讨 无作业
第10讲第16章Spark 无作业

在线课程视频

祝贺厦门大学林子雨老师主讲《大数据技术原理与应用》课程,入选第一批“全国工程硕士专业学位研究生教育在线课程建设项目”名单(查看新闻报道)。2016春节学期,林子雨老师将一边给厦门大学研究生授课,一边录制制作在线课程,并发布到数据库实验室建设的“中国高校大数据课程公共服务平台”上,免费观看。请点击这里访问在线课程视频

入门级大数据在线课程条幅

点击这里进入林子雨主讲入门级大数据在线课程

课程教材

为了更好促进国内高校大数据课程教学,厦门大学计算机科学系助理教授林子雨博士编写了入门级大数据教材《大数据技术原理与应用》。

大数据之门

该教材由人民邮电出版社出版发行,2015年8月正式在当当、京东、淘宝、亚马逊等各大网店上架销售,并成为畅销书籍。近几年的教学实践证明,目前市场已 有的各类其他书籍,大都偏于技术,比较适合作为深入学习的工具书来使用,不适合作为高校本科和研究生教学的教材。高校教学应更加侧重理论层面的教学,即对 大数据领域知识体系的普及和背后原理的阐述,而非让学生深入学习和实践某一种大数据技术。从这个角度来说,《大数据技术原理与应用》是国内高校第一本系统介绍大数据知识的专业教材,也是第一本适合用于本科和研究生教学的入门级教材。

林子雨-大数据技术原理与应用教材封面2015年6月1日

学生服务站

大数据课程学生服务站”是厦门大学数据库实验室全力打造的“中国高校大数据课程公共服务平台”的3号子工程。

中国高校大数据课程公共服务平台LOGO(图上文下)

大数据课程学生服务站”为学生学习大数据课程提供课程教材、讲义PPT、技术资料、进阶学习指南等全方位、一站式服务,帮助学生形成知识体系、开展基本编程实践、明确进阶学习方向,提高学习效率,提升学习效果。(欢迎点击这里访问“大数据课程学生服务站”

大数据课程学生服务站LOGO

课程助教

2016春季学期大数据处理技术班级的课程助教,由厦门大学数据库实验室2014级硕士研究生罗道文同学担任,E-mail: ldw972949726@163.com。

罗道文

2016大数据助教微信群答疑1

(图  助教在线解答同学问题)

班级相册

为学生留下最美的课堂记忆。下面是2013大数据班级合影。

厦门大学,林子雨,大数据技术基础