林子雨主讲《大数据技术原理与应用》2021班级主页

本班级是“高校大数据课程公共服务平台”的九大工程中的“6号子工程”

全力打造全国高校大数据教学示范班级

厦门大学计算机系本科生专业选修课

《大数据技术原理与应用》2021班级主页

时间地点:1到15周每周三下午7、8节  两节课 厦大海韵教学楼206

主讲人:厦门大学计算机科学系  林子雨  博士/副教授

(E-mail: ziyulin@xmu.edu.cn, 个人主页:https://dblab.xmu.edu.cn/post/linziyu)


课程简介|教师简介|示范班级|公告板|学生服务站|课程教材|讲义PPT下载|课后作业|教学大纲|课程进度表|在线课程视频| 推荐阅读 |班级相册


(扫一扫手机访问本主页)

课程简介

课程名称:《大数据技术原理与应用》

课程性质:厦门大学计算机系本科生专业选修课

面向对象:面向厦门大学计算机相关专业本科生同学开放,欢迎并建议计算机相关专业本科生同学选修

课程难度:入门级,零基础(课程采用林子雨编著的入门级精品教材,丰富的教材配套资源帮助学生实现“零基础”学习大数据)

授课教师:林子雨

开课学期:2021年春季学期(2021年2月到6月)

课程学时:每周2节,共16周,32学时,2学分

上课时间:每周三下午7、8节  两节课

上课教室:厦大海韵教学楼206

上课形式:线上线下混合教学

成绩计算方式:平时成绩(20%)、线上考核成绩(占30%)、期末考试成绩(占50%)加权求和。

课程助教:厦门大学计算机系2020级硕士研究生刘官山同学(E-mail: 1055475321@qq.com)

教师简介

林子雨,男,1978年出生,博士(毕业于北京大学),现为厦门大学计算机科学系副教授,厦门大学信息学院实验教学中心主任,曾任厦门大学信息科学与技术学院院长助理、晋江市发展和改革局副局长。中国计算机学会数据库专业委员会委员,中国计算机学会信息系统专业委员会委员。国内高校首个“数字教师”提出者和建设者,厦门大学数据库实验室负责人,厦门大学云计算与大数据研究中心主要建设者和骨干成员,2013年度和2017年度厦门大学教学类奖教金获得者,荣获2017年福建省精品在线开放课程、2018年厦门大学高等教育成果特等奖、2018年福建省高等教育教学成果二等奖和2018年国家精品在线开放课程。主要研究方向为数据库、数据仓库、数据挖掘、大数据、云计算和物联网,并以第一作者身份在《软件学报》《计算机学报》和《计算机研究与发展》等国家重点期刊以及国际学术会议上发表多篇学术论文。作为项目负责人主持的科研项目包括1项国家自然科学青年基金项目(No.61303004)、1项福建省自然科学青年基金项目(No.2013J05099)和1项中央高校基本科研业务费项目(No.2011121049),主持的教改课题包括1项2016年福建省教改课题和1项2016年教育部产学协作育人项目,同时,作为课题负责人完成了国家发改委城市信息化重大课题、国家物联网重大应用示范工程区域试点泉州市工作方案、2015泉州市互联网经济调研等课题。中国高校首个“数字教师”提出者和建设者,2009年至今,“数字教师”大平台累计向网络免费发布超过500万字高价值的研究和教学资料,累计网络访问量超过500万次。打造了中国高校大数据教学知名品牌,编著出版了中国高校第一本系统介绍大数据知识的专业教材《大数据技术原理与应用》,并成为京东、当当网等网店畅销书籍;建设了国内高校首个大数据课程公共服务平台,为教师教学和学生学习大数据课程提供全方位、一站式服务,年访问量超过100万次。

示范班级

林子雨主讲厦门大学研究生课程《大数据处理技术》是“中国高校大数据课程公共服务平台”重点打造的示范班级,全程严格执行“林子雨精品大数据公开课六大质量标准”,旨在努力打造高校大数据教学实践标杆。

示范班级全程践行O2O教学理念,提供线上线下完整教学服务,学生在获得良好现场教学体验的同时,可以通过班级网站获得全方位课程指导和服务。示范班级标准元素包括:班级主页、标准教室、精心备课、精彩讲解、优雅形象、标准音质、完整服务、班级活动、班级合影等。

林子雨精品大数据公开课六大质量标准

班级学生名单(69人)

李少鹏 黄茹滢 孙艺洲 常少哲 董莹 杜云起 傅亮 龚子玉 郭龙 何妍 胡子潇 黄桂闽 黄国文 黄俊尧 黄志凌 金珂年 李超然 李梦然 李天正 李梓萌 廖兴宇 林高鑫 林毓灵 林正昊 刘岱瀛 卢思帆 吕尤 宁竞元 彭琼 彭筱琛 邱宇航 宋宗宝 谭心怡 王环 王伦磊 王思伟 王思迅 王颖颖 王泽宇 王子佳 翁昊亮 吴朱冠宇 向姝 谢成鑫 熊若凡 徐程 徐惠三 许彦妮 杨浩 于利博 余子祥  曾祥钰 张加辉 张晶瑾 张逸辰 章心怡 郑伟华 郑希颖 郑祎航 郑益源 钟康贞 钟淇越 周宗涛 庄震丰  丁飞燕 黄海龙 王辰洋 马远帆 牛洁

公告板

发布时间 内容
2021年1月30日 班级主页正式发布
2021年5月31日 《大数据技术原理与应用》本周三(6月2日)下午78节是在线课程,不用来教室上课。本周的在线课程任务是,完成所有剩余章节的学习,并完成单元测验和期末在线考试。所有在线测验和期末在线考试必须在6月4日晚11点之前完成。超过时间点,将无法参加在线测验和考试。

教学大纲

章(或节) 主要内容 学时安排
第1章 大数据概述 介绍大数据的基本概念和应用领域,并阐述大数据、云计算和物联网的相互关系 4
第2章 分布式计算框架Hadoop 介绍大数据处理架构Hadoop 4
第3章 分布式文件系统HDFS 分布式文件系统HDFS的基本原理和使用方法 4
第4章 分布式数据库HBase 分布式数据库HBase的基本原理和使用方法 4
第5章 NoSQL数据库 NoSQL数据库的概念和基本原理 2
第6章 云数据库 云数据库的概念和基本原理 2
第7章 MapReduce 分布式并行编程模型MapReduce原理和使用方法 4
第8章 Hadoop Hadoop架构再探讨 2
第9章 Spark Spark原理与基础编程 4
第10章 推荐系统 大数据在互联网领域的典型应用:推荐系统 2
合计 32

课程进度表

次数 日期 内容
1 2021年3月3日周三下午78节 线上课程,看视频
第1章 大数据概述
2 2021年3月10日周三下午78节 线上课程,看视频
第2章 大数据处理架构Hadoop
3 2021年3月17日周三下午78节 教室上课
第2章 大数据处理架构Hadoop
第3章 分布式文件系统HDFS 讲到块的概念
4 2021年3月24日周三下午78节 教室上课
第3章分布式文件系统HDFS讲完
5 2021年3月31日周三下午78节 教室上课
第4章 分布式数据库HBase讲到4.5.1 HBase系统架构
6 2021年4月7日周三下午78节 教室上课
第4章 分布式数据库
7 2021年4月14日周三下午78节 线上观看视频
第5章 NoSQL数据库
8 2021年4月21日周三下午78节 线上观看视频
第6章 云数据库
9 2021年4月28日周三下午78节 教室上课
第7章MapReduce
10 2021年5月5日周三下午78节 线上观看视频
第8章 Hadoop再探讨
第9章 数据仓库Hive
11 2021年5月12日周三下午78节 线上观看视频
第11章流计算
第12章Flink
12 2021年5月19日周三下午78节 教室上课
第10章 Spark
13 2021年5月26日周三下午78节 教室上课
第10章 Spark
14 2021年6月2日周三下午78节 线上观看视频
第13章 图计算和第14章大数据在不同领域的应用
5月20日-6月5日在线期末考试
15 2021年6月9日周三下午78节 期末考试,随堂考

讲义PPT下载

《大数据技术原理与应用(第3版)》教材配套讲义PPT,请点击这里下载

课后作业

课后作业的形式是,同学下载作业说明,然后按照作业要求进行上机实践,并撰写电子版上机实验报告(WORD文档),并在指定日期之前发送给本班助教同学。上机报告的格式模板,已经包含在作业说明中,请单独拷贝出来放在一个新的WORD文档中,做成上机实验报告。

上机实验报告里面的具体内容,没有固定的格式,只要能够把自己上机操作的过程描述清楚,并放上一些运行过程和结果的截图,让老师能够看到确实完成了各个实验步骤,并且成功实现了实验预期效果。作业提交日期以本网页为准

章节 作业名称 作业内容 作业提交时间
  期末大作业 大数据课程实验案例:网站用户行为分析 ***之前把实验报告WORD文件发送给助教邮箱wjzhou@stu.xmu.edu.cn

在线课程视频

林子雨主讲的全套大数据课程视频(观看),课程内容涵盖大数据、云计算和物联网概念及其相互关系、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、图计算、流计算、基于内存的大数据处理框架Spark、基于Hadoop的数据仓库Hive、流计算框架Flink、大数据在不同领域的应用等。在线课程荣获“2018年国家精品在线开放课程”和“2020年国家级线上一流本科课程”。

课程教材

本课程教材是林子雨编著《大数据技术原理与应用(第3版)》(教材官网)。

为了更好促进国内高校大数据课程教学,厦门大学计算机科学系副教授林子雨博士编写了入门级大数据教材《大数据技术原理与应用》(官网),荣获“2017年福建省本科优秀特色教材”。该教材由人民邮电出版社出版发行,2015年8月第1版正式在当当、京东、淘宝、亚马逊等各大网店上架销售,并成为畅销书籍。2017年1月第2版教材正式在各大网店销售。2021年1月第3版教材上市销售。《大数据技术原理与应用》是国内高校第一本系统介绍大数据知识的专业教材,也是第一本适合用于本科和研究生教学的入门级教材。截至2021年1月,教材累计销量超过14万册,2020年单年销量超过4万册,被国内300多所高校作为开课教材。

(第3版教材及其配套实验指导书)

《大数据基础编程、实验和案例教程(第2版)》(官网)是林子雨编著《大数据技术原理与应用(第3版)》教材(官网)的配套实验指导书。《大数据技术原理与应用(第3版)》侧重于大数据知识框架和理论介绍,而本教程侧重于介绍大数据软件的安装、使用和基础编程方法,并提供了大量实验和案例。由于大数据软件都是开源软件,安装过程一般比较复杂,也很耗费时间。为了尽量减少读者搭建大数据实验环境时的障碍,笔者在本教程中详细写出了各种大数据软件的详细安装过程,可以确保读者顺利完成大数据实验环境搭建。

学生服务站

大数据课程学生服务站”为学生学习大数据课程提供课程教材、讲义PPT、技术资料、进阶学习指南等全方位、一站式服务,帮助学生形成知识体系、开展基本编程实践、明确进阶学习方向,提高学习效率,提升学习效果。(欢迎点击这里访问“大数据课程学生服务站”

推荐阅读

文章题目 访问链接
写给大数据开发初学者的话 查看
大数据到底怎么学:数据科学概论与大数据学习误区 查看
如何区分大数据下的三大利器:数据科学家,数据工程师与数据分析师 查看
国内互联网公司机器学习数据挖掘类的职位面试主要考察什么方面的东西? 查看
大数据时代,统计学方法有多大的效果? 查看
大数据时代,统计学还有用吗? 查看

课程助教

2020春季学期《大数据技术原理与应用》本科生班级的课程助教,厦门大学计算机系2020级硕士研究生刘官山同学(E-mail: 1055475321@qq.com)。

班级相册

为学生留下最美的课堂记忆。