大数据课程教师服务站

中国高校大数据课程公共服务平台LOGO(图上文下)

本服务站是“中国高校大数据课程公共服务平台”的九大工程中的“2号子工程”

大数据课程教师服务站:为教师开展大数据课程教学工作免费提供一站式服务

建设者:厦门大学计算机科学系  林子雨 博士/助理教授

(E-mail: ziyulin@xmu.edu.cn, 个人主页:http://www.cs.xmu.edu.cn/linziyu)

(版权声明:本平台所有资源有版权,请勿用于商业用途)

%e5%a4%a7%e6%95%b0%e6%8d%ae%e6%95%99%e5%b8%88%e5%9f%b9%e8%ae%ad%e7%8f%ad%e6%8a%a5%e5%90%8d%e5%9b%be%e7%89%87

欢迎报名参加全国高校大数据课程教师2017寒假培训交流班(2017年1月16日到22日林子雨主讲)


服务站功能|发起人|教师QQ交流群|教学资料下载|推荐教材|在线课程视频|教学经验|保障团队|常见问题|联系人

开课申请表 | 教学大纲 | 教学进度表

教材配套讲义PPT|教材配套大数据软件安装和编程实践指南|教材配套教师备课指南| 教材配套机房上机实验指南|大数据实验平台

教材配套课后上机练习题目|进阶学习|电子书籍下载|拓展阅读材料|林子雨主讲大数据课程示范班级

高校大数据专业建设相关精华文章和资源集锦 | Spark入门教程

大数据课程综合实验案例:网站用户购物行为分析


大数据课程教师服务站

扫一扫手机访问本网页

 服务站功能

“大数据课程教师服务站”为中国高校从事大数据课程教学的教师,提供备课指南、课程教材、讲义PPT、课程习题、经验交流、技术资料等全方位、一站式服务,减轻教师备课负担,提高备课效率,促进经验交流,提升教学水平,促进中国高校大数据课程教学不断发展。

本服务站将不断更新各种资料,并发布来自大数据教学一线教师的教学心得和经验总结,欢迎保持对本站的关注,希望本站成为高校教师开展教学工作的好帮手!同时,也欢迎您把您的宝贵教学心得发送至林子雨老师邮箱ziyulin@xmu.edu.cn,向您表示衷心的感谢。

大数据课程教师服务站LOGO1

 

发起人和负责人

林子雨,男,1978年出生,北京大学博士,现为厦门大学计算机科学系教师,海峡云计算与大数据应用研究中心副主任,获得2013年度厦门大学教学类奖教金,中国高校首个“数字教师”的提出者和建设者。研究领域包括数据库、数据仓库、大数据、云计算和物联网。主持或参与了包括国家自然科学基金、863计划在内的多项国家重点科研项目,并以第一作者身份在《计算机学报》《软件学报》和《计算机研究与发展》等国家重点期刊以及国际学术会议上发表多篇学术论文;编著出版中国高校第一本系统介绍大数据知识的专业教材《大数据技术原理与应用》,编著并免费发布了中国高校第一本闪存数据库研究专著《闪存数据库概念与技术》。曾作为志愿者在国内第一个翻译了Google SpannerBigTable和《Architecture of a Database System》等大量英文学术资料,与广大网友分享,深受欢迎。2013年在厦门大学开设《大数据技术基础》课程,并因在教学领域的突出贡献和学生的认可,成为2013年度厦门大学教学类奖教金获得者。

更多信息请访问林子雨个人主页:http://www.cs.xmu.edu.cn/linziyu

 

推荐教材

本服务站由厦门大学计算机科学系助理教授林子雨博士总负责,并推荐高校教师在大数据入门课程的教学中使用林子雨博士编著的入门级大数据教材《大数据技术原理与应用》,欢迎访问该教材官网,获取教材配套讲义PPT(可编辑格式)。

林子雨在数据库、数据仓库、数据挖掘、大数据、云计算和物联网等领域有着十多年的知识积累,对各个领域知识都有比较深入的了解,在政府发改部门的两年挂职期间对大量企业的调研,使其形成了比较宽泛的视野和对产业的深入了解。

2013年9月,由林子雨主讲的厦门大学计算机科学系研究生课程《大数据技术基础》正式开课。由于当时国内尚未出现适合本科和研究生教学的大数据专业教材,林子雨结合自身研究成果,并调研大量网络资料,历时半年编写完成了免费开源的课程讲义,发布到网络上,受到广大网友好评。

2014年开始,历时一年多时间,林子雨系统总结理论研究成果和教学实践经验,将相关大数据知识综合成一本适合本科和研究生教学的教材——《大数据技术原理与应用》。该教材由人民邮电出版社出版发行,2015年8月正式在当当、京东、淘宝、亚马逊等各大网店上架销售,并成为畅销书籍。近几年的教学实践证明,目前市场已有的各类其他书籍,大都偏于技术,比较适合作为深入学习的工具书来使用,不适合作为高校本科和研究生教学的教材。高校教学应更加侧重理论层面的教学,即对大数据领域知识体系的普及和背后原理的阐述,而非让学生深入学习和实践某一种大数据技术。从这个角度来说,《大数据技术原理与应用》是国内高校第一本系统介绍大数据知识的专业教材,也是第一本适合用于本科和研究生教学的入门级教材。

林子雨-大数据技术原理与应用教材封面2015年6月1日

在线课程视频

1门在线课程:即“大数据技术原理与应用在线课程”,开辟网络大数据课程讲授平台;本在线视频课程由厦门大学计算机科学系林子雨老师主讲,为入门级大数据课程,适合大数据初学者。目前已经完成录制的在线视频课程包括入门级大数据公开课(知识体系型)和入门级大数据公开课(专题技术型)。入门级大数据公开课(知识体系型),旨在帮助学生形成对大数据知识体系及其应用领域的轮廓性认识,为学生在大数据领域“深耕细作”奠定基础、指明方向。课程内容涵盖大数据、云计算和物联网概念及其相互关系、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库和分布式并行编程模型MapReduce。入门级大数据公开课(专题技术型),是针对某个技术专题做深入讲解(包括MapReduce技术专题、HBase技术专题、Hadoop技术专题、NoSQL技术专题等),比如1.5个小时讲解分布式并行编程框架MapReduce,或者1.5个小时讲解分布式数据库HBase等。

入门级大数据在线课程条幅

点击这里进入林子雨主讲入门级大数据在线课程

教师交流群

大数据课程教师交流群(QQ群号: 461510122)主要提供以下功能:

(1)为中国高校从事大数据课程教学的教师提供沟通交流渠道,彼此分享教学资料、教学经验,互相解答教学和技术疑难问题,提升教学水平,促进中国高校大数据课程教学不断发展。

(2)灵活组建大数据培训讲师团队,开拓企业培训市场:根据企业培训需求,设置定制化培训课程。由于每个老师只熟悉一部分课程的知识,通常全部课程无法由一个或两个老师来完成,通过本群,可以联合群中具备相关课程讲授能力的教师,灵活组合形成培训讲师团队,满足各种不同的企业培训需求。(企业培训案例:2015福建龙岩卷烟厂大数据技术培训班

大数据课程教师交流群LOGO

点击这里进入大数据课程教师交流群

教学资料下载

(1)与教材配套的教学必备材料

资料名称 说明 下载
教学大纲 与林子雨编著《大数据技术原理与应用》教材配套的教学大纲 下载
讲义PPT 与林子雨编著《大数据技术原理与应用》教材配套的讲义PPT(可编辑格式,其他高校老师可以自由修改PPT内容) 下载
备课指南 与林子雨编著《大数据技术原理与应用》教材配套的教师备课指南,会记录林子雨备课过程的各种细节和心得,辅助其他教师顺利快速完成备课。 查看
课后上机习题 用于学生自己在宿舍或实验室进行自己上机练习,与林子雨编著《大数据技术原理与应用》教材配套。为了读者更好地消化理解林子雨编著《大数据技术原理与应用》教材的内容,厦门大学数据库实验室为该教材的每个章节都精心设计了上机练习题目,相关上机练习题目都包含了入门级的软件安装和使用指导,让学生在学会基础使用方法后,再去完成相关作业内容。 下载
机房上机实验指南 用于在机房统一进行的学生上机实验课,比如一个下午连续4节上机实验课,本套题目专门针对林子雨编著《大数据技术原理与应用》教材设计。包括全套实验题目和答案。 下载
学习指南 “学习指南”的用途】读者在使用林子雨编著《大数据技术原理与应用》教材时,只看教材,只能较好学习完成理论层面的内容,由于教材撰写必须本着精练的原则,无法对技术层面的操作细节面面俱到,因此,一些具体大数据技术的实践操作,如果只有教材,是无法顺利完成的。为了让读者能够顺利完成教材上相关大数据技术的上机实践,因此,厦门大学数据库实验室制作了与教材各个章节配套的学习指南,指南中会对如何实践相关大数据技术进行详细的说明。 查看
授课视频 与林子雨编著《大数据技术原理与应用》教材每个章节配套的教学视频,林子雨主讲,在线免费观看,支持手机和电脑等多种方式访问 查看
大数据实验平台 上机实践是高校大数据教学必不可少的重要环节,可以帮助学生更好消化吸收课程内容、提高学生动手能力、激发学生学习兴趣 。大数据实验平台旨在精心打造针对高校教学和科研工作量身定制的大数据实验平台,满足课程上机实验、课程设计、实习实训、科研训练等多方面需求。 查看
大数据综合实验案例 “大数据课程实验案例:网站用户行为分析”V1.0版本,正式上线发布,免费向全国高校共享。本案例旨在满足全国高校大数据教学对实验案例的迫切需求,案例采用2000万条网站用户购物数据集,涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用方法。案例适合高校(高职)大数据教学,可以作为学生学习大数据课程后的综合实践案例。 查看


(2)进阶学习

进阶学习这个部分的内容,不在《大数据技术原理与应用》教材之内,是为了拓展大家对大数据知识的认识而增加的学习内容。

标题 内容 下载
Hadoop架构再探讨 Hadoop版本和生态系统组件、Hadoop集群配置、从Hadoop1.0到Hadoop2.0、YARN、HDFS HA和Federation、Hadoop在企业中的应用、企业实战案例 下载
Hadoop上的数据仓库Hive初级实践教程 Hive是Facebook开发的构建于Hadoop集群之上的数据仓库应用,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。本教程介绍了Hive概况、安装、配置、常用HiveQL操作和Hive简单编程实践。 下载WORD版

网页版

Spark快速入门指南 – Spark的安装与基础使用 Apache Spark 是一个新兴的大数据处理通用引擎,提供了分布式的内存抽象。Spark 正如其名,最大的特点就是快(Lightning-fast),可比 Hadoop MapReduce 的处理速度快 100 倍。此外,Spark 提供了简单易用的 API,几行代码就能实现 WordCount。本教程主要参考官网快速入门教程,介绍了 Spark 的安装,Spark shell 、RDD、Spark SQL、Spark Streaming 等的基本使用。 下载WORD版本

网页版

 

(3)参考电子书籍下载

(从网络上收集整理了大数据领域相关电子书PDF,供教师学习大数据知识使用。由于涉及到著作权,这些电子书不能在本网站直接提供下载,请加入林子雨老师发起的“大数据课程教师交流群” QQ群号461510122点击这里看看群中已经有哪些成员),该群提供相关电子书下载,仅供教学交流之用,请勿在网上随意传播。如果要加入该QQ群,请事先发送电子邮件联系林子雨老师(ziyulin@xmu.edu.cn)。

名称 作者/出版社/时间 内容 QQ群中的电子书文件名 分享者
《大数据时代》 维克托.迈尔 舍恩伯格 著

盛杨燕 周涛 译

浙江人民出版社,2012年12月

大数据时代流传最广的一本普及性书籍,属于管理类而非技术类书籍,通俗易懂,一书读懂大数据对人类社会的深刻影响 大数据时代.pdf 厦门大学计算机系林子雨
 《Hadoop实战》  陆嘉恒,机械工业出版社,2011年9月  介绍Hadoop、MapReduce、HDFS、Hive、HBase、Mahout、Pig、Zookeeper、Avro、Chukwa 陆嘉恒-Hadoop实战.pdf 厦门大学计算机系林子雨
 《Hadoop权威指南(中文版)》  Tom White著,曾大聃、周傲英 译

清华大学出版社,2010年5月

 Hadoop简介、MapReduce简介、Hadoop分布式文件系统、Hadoop的I/O、MapReduce应用程序开发、MapReduce工作机制、MapReduce的类型和格式、Pig简介、HBase简介、Zookeeper简介,提供了丰富案例分析  Hadoop权威指南(中文版).pdf 厦门大学计算机系林子雨
 《Hadoop权威指南英文版第三版》 Tom White著

O’REILLY出版,2012年

全英文原著,内容涉及Hadoop简介、MapReduce简介、Hadoop分布式文件系统、Hadoop的I/O、MapReduce应用程序开发、MapReduce工作机制、MapReduce的类型和格式、Pig简介、HBase简介、Zookeeper简介,提供了丰富案例分析 Hadoop权威指南英文版第三版.pdf 厦门大学计算机系林子雨
《Hadoop实战》 Chuck Lam著,韩冀中 译

人民邮电出版社,2011年10月

深入浅出介绍Hadoop框架、编写和运行Hadoop数据处理程序所需要的实践技能及Hadoop之外更大的生态系统 韩冀中译-Hadoop实战.pdf 厦门大学计算机系林子雨
《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》 董西成 著

机械工业出版社,2013年5月

深入剖析Hadoop MapReduce中各个组件的实现细节,包括RPC框架、JobTracker实现、TaskTracker实现、Task实现和作业调度器实现等。书中不仅详细介绍了MapReduce各个组件的内部实现原理,而且结合源代码进行了深入剖析,使读者可以快速全面掌握Hadoop MapReduce设计原理和实现细节 董西成-Hadoop技术内幕-深入解析MapReduce架构设计与实现原理.pdf 厦门大学计算机系林子雨
《Hadoop技术内幕:深入解析HADOOP COMMON和HDFS架构设计与实现原理》 蔡斌,陈湘萍 著

机械工业出版社,2013年3月

该书从源代码层面上,对Hadoop的公共工具Common和Hadoop的分布式文件系统HDFS进行了介绍,帮助广大开发者从架构与设计原理的角度去解释Hadoop,从而为更好地使用和扩展Hadoop打下坚实的基础 蔡斌-Hadoop技术内幕-深入解析HADOOP COMMON和HDFS架构设计与实现原理.pdf 厦门大学计算机系林子雨
《信号与噪声:大数据时代的预测科学与技术》 纳特.西尔弗 著

胡晓姣,张新,朱辰辰 译

中信出版社,2013年8月

第一章 预测失败的灾难性后果;第二章 政治选举预测;第三章 棒球比赛预测;第四章 天气预测;第五章 地震预测;第六章 经济预测; 第七章 传染性疾病预测;第八章 贝叶斯定理;第九章 国际象棋大战;第十章 扑克牌游戏;第十一章 股票市场;第十二章 温室效应;第十三章 恐怖主义。 胡晓姣译-信号与噪声-大数据时代的预测科学和技术.pdf 厦门大学计算机系林子雨
《Pro Hadoop:Build scalable, distributed applications in the cloud》(英文版) Jason Venner,Apress出版社,2009 介绍MapReduce、HDFS的深入编程方法,包括调试和解决各种问题 Jason Venner-Pro Hadoop.pdf 北华航天工业学院何志学
《实战Hadoop—开启通向云计算的捷径》 刘鹏,电子工业出版社,2011年9月 讲述Hadoop基本原理,并配以生动的案例,介绍了HDFS、MapReduce、HBase、Hive、Cassandra、Chukwa、Zookeeper 刘鹏-实战Hadoop—开启通向云计算的捷径.pdf 北华航天工业学院何志学
《云计算(第二版)》 刘鹏,电子工业出版社,2011年5月 绪论、Google云计算原理与应用、Amazon云计算AWS、微软云计算Windows Azure、VMWare云计算、Hadoop:Google云计算的开源实现、Eucalyptus:Amazon云计算的开源实现、其他开源云计算系统、云计算仿真器CloudSim、云计算研究热点、总结与展望 刘鹏-云计算(第二版).pdf 北华航天工业学院何志学
《虚拟化与云计算》 虚拟化与云计算小组,电子工业出版社,2009年10月 数据中心的构建与管理、虚拟化概论、虚拟化的关键技术、虚拟化的业界动态、云计算概论、云架构、云计算的关键技术与挑战、云计算的业界动态 虚拟化与云计算小组-虚拟化与云计算.pdf 北华航天工业学院何志学
《HBase权威指南中文版》 Lars George著,代志远,刘佳,蒋杰 译,人民邮电出版社,2013年7月 简介、安装、客户端API:基础知识、客户端API:高级特性、客户端API:管理功能、可用客户端、与MapReduce集成、架构、高级用法、集群监控、性能优化、集群管理 代志远-HBase权威指南中文版.pdf 厦门大学计算机系林子雨

 

(4)拓展阅读资料下载

【拓展阅读资料用途】林子雨在学习大数据课程的过程中,会把一些精华的大数据电子书籍或网络文章,以及林子雨近些年在各个场合做的各个专题演讲的报告PPT,做成一个集锦,推荐给读者,如果读者感兴趣,可以作为拓展阅读材料,拓宽自己的知识面。

【访问入口】请点击这里访问大数据课程拓展阅读材料集锦


(5)收集的不同高校教师大数据课程讲义

(欢迎您把自己高校的大数据课程讲义PPT与大家分享,请发送至林子雨老师邮箱ziyulin@xmu.edu.cn,这里向您表示衷心的感谢!)

课程名称 高校 主讲教师 上课内容 讲义PPT下载
大数据技术基础 厦门大学计算机科学系 林子雨 课程系统讲授大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、流计算、图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。在Hadoop、HDFS、HBase和MapReduce等重要章节,安排了入门级的实践操作,让学生更好地学习和掌握大数据关键技术。 下载
大数据处理技术 厦门大学软件学院 张仲楠 没有系统讲解大数据知识体系,只是讲解MapReduce原理和编程方法,课程通过几个算法实例讲解如何用MapReduce解决具体问题,并安排两周学生上机实验  下载

教学经验

题目 作者 撰写时间 阅读
以O2O理念不断提升大数据教学水平 林子雨 2015年10月28日 阅读
以平台化思维构建中国高校大数据课程公共服务体系 林子雨 2015年12月6日 阅读

保障团队

XMUDBLABLOGO

本服务站由厦门大学数据库实验室提供全程支持和保障。网址:http://dblab.xmu.edu.cn/

厦门大学数据库实验室是“信息科学与技术学院文明卫生实验室”,位于厦门大学海韵园,坐落在美丽的厦门珍珠湾,与大海仅有百米之隔。实验室老师包括冯少荣老师(副教授)、张东站老师(副教授)、林子雨老师(助理教授)、林文水老师(助理教授)。 实验室承担计算机系《数据库系统原理》、《分布式数据库》和《大数据技术基础》等课程的本科生和研究生教学工作,在数据库、数据仓库、数据挖掘和大数据领域开展相关研究,为社会培养了众多优秀的本科和硕士毕业生。实验室先后于1989年和2004年承办了第八届和第二十一届全国数据库会议(NDBC),受到广泛好评。

共建单位

(1)厦门大学云计算与大数据研究中心

厦门大学,云计算与大数据研究中心

厦门大学数据库实验室与厦门大学云计算与大数据研究中心携手共建“大数据课程教师服务站”。厦门大学云计算与大数据研究中心为本服务站建设提供理论、技术、设备、人员和教学环境等各方面支持,包括平台网站虚拟主机空间、教学机房、技术支持等。林子雨老师是厦门大学云计算与大数据 研究中心的主要建设者和骨干成员,承担了研究中心筹建阶段和运作阶段的大量工作,包括起草发展规划、撰写会议纪要、筹备成立大会、对外合作交流等。

厦门大学云计算与大数据研究中心是校级跨学科研究机构,负责统筹和管理全校的存储和超级计算资源。研究中心由厦门大学信息科学与技术学院、厦门大学信息与网络中心共同设立,挂靠厦门大学信息科学与技术学院,是福建省重点实验室、福建省2011协同创新中心和福建省工程技术研究中心培育单位。

研究中心的建设目标是成为在云计算与大数据领域内受到国内同行认可,拥有一批国际知名专家学者,并具有较高学术声誉的研究单位,以及政府和企事业单位的决策咨询单位。 研究中心现有首席科学家4名(闽江讲座教授、厦门大学讲座教授),教授10名,副教授9名,助理教授15名,高级工程师5名,工程师15名。团队所指导的在校博士生7人,在校硕士研究生150余人。研究中心占地1000余平方米,设备金额近2000万。

(2)海峡云计算与大数据应用研究中心

海峡云计算与大数据应用研究中心LOGO(图上文下)

(图  由研究中心副主任林子雨博士创意设计的LOGO)

海峡云计算与大数据应用研究中心于2015年5月19日成立,坐落于中国国际信息技术(福建)产业园内,是国富瑞数据系统有限公司(商务部中国国际电子商务中心旗下控股子公司)直属科研机构。研究中心以中国国际信息技术(福建)产业园为依托,立足厦漳泉经济圈,服务福建,辐射海西。研究中心秉承“务实科研、服务产业”理念,积极开展云计算与大数据应用研究,促进云计算与大数据技术的产业化应用,切实有效解决产业实际问题,促进产业优化提升与转型升级,助力福建经济更好更快发展。
IMG_9667
(图  2015年11月3日研究中心部分成员合影)

 

常见问题

1、“厦门大学辅助国内高校开设大数据课程公益项目”和“大数据课程教师服务站”二者有什么区别?

答:厦门大学辅助国内高校开设大数据课程公益项目,是为尚未开设大数据课程的高校教师提供备课指南、课时安排、课程教材、讲义PPT、课程习题、考试题目、经验交流等全方位服务,参与本项目的高校教师,在既使没有大数据相关基础知识的背景下,通过2-4个月的自学和备课,可以顺利实现入门级大数据课程的开设和讲解。大数据课程教师服务站,是面向所有大数据课程教师,不管是否已经开设大数据课程。二者的具体联系与区别请见下表。

表  “服务站”与“公益项目”的联系与区别

厦门大学辅助国内高校开设大数据课程公益项目 大数据课程教师服务站
发起人 厦门大学计算机系助理教授林子雨博士 厦门大学计算机系助理教授林子雨博士
保障团队 厦门大学数据库实验室 厦门大学数据库实验室
服务对象 尚未开设但计划开设大数据课程的高校教师 尚未开设和已经开设大数据课程的高校教师,皆可
课程教材 免费提供,并且教学中须使用项目指定的大数据教材 自费购买,教学中可以自行决定采用什么教材
讲义PPT 免费提供 免费提供
备课指南 免费提供 免费提供
课程习题 免费提供 免费提供
考试题目 免费提供 不提供
技术资料 免费提供 免费提供
远程指导 免费提供远程指导,比如电话、邮件、QQ等方式 不提供远程指导
上门指导 提供上门指导,不收任何劳务费 不提供上门指导
经验交流 如果接受上门指导,则须按协议承诺参加交流会 自由参加
经验总结 免费提供各种教学经验总结 免费提供各种教学经验总结

 

服务站联系人

如您有任何意见或建议,欢迎联系厦门大学计算机科学系数据库实验室林子雨老师。

E-mail: ziyulin@xmu.edu.cn

个人网页:http://www.cs.xmu.edu.cn/linziyu