林子雨编著《大数据技术原理与应用》教材配套讲义PPT

厦门大学林子雨编著《大数据技术原理与应用》教材配套讲义PPT

访问教材官网

作者:厦门大学计算机科学系 林子雨(ziyulin@xmu.edu.cn, http://www.cs.xmu.edu.cn/linziyu)

工信部”全国云计算及大数据应用技术人才培训考试项目”唯一指定大数据教材

全国多所高校大数据课程选用本教材

( 当当网购买本书|京东商城购买本书|亚马逊购买本书

面向教师的大数据课程教师服务站 | 面向学生的大数据课程学生服务站

大数据技术原理与应用教材配套讲义PPT网页二维码

扫一扫手机访问本主页

大数据教师培训班报名宣传LOGO

欢迎报名参加全国高校大数据课程教师2016暑期培训交流班(8月1日到7日林子雨主讲)


第0章|第1章|第2章|第3章|第4章|第5章|第6章|第7章|第8章|第9章|第10章|第11章|第12章|第13章|第14章|第15章|第16章


林子雨-大数据技术原理与应用教材封面2015年6月1日

章节说明:教材只需要授课第1章到第11章,因此,只提供前11章讲义PPT;第12章和13章属于学生自学内容,不需要授课,不用讲义PPT。

新增章节:2015年8月1日出版发行的《大数据技术原理与应用》教材(第1版)共13章,针对2015、2016年大数据技术的新发展,2016年林子雨老师为教材新增了三个章节(将在下一版教材中放入教材),新增第14章基于Hadoop的数据仓库Hive、第15章Hadoop架构再探讨、第16章Spark。

版本说明:林子雨老师在备课讲课过程中,会不断改进完善讲义PPT,并上传最新版本,建议下载每章PPT的最新版本;为了记录历史变化,也保留了旧版本。

第0章 课程介绍

内容提要:对于课程的基本介绍,包括课程特色、教材介绍、篇章安排、中国高校大数据课程公共服务平台各种教学资源使用方法、主讲教师和助教等

版本号 PPT格式下载 PDF格式下载
2016年1月24日版本 下载 下载
 2015年6月2日版本 下载  下载

第1章 大数据概述

内容提要:首先介绍了大数据发展历程、基本概念、主要影响、应用领域、关键技术、计算模式和产业发展,并阐述了云计算、物联网的概念及其与大数据之间的紧密关系

版本号 PPT格式下载 PDF格式下载
2016年1月24日版本 下载 下载
 2015年6月2日版本  下载 下载

第2章 大数据处理架构Hadoop

内容提要:介绍Hadoop的发展历史、重要特性和应用现状,并详细介绍Hadoop项目结构及其各个组件,最后,演示如何在Linux操作系统下安装和配置Hadoop

版本号 PPT格式下载 PDF格式下载
2016年2月24日版本 下载 下载
2016年1月23日版本 下载 下载
  2015年6月2日版本  下载 下载

第3章 Hadoop分布式文件系统

内容提要:首先介绍分布式文件系统的基本概念、结构和设计需求,然后介绍Hadoop分布式文件系统HDFS,详细阐述它的重要概念、体系结构、存储原理和读写过程,最后,介绍了一些HDFS编程实践方面的知识

版本号 PPT格式下载 PDF格式下载
2016年3月2日版本 下载 下载
2016年1月25日版本 下载 下载
 2015年6月2日版本  下载 下载

第4章 分布式数据库HBase

内容提要:首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识

版本号 PPT格式下载 PDF格式下载
2016年3月10日版本 下载 下载
2016年3月6日版本 下载 下载
2016年1月28日版本 下载 下载
 2015年6月2日版本  下载  下载

第5章 NoSQL数据库

内容提要:首先介绍NoSQL兴起的原因,比较NoSQL数据库与传统的关系数据库的差异;然后,介绍NoSQL数据库的四大类型以及NoSQL数据库的三大基石;最后,简要介绍与NoSQL数据库同样受到关注的NewSQL数据库

版本号 PPT格式下载 PDF格式下载
2016年3月16日版本 下载 下载
2016年1月28日版本 下载 下载
 2015年6月2日版本  下载  下载

 

第6章 云数据库

内容提要:首先介绍云数据库的概念、特性及其与其他数据库的关系,然后,介绍云数据库的代表性产品和厂商,最后,以阿里云数据库RDS为实例演示如何使用云数据库

版本号 PPT格式下载 PDF格式下载
2016年3月23日版本 下载 下载
 2015年6月2日版本 下载 下载

 

第7章MapReduce

内容提要:介绍MapReduce模型,阐述其具体工作流程,并以单词统计为实例介绍 MapReduce程序设计方法,同时,还介绍了MapReduce的具体应用,最后讲解MapReduce编程实践

版本号 PPT格式下载 PDF格式下载
2016年3月30日版本 下载 下载
2016年1月28日版本 下载 下载
 2015年6月2日版本  下载 下载

 

第8章 流计算

内容提要:首先介绍流计算的基本概念和需求,分析了MapReduce框架为何不适合处理流数据;然后,阐述了流计算的处理流程和可应用的场景;接着介绍了流计算框架Storm的设计思想和架构设计;最后,通过实例来加深对Storm框架的了解

版本号 PPT格式下载 PDF格式下载
2016年4月27日版本 下载 下载
2016年1月29日版本 下载 下载
 2015年6月2日版本 下载  下载

 

第9章 图计算

内容提要:首先介绍传统图计算解决方案的不足,然后详细介绍了Pregel图计算模型、C++ API、体系结构和应用实例,最后,对PageRank算法在Pregel和MapReduce中的不同实现方式进行了比较,从而说明Pregel在处理图计算问题方面的优势

版本号 PPT格式下载 PDF格式下载
2016年5月4日版本 下载 下载
2016年1月29日版本 下载 下载
 2015年6月2日版本 下载   下载

 

第10章 数据可视化

内容提要:介绍了数据可视化的概念、发展历程、重要作用,并介绍了几种重要的可视化工具,包括入门级工具、信息图表工具、地图工具、时间线工具、高级分析工具,最后给出了一些可视化典型案例

版本号 PPT格式下载 PDF格式下载
2016年1月30日版本 下载 下载
 2015年6月2日版本  下载 下载

 

第11章 大数据在互联网领域的应用

内容提要:首先介绍推荐系统的概念,描述长尾理论与推荐系统的内在联系,并介绍不同的推荐方法以及推荐系统的应用;然后,重点介绍协同过滤算法的基本思想;最后,通过实例来讲述如何实现一个简易的推荐系统

版本号 PPT格式下载 PDF格式下载
2016年1月29日版本 下载 下载
 2015年6月2日版本   下载   下载

 

第12章 大数据在生物医学领域的应用

第12章介绍大数据在生物医学领域的应用知识,内容比较简单,属于学生自学范畴,不用授课,不需要讲义PPT

 

第13章 大数据在其他领域的应用

第13章介绍大数据在各个其他领域的应用知识,内容比较简单,属于学生自学范畴,不用授课,不需要讲义PPT

 

第14章 基于Hadoop的数据仓库Hive

说明:第14章基于Hadoop的数据仓库Hive,是2016年新增章节,不在2015年8月1日由人民邮电出版社出版的《大数据技术原理与应用》(第1版)教材中,本章将被放入到第2版教材中。

内容提要:本章首先介绍了数据仓库的概念、Hive的基本特征、与其他组件之间的关系、与传统数据库的区别以及它在企业中的具体应用;接着详细介绍了Hive的系统架构,包括基本组成模块、工作原理和几种外部访问方式,描述了Hive的具体应用及Hive HA原理;同时,介绍了新一代开源大数据分析引擎Impala及其与Hive的比较分析;最后,以单词统计为例,介绍了如何使用Hive进行简单编程,并说明了Hive编程相对于MapReduce编程的优势。

讲义PPT下载:

版本号 PPT格式下载 PDF格式下载
2016年4月6日版本 下载 下载

教材电子书下载:

本章内容属于2016年林子雨新编写的章节,不在第1版教材中,请在这里下载本章PDF格式电子书。

版本号 PDF格式电子书下载
2016年4月6日版本 下载电子书

 

第15章 Hadoop架构再探讨

说明:第15章Hadoop架构再探讨,是2016年新增章节,不在2015年8月1日由人民邮电出版社出版的《大数据技术原理与应用》(第1版)教材中,本章将被放入到第2版教材中。

内容提要:本章首先介绍Hadoop的局限与不足,并从全局视角系统总结针对Hadoop的改进与提升;然后,介绍Hadoop在自身核心组件方面的新发展,包括HDFS2.0新特性和新一代资源管理调度框架YARN框架;最后,介绍Hadoop推出之后陆续涌现的具有代表性的新功能组件,包括Pig、Tez、Spark和Kafka等,这些组件对Hadoop的局限进行了有效的改进,进一步丰富和发展了Hadoop生态系统。

讲义PPT下载:

版本号 PPT格式下载 PDF格式下载
2016年4月13日版本 下载 下载

教材电子书下载:

本章内容属于2016年林子雨新编写的章节,不在第1版教材中,请在这里下载本章PDF格式电子书。

版本号 PDF格式电子书下载
2016年4月13日版本 下载电子书

 

第16章 Spark

说明:第16章Spark,是2016年新增章节,不在2015年8月1日由人民邮电出版社出版的《大数据技术原理与应用》(第1版)教材中,本章将被放入到第2版教材中。

内容提要:本章首先简单介绍Spark与Scala编程语言,接着分析Spark与Hadoop的区别,认识Hadoop MapReduce计算模型的缺陷与Spark的优势;然后讲解了Spark的生态系统和架构设计,并介绍了Spark SQL以及Spark的部署和应用方式;最后介绍Spark的安装与基本的编程实践。

讲义PPT下载:

版本号 PPT格式下载 PDF格式下载
2016年4月20日版本 下载 下载

教材电子书下载:

本章内容属于2016年林子雨新编写的章节,不在第1版教材中,请在这里下载本章PDF格式电子书。

版本号 PDF格式电子书下载
2016年4月20日版本 下载