林子雨编著《Spark编程基础(Python版)》教材配套讲义PPT

《Spark编程基础(Python版)》教材配套讲义PPT

厦门大学 林子雨,郑海山,赖永炫  编著

人民邮电出版社  ISBN:978-7-115-52439-3

访问教材官网

E-mail:ziyulin@xmu.edu.cn

第0章-课程介绍

内容提要:对于课程的基本介绍,包括课程特色、教材介绍、先修课程、篇章安排、高校大数据课程公共服务平台各种教学资源等

版本号 PPT格式下载 PDF格式下载
2020年1月版 下载 下载

第1章-大数据技术概述

内容提要:大数据的基本概念、关键技术和代表性软件

版本号 PPT格式下载 PDF格式下载
2020年1月版 下载 下载

第2章-Spark的设计与运行原理

内容提要:Spark简介、安装、运行架构、RDD的设计与运行原理、部署模式

版本号 PPT格式下载 PDF格式下载
2020年1月版 下载 下载

第3章-Spark环境搭建和使用方法

内容提要:安装Spark、在pyspark中运行代码、编写Spark独立应用程序、第一个Spark应用程序:WordCount、使用开发工具编写Spark应用程序、Spark集群环境搭建、在集群上运行Spark应用程序

版本号 PPT格式下载 PDF格式下载
2020年1月版 下载 下载

第4章-RDD编程

内容提要:RDD编程、键值对RDD、数据读写

版本号 PPT格式下载 PDF格式下载
2020年1月版 下载 下载

第5章-Spark SQL

内容提要:Spark SQL简介、DataFrame、读写Parquet、通过JDBC连接数据库

版本号 PPT格式下载 PDF格式下载
2020年1月版 下载 下载

第6章-Spark Streaming

内容提要:流计算简介、Spark Streaming简介、DStream操作

版本号 PPT格式下载 PDF格式下载
2020年1月版 下载 下载

第7章-Structured Streaming

内容提要:编写Structured Streaming程序的基本步骤、输入源、输出操作、容错处理、迟到数据处理、查询的管理和监控

版本号 PPT格式下载 PDF格式下载
2020年1月版 下载 下载

第8章-Spark MLlib

内容提要:Spark MLlib简介、机器学习工作流、特征抽取、转化和选择、分类与回归、聚类算法、推荐算法

版本号 PPT格式下载 PDF格式下载
2020年1月版 下载 下载