第26期大数据师资培训班主页

平台LOGO透明背景

第26期全国高校大数据课程教师培训交流班主页

时间:2025年1月12日-19日

地点:厦门

扫码访问本网页

热烈欢迎培训班条幅1

班级名单

班主任:夏小云

班长:许文芳

副班长:胡凡

学习委员:李琰

组织委员:王梓铭

第26期学员名单

序号 姓名 性别 单位名称
1 许文芳 厦门工学院
2 朱雄峰 广东医科大学
3 范绍灿 广东医科大学
4 廖日军 广东医科大学
5 郑金秋 广东医科大学
6 陈逸涵 厦门工学院
7 王丽 厦门大学嘉庚学院
8 王鲁瑞 重庆理工大学
9 王梓铭 大连理工大学城市学院
10 陈雪冬 内蒙古医科大学
11 胡凡 湖北经济学院
12 汪洋 上海建桥学院
13 陈明 厦门海洋职业技术学院
14 李琰 西安科技大学
15 索瑞霞 西安科技大学
16 刘小驰 西安科技大学

培训讲师

厦门大学计算机科学与技术系 林子雨 博士/副教授

DSC_4552副本

林子雨(1978-),男,博士,国内高校知名大数据教师,厦门大学计算机科学与技术系副教授,厦门大学数据库实验室负责人,中国计算机学会数据库专委会委员,中国计算机学会信息系统专委会委员,入选“2021年高校计算机专业优秀教师奖励计划”,荣获“2022年福建省高等教育教学成果奖特等奖(个人排名第一)”和“2018年福建省高等教育教学成果奖二等奖(个人排名第一)”,编著出版13本大数据系列教材,被国内1000多所高校采用,建设了国内高校首个大数据课程公共服务平台,平台累计网络访问量超过2500万次,成为全国高校大数据教学知名品牌,主持的课程《大数据技术原理与应用》获评“2018年国家精品在线开放课程”和“2020年国家级线上一流本科课程”,主持的课程《Spark编程基础》获评“2021年国家级线上一流本科课程”。建设的大数据系列MOOC课程,入选“2023年教育部国家智慧教育公共服务平台应用典型案例”。

会务组

序号 姓名 性别 单位名称
1 林子雨 厦门大学数据库实验室
2 夏小云 厦门大学数据库实验室
3 刘浩然 厦门大学数据库实验室
4 周宗涛 厦门大学数据库实验室

课程表

第26期全国高校大数据课程教师培训交流班课程表

2025年1月12日-19日

1月12日全天注册报到,13日-19日上课

每天6节课,上午3节,下午3节,每节课45分钟

上午:9:00-9:45;10:00-10:45;11:00-11:45

下午:2:30-3:15;3:15-3:30(茶歇);3:30-4:15;4:30-5:15

时间

课程主题

培训内容

培训讲师

第1天

113日)

模块一

大数据概述

l 高校开设大数据课程指南

l 大数据时代和大数据概念

l 大数据的影响及关键技术

l 大数据计算模式

l 代表性大数据技术

厦门大学林子雨

模块二

分布式处理架构Hadoop

l lHadoop简介

l lHadoop项目结构

l lHadoop的版本演进

l lHadoop在企业集群中的部署

l l实战:Hadoop的安装与使用

l   现场指导答疑

厦门大学林子雨

第2天

114日)

模块三

分布式文件系统HDFS原理与实践

l HDFS简介

l HDFS相关概念(块、数据节点、名称节点)

l HDFS体系结构

l HDFS存储原理

l 实战:HDFS初级编程实践

l 现场指导答疑

厦门大学林子雨

模块四

分布式数据库HBase原理与实践

l HBase简介

l HBase与传统关系数据库的对比分析

l HBase访问接口

l HBase数据模型

l HBase实现原理

l 实战:HBase安装与简单编程实践

l 现场指导答疑

厦门大学林子雨

第3天

115日)

模块五

MapReduce原理

与实践

l MapReduce简介

l MapReduce工作流程概述

l MapReduce各个执行阶段

l Shuffle过程详解

l 实例分析

l 实战:MapReduce初级编程实践

l 现场指导答疑

厦门大学林子雨

模块六

Spark设计与运行原理

l lSpark简介

l lSpark运行架构

l lRDD的设计与运行原理

l   Spark的部署模式

厦门大学林子雨

第4天

116日)

模块

Spark安装和使用方法

l lAnaconda的安装和使用方法

l l安装Spark(Local模式)

l l在pyspark中运行代码

l l使用spark-submit命令提交运行程序

l lSpark集群环境搭建(Standalone模式)

l l在集群上运行Spark应用程序

l lSpark on YARN模式

l l安装PySpark类库

l l实战:第一个Spark应用程序:WordCount(使用Python语言)

l l实战:使用开发工具PyCharm编写Spark应用程序(使用Python语言)

l   现场指导答疑

厦门大学林子雨

模块

RDD编程实践

l lRDD编程

l l键值对RDD

l l实战:数据读写(文件数据读写、读写MySQL数据库)

l l综合实例

l   现场指导答疑

厦门大学林子雨

第5天

117日)

模块

Spark SQL原理

和实践

l lSpark SQL简介

l l结构化数据DataFrame

l lDataFrame的创建和保存

l lDataFrame的基本操作

l l从RDD转换得到DataFrame

l l实战:使用Spark SQL读写数据库

l l实战:PySpark和pandas的整合

l l综合实例

l   现场指导答疑

厦门大学林子雨

模块

Spark Streaming

原理和实践

l l流计算简介

l lSpark Streaming简介

l lDStream操作概述

l l实战:输入源(文件流、套接字流、RDD队列流)

l l现场指导答疑

厦门大学林子雨

第6天

118日)

模块十一

案例:文本分类算法

性能对比实验

l (采用Python和Spark,详细介绍如何使用Hadoop和Spark技术解决实际应用问题)

l l文本预处理

l l文本表示模型

l l分类器(实战:使用逻辑斯蒂回归、决策树和随机森林算法对鸢尾花数据集进行分析)

l l分类性能

l  实战:文本分类的代码实现(加载数据集、分词、构建词向量、分类)

l  实战:文本分类算法性能对比实验

厦门大学林子雨

厦门大学林子雨

第7天

119日)

模块十二

大数据教学研讨会

共同探讨大数据课程体系建设面临的问题和对策建议,分享教学经验、方法和案例,促进成熟的大数据课程体系的快速复制传播,加快推进国内高校大数据教学水平不断提升

厦门大学林子雨

模块十三

参观

参观

培训课程全部结束

厦门大学夏小云

课堂

开班仪式

茶歇

合影

户外活动

答疑

研讨会

毕业晚会

相册