第26期全国高校大数据课程教师培训交流班主页
时间:2025年1月12日-19日
地点:厦门
扫码访问本网页
班级名单
班主任:夏小云
班长:许文芳
副班长:胡凡
学习委员:李琰
组织委员:王梓铭
第26期学员名单
序号 | 姓名 | 性别 | 单位名称 |
1 | 许文芳 | 女 | 厦门工学院 |
2 | 朱雄峰 | 男 | 广东医科大学 |
3 | 范绍灿 | 男 | 广东医科大学 |
4 | 廖日军 | 男 | 广东医科大学 |
5 | 郑金秋 | 女 | 广东医科大学 |
6 | 陈逸涵 | 女 | 厦门工学院 |
7 | 王丽 | 女 | 厦门大学嘉庚学院 |
8 | 王鲁瑞 | 男 | 重庆理工大学 |
9 | 王梓铭 | 男 | 大连理工大学城市学院 |
10 | 陈雪冬 | 男 | 内蒙古医科大学 |
11 | 胡凡 | 男 | 湖北经济学院 |
12 | 汪洋 | 男 | 上海建桥学院 |
13 | 陈明 | 男 | 厦门海洋职业技术学院 |
14 | 李琰 | 女 | 西安科技大学 |
15 | 索瑞霞 | 女 | 西安科技大学 |
16 | 刘小驰 | 女 | 西安科技大学 |
培训讲师
厦门大学计算机科学与技术系 林子雨 博士/副教授
林子雨(1978-),男,博士,国内高校知名大数据教师,厦门大学计算机科学与技术系副教授,厦门大学数据库实验室负责人,中国计算机学会数据库专委会委员,中国计算机学会信息系统专委会委员,入选“2021年高校计算机专业优秀教师奖励计划”,荣获“2022年福建省高等教育教学成果奖特等奖(个人排名第一)”和“2018年福建省高等教育教学成果奖二等奖(个人排名第一)”,编著出版13本大数据系列教材,被国内1000多所高校采用,建设了国内高校首个大数据课程公共服务平台,平台累计网络访问量超过2500万次,成为全国高校大数据教学知名品牌,主持的课程《大数据技术原理与应用》获评“2018年国家精品在线开放课程”和“2020年国家级线上一流本科课程”,主持的课程《Spark编程基础》获评“2021年国家级线上一流本科课程”。建设的大数据系列MOOC课程,入选“2023年教育部国家智慧教育公共服务平台应用典型案例”。
会务组
序号 | 姓名 | 性别 | 单位名称 |
1 | 林子雨 | 男 | 厦门大学数据库实验室 |
2 | 夏小云 | 女 | 厦门大学数据库实验室 |
3 | 刘浩然 | 男 | 厦门大学数据库实验室 |
4 | 周宗涛 | 男 | 厦门大学数据库实验室 |
课程表
第26期全国高校大数据课程教师培训交流班课程表
2025年1月12日-19日
1月12日全天注册报到,13日-19日上课
每天6节课,上午3节,下午3节,每节课45分钟
上午:9:00-9:45;10:00-10:45;11:00-11:45
下午:2:30-3:15;3:15-3:30(茶歇);3:30-4:15;4:30-5:15
时间 |
课程主题 |
培训内容 |
培训讲师 |
第1天 (1月13日) |
模块一 大数据概述 |
l 高校开设大数据课程指南 l 大数据时代和大数据概念 l 大数据的影响及关键技术 l 大数据计算模式 l 代表性大数据技术 |
厦门大学林子雨 |
模块二 分布式处理架构Hadoop |
l lHadoop简介 l lHadoop项目结构 l lHadoop的版本演进 l lHadoop在企业集群中的部署 l l实战:Hadoop的安装与使用 l 现场指导答疑 |
厦门大学林子雨 |
|
第2天 (1月14日) |
模块三 分布式文件系统HDFS原理与实践 |
l HDFS简介 l HDFS相关概念(块、数据节点、名称节点) l HDFS体系结构 l HDFS存储原理 l 实战:HDFS初级编程实践 l 现场指导答疑 |
厦门大学林子雨 |
模块四 分布式数据库HBase原理与实践 |
l HBase简介 l HBase与传统关系数据库的对比分析 l HBase访问接口 l HBase数据模型 l HBase实现原理 l 实战:HBase安装与简单编程实践 l 现场指导答疑 |
厦门大学林子雨 |
|
第3天 (1月15日) |
模块五 MapReduce原理 与实践 |
l MapReduce简介 l MapReduce工作流程概述 l MapReduce各个执行阶段 l Shuffle过程详解 l 实例分析 l 实战:MapReduce初级编程实践 l 现场指导答疑 |
厦门大学林子雨 |
模块六 Spark设计与运行原理 |
l lSpark简介 l lSpark运行架构 l lRDD的设计与运行原理 l Spark的部署模式 |
厦门大学林子雨 |
|
第4天 (1月16日) |
模块七 Spark安装和使用方法 |
l lAnaconda的安装和使用方法 l l安装Spark(Local模式) l l在pyspark中运行代码 l l使用spark-submit命令提交运行程序 l lSpark集群环境搭建(Standalone模式) l l在集群上运行Spark应用程序 l lSpark on YARN模式 l l安装PySpark类库 l l实战:第一个Spark应用程序:WordCount(使用Python语言) l l实战:使用开发工具PyCharm编写Spark应用程序(使用Python语言) l 现场指导答疑 |
厦门大学林子雨 |
模块八 RDD编程实践 |
l lRDD编程 l l键值对RDD l l实战:数据读写(文件数据读写、读写MySQL数据库) l l综合实例 l 现场指导答疑 |
厦门大学林子雨 |
|
第5天 (1月17日) |
模块九 Spark SQL原理 和实践 |
l lSpark SQL简介 l l结构化数据DataFrame l lDataFrame的创建和保存 l lDataFrame的基本操作 l l从RDD转换得到DataFrame l l实战:使用Spark SQL读写数据库 l l实战:PySpark和pandas的整合 l l综合实例 l 现场指导答疑 |
厦门大学林子雨 |
模块十 Spark Streaming 原理和实践 |
l l流计算简介 l lSpark Streaming简介 l lDStream操作概述 l l实战:输入源(文件流、套接字流、RDD队列流) l l现场指导答疑 |
厦门大学林子雨 |
|
第6天 (1月18日) |
模块十一 案例:文本分类算法 性能对比实验 |
l (采用Python和Spark,详细介绍如何使用Hadoop和Spark技术解决实际应用问题) l l文本预处理 l l文本表示模型 l l分类器(实战:使用逻辑斯蒂回归、决策树和随机森林算法对鸢尾花数据集进行分析) l l分类性能 l 实战:文本分类的代码实现(加载数据集、分词、构建词向量、分类) l 实战:文本分类算法性能对比实验 |
厦门大学林子雨 |
厦门大学林子雨 |
|||
第7天 (1月19日) |
模块十二 大数据教学研讨会 |
共同探讨大数据课程体系建设面临的问题和对策建议,分享教学经验、方法和案例,促进成熟的大数据课程体系的快速复制传播,加快推进国内高校大数据教学水平不断提升 |
厦门大学林子雨 |
模块十三 参观 |
参观 培训课程全部结束 |
厦门大学夏小云 |
课堂
开班仪式
茶歇
合影
户外活动
答疑
研讨会
毕业晚会
相册
相册(点击浏览大图)