2022年12月6日,与林子雨老师编著《数据采集与预处理》教材配套的慕课视频,在网易云课堂上线发布(观看课程视频)。课程由全国高校知名大数据教师厦门大学计算机系林子雨副教授和夏小云老师主讲。课程详细介绍了大数据领域数据采集与预处理的相关理论和技术。课程共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。课程在网络数据采集、Kafka、Flume、Kettle、pandas等重要章节安排了丰富的实践操作,以便学习者更好地学习和掌握数据采集与预处理的关键技术。