林子雨编著《数据采集与预处理》教材配套代码(教材官网)
提供了教材中的所有章节的代码,可以直接复制粘贴去执行。
第1章 概述(无代码)
第2章 大数据实验环境搭建
第3章 网络数据采集
第4章 分布式消息系统Kafka
第5章 日志采集系统Flume
第6章 数据仓库中的数据集成(无代码)
第7章 ETL工具Kettle
第8章 使用pandas进行数据清洗
林子雨编著《数据采集与预处理》教材配套代码(教材官网)
提供了教材中的所有章节的代码,可以直接复制粘贴去执行。
第1章 概述(无代码)
第2章 大数据实验环境搭建
第3章 网络数据采集
第4章 分布式消息系统Kafka
第5章 日志采集系统Flume
第6章 数据仓库中的数据集成(无代码)
第7章 ETL工具Kettle
第8章 使用pandas进行数据清洗