厦大数据库实验室博客

Spark+Kafka构建实时分析Dashboard案例——步骤二：数据处理和Python操作Kafka

返回本案例首页
查看前一步骤操作步骤一：实验环境准备

《Spark+Kafka构建实时分析Dashboard案例——步骤二：案例介绍》

开发团队：厦门大学数据库实验室联系人：林子雨老师ziyulin@xmu.edu.cn

本教程介绍大数据课程实验案例“Spark+Kafka构建实时分析Dashboard”的第二个步骤，数据处理和Python操作Kafka。在本篇博客中，首先介绍如何预处理数据，以及如何使用Python操作Kafka。

继续阅读

Spark+Kafka构建实时分析Dashboard案例——步骤一：实验环境准备

返回本案例首页
《Spark+Kafka构建实时分析Dashboard案例——步骤一：实验环境准备》
开发团队：厦门大学数据库实验室联系人：林子雨老师 ziyulin@xmu.edu.cn

本教程介绍大数据课程实验案例“Spark+Kafka构建实时分析Dashboard案例”的第一个步骤，实验环境准备工作，有些软件的安装在相应的章节还会介绍。

继续阅读

Spark+Kafka构建实时分析Dashboard案例介绍

返回本案例首页
《Spark+Kafka构建实时分析Dashboard案例介绍》

开发团队：厦门大学数据库实验室联系人：林子雨老师ziyulin@xmu.edu.cn

本教程介绍大数据课程实验案例“Spark+Kafka构建实时分析Dashboard”。在本篇博客中，将要介绍本案例的总体架构，包括案例整体的运行流程以及每个过程具体执行内容。

继续阅读

Redis安装和使用(Ubuntu系统)

本节内容包括Redis简介、安装Redis和Redis实例演示等，Redis在Window系统安装教程可参考https://dblab.xmu.edu.cn/blog/131/#more-131

继续阅读

Spark2.1.0入门：模型选择和超参数调整

【版权声明】博客内容由厦门大学数据库实验室拥有版权，未经允许，请勿转载！
[返回Spark教程首页]

## 模型选择和超参数调整

在机器学习中非常重要的任务就是模型选择，或者使用数据来找到具体问题的最佳的模型和参数，这个过程也叫做调试（Tuning）。调试可以在独立的估计器中完成（如逻辑斯蒂回归），也可以在包含多样算法、特征工程和其他步骤的工作流中完成。用户应该一次性调优整个工作流，而不是独立的调整PipeLine中的每个组成部分。
继续阅读

使用Intellij Idea编写Spark应用程序（Scala+SBT）

点击这里观看厦门大学林子雨老师主讲《大数据技术原理与应用》授课视频
【版权声明】博客内容由厦门大学数据库实验室拥有版权，未经允许，请勿转载！
返回Spark教程首页
对Scala代码进行打包编译时，可以采用Maven，也可以采用SBT，相对而言，业界更多使用SBT。之前有篇博客我们介绍了使用Intellij Idea编写Spark应用程序(Scala+Maven)，采用的是Maven工具。今天这篇博客同样是使用Intellij Idea编写Spark应用程序，但是使用的是SBT工具。下面开始我们的教程。
继续阅读

使用Eclipse编写Spark应用程序（Scala+SBT）

点击这里观看厦门大学林子雨老师主讲《大数据技术原理与应用》授课视频
【版权声明】博客内容由厦门大学数据库实验室拥有版权，未经允许，请勿转载！
[返回Spark教程首页]

之前有篇博客介绍了使用Eclipse编写Spark应用程序，采用的是maven工具。今天这篇博客同样是使用Eclipse编写Spark应用程序，但是使用的是sbt工具。下面开始我们的教程。

继续阅读

Spark+Kafka构建实时分析Dashboard案例——步骤二：数据处理和Python操作Kafka

Spark+Kafka构建实时分析Dashboard案例——步骤一：实验环境准备

Spark+Kafka构建实时分析Dashboard案例介绍

Redis安装和使用(Ubuntu系统)

Spark2.1.0入门：模型选择和超参数调整

## 模型选择和超参数调整

使用Intellij Idea编写Spark应用程序（Scala+SBT）

使用Eclipse编写Spark应用程序（Scala+SBT）

Spark2.1.0入门：Spark GraphX 算法实例

Spark2.1.0入门：Spark GraphX 图操作

Spark2.1.0入门：Spark GraphX 简介