Author: WayLion

Spark+Kafka构建实时分析Dashboard案例——步骤三：Spark Streaming实时处理数据（python版本）

该版本是原先教程的python版本。

查看前一步骤操作步骤二：数据处理和Python操作Kafka
查看scala版本scala版本：Spark Streaming实时处理数据

《Spark+Kafka构建实时分析Dashboard案例——步骤三：Spark Streaming实时处理数据(python版本)》

开发团队：厦门大学数据库实验室联系人：林子雨老师ziyulin@xmu.edu.cn

本教程介绍大数据课程实验案例“Spark+Kafka构建实时分析Dashboard”的第三个步骤，Spark Streaming实时处理数据。在本篇博客中，将介绍如何利用Spark Streaming实时接收处理Kafka数据以及将处理后的结果发给的Kafka。

继续阅读

交互式Python爬虫分析实例

先前的文章展示了爬虫分析，并使用pyecharts画图。这篇文章在先前文章的基础上，增加了在线控制模块。总体的做法就是，把爬虫分析功能放在后台，在后台开启一个服务端，接收客户端的命令后，开启爬虫分析，然后将最后的结果展示在客户端。

继续阅读

厦门租房信息分析展示（pycharm+python爬虫+pyspark+pyecharts）

【版权声明】版权所有，严禁转载，严禁用于商业用途，侵权必究。
作者：厦门大学计算机系2016级研究生魏亮
指导老师：厦门大学计算机科学系数据库实验室林子雨博士/副教授
相关教材：林子雨、郑海山、赖永炫编著《Spark编程基础（Python版）》（访问教材官网）
相关案例：基于Python语言的Spark数据处理分析案例集锦（PySpark）

本篇博客将实现一个系列程序，从厦门小鱼网爬取租房租金信息，然后利用spark的python版本进行简单分析，并利用echarts的python版本展示分析结果，此外还会简单介绍pycharm的工程建立，所以本篇将分为四个部分。
继续阅读

使用Pycharm开发Spark应用程序（以WordCount为例）

本篇博客将给大家介绍怎么在PyCharm上编写运行WordCount程序。
继续阅读

TensorFlow入门教程

继续阅读

Spark大数据之基本数据处理

继续阅读

利用开发工具IntelliJ IDEA编写Spark应用程序（Scala+Maven）

点击这里观看厦门大学林子雨老师主讲《大数据技术原理与应用》授课视频
【版权声明】博客内容由厦门大学数据库实验室拥有版权，未经允许，请勿转载！
[返回Spark教程首页]
对Scala代码进行打包编译时，可以采用Maven，也可以采用sbt，相对而言，业界更多使用sbt。这里介绍IntelliJ IDEA和Maven的组合使用方法。IntelliJ IDEA和SBT的组合使用方法，请参考“使用Intellij Idea编写Spark应用程序（Scala+SBT）”。
继续阅读

大数据案例-步骤一:本地数据集上传到数据仓库Hive

返回大数据案例首页
《大数据课程实验案例：网站用户行为分析—-步骤一:本地数据集上传到数据仓库Hive》
开发团队：厦门大学数据库实验室联系人：林子雨老师 ziyulin@xmu.edu.cn
版权声明：版权归厦门大学数据库实验室所有，请勿用于商业用途；未经授权，其他网站请勿转载
继续阅读

一键安装补充

一键安装的ssh登入障碍，可以重新生产配对钥匙

Agent admitted failure to sign using the key

解決方式使用 ssh-add 指令将私钥加进来（根据个人的密匙命名不同更改 id_rsa）
#ssh-add ~/.ssh/id_rsa

再通过ssh 主机名就可以实现无密码登录了。