Zeppelin是Apache基金会下的一个开源框架,它提供了一个数据可视化的框架,是一个基于web的notebook。后台支持接入多种数据引擎,比如jdbc、spark、hive等。同时也支持多种语言进行交互式的数据分析,比如Scala、SQL、Python等等。本文从安装和使用两部分来介绍Zeppelin。
1.Zeppelin安装
1.下载Zeppelin
直接进入官网进行下载,选择第一项。
2.解压
sudo tar -zxvf zeppelin-0.10.0-bin-all.tgz -C /usr/local
3.配置
进入Zeppelin安装目录下的conf文件。
cd /usr/local/zeppelin-0.10.0-bin-all/conf
复制zeppelin-env.sh.template和zeppelin-site.xml.template两个文件。
sudo cp zeppelin-env.sh.template zeppelin-env.sh
sudo cp zeppelin-site.xml.template zeppelin-site.xml
编辑复制后的zeppelin-env.sh和zeppelin-site.xml
sudo vim zeppelin-env.sh
将zeppelin-env.sh中的JAVA_HOME设置为本机JDK所在的位置
sudo vim zeppelin-site.xml
修改zeppelin.server.addr中的value为0.0.0.0和zeppelin端口号为8999(避免和其他端口冲突)
4.启动Zeppelin
cd /usr/local/zeppelin
bin/zeppelin-daemon.sh start
通过浏览器访问http://192.168.43.93:8999可以打开Zeppelin控制台
此时通过jps可以看到该进程:
2.Zeppelin使用
- 通过浏览器访问http://192.168.43.93:8999可以打开Zeppelin控制台,点击右上角用户:
- 点击Interpreter
- 在搜索框里搜索jdbc,点击右上角edit,修改相关配置:
- 将页面滑到最下方,填写Artifact
- 最后点击Save保存配置
- 回到首页,点击Create new note创建一个note
- 填写Note Name后,Default Interpret选择jdbc
- 输入sql语句即可对指定的数据库进行查询