大数据Linux实验环境虚拟机镜像文件

大数据学习路线图

大数据Linux实验环境虚拟机镜像文件(安装镜像以后,遇到需要输入密码的地方,密码都是hadoop)
【镜像下载地址】请点击这里访问百度云盘下载镜像(需要安装百度云盘客户端,文件大小是6GB)
【制作单位】厦门大学数据库实验室 林子雨 老师 (ziyulin@xmu.edu.cn)
【版本】2017年11月6日
【配套教材】包含了与林子雨编著《大数据技术原理与应用(第2版)》教材配套的大数据实验环境
【镜像说明】
此镜像是使用VirtualBox虚拟机软件导出来的,里面包含了Ubuntu系统和全套大数据软件。遇到需要输入密码的地方,密码都是hadoop。

安装的系统和软件如下(所有软件都安装在/usr/local/目录下):
Ubuntu16.04
Hadoop2.7.1
Spark2.1.0
HBase1.1.5
JDK1.8
Scala2.11.8
MySQL
Kafka_2.11-0.10.2.0
Flume1.7.0
sbt
Maven3.3.9
MongoDB3.2.17
Hive2.1.0
Scala IDE(包含Eclipse4.7.0和Maven、Scala、sbt插件)

【使用方法】
请在你的Windows系统中,安装虚拟机软件(比如VirtualBox或VMVare),然后,打开虚拟机软件VirtualBox,在左上角的菜单中,选择“管理”,再选择“导入虚拟电脑”,在弹出的界面中,找到已经下载到本地的镜像文件UbuntuWithAllBigdataSoftware-XMU-linziyu-2017-11-03.ova,把镜像导入,就可以生成Ubuntu虚拟机。进入Ubuntu系统时,系统登录用户名是hadoop,密码是hadoop,里面安装的MySQL数据库的root用户对应的密码也是hadoop。
如果要启动开发工具Eclipse,请打开Linux终端,输入如下命令:

cd /usr/local/eclipse
./eclipse

【感言】大数据实验环境的安装,是一个耗时费力的过程,整套大数据实验环境,即使非常熟悉安装过程,仍然需要耗费一周左右的时间,因为,中间会遇到各种莫名其妙的错误,需要通过调研和反复调试来解决这些错误。正因如此,厦门大学数据库实验室制作了本镜像文件,希望能够大幅度降低大家搭建大数据实验环境的时间开销,提升大数据课程学习效率。
【对你有帮助的相关大数据教学资源】
(1)《大数据技术原理与应用》教材官网(访问
(2)《Spark编程基础》教材官网(访问
(3)《大数据基础编程、实验和案例教程》教材官网(访问
(4)林子雨主讲入门级大数据在线课程《大数据技术原理与应用》(访问