在ECS实例的Ubuntu系统中安装编译打包工具sbt

返回《在阿里云中搭建大数据实验环境》首页
提示:本教程是一个系列文章,请务必按照本教程首页中给出的各个步骤列表,按照先后顺序一步步进行操作,本博客假设你已经顺利完成了之前的操作步骤。
在对使用 Scala 编写的Spark程序进行编译打包时,可以使用 sbt 工具进行编译打包,也可以使用Maven工具进行编译打包。本文介绍如何使用 sbt 工具进行编译打包,下一篇博客会介绍如何使用Maven工具进行编译打包。这里会通过一个简单的应用程序 SimpleApp 来演示如何通过 Spark API 编写一个独立应用程序,并且在Shell环境中使用sbt进行编译打包。
继续阅读

在阿里云ECS的Ubuntu中安装Spark

返回《在阿里云中搭建大数据实验环境》首页
提示:本教程是一个系列文章,请务必按照本教程首页中给出的各个步骤列表,按照先后顺序一步步进行操作,本博客假设你已经顺利完成了之前的操作步骤。
现在介绍如何在阿里云ECS的Ubuntu系统中安装Spark,本教程采用的版本是Spark2.1.0。Spark部署模式主要有四种:Local模式(单机模式)、Standalone模式(使用Spark自带的简单集群管理器)、YARN模式(使用YARN作为集群管理器)和Mesos模式(使用Mesos作为集群管理器)。这里介绍Local模式(单机模式)的 Spark安装。
继续阅读

在ECS实例的Ubuntu系统中安装Hadoop

返回《在阿里云中搭建大数据实验环境》首页
提示:本教程是一个系列文章,请务必按照本教程首页中给出的各个步骤列表,按照先后顺序一步步进行操作,本博客假设你已经顺利完成了之前的操作步骤。
在阿里云ECS的Ubuntu系统中安装Hadoop,和在本地电脑安装Hadoop,基本相似,但是,也有略微差别,必须正确配置,否则,会导致无法顺利启动。安装Hadoop之前,请确保已经根据前面的博客《在ECS实例的Ubuntu系统中安装Java》完成了Java的安装。
继续阅读

使用FTP软件向ECS实例中的Ubuntu系统上传和下载文件

返回《在阿里云中搭建大数据实验环境》首页
提示:本教程是一个系列文章,请务必按照本教程首页中给出的各个步骤列表,按照先后顺序一步步进行操作,本博客假设你已经顺利完成了之前的操作步骤。
在大数据实验操作中,我们经常需要从本地电脑上传数据或者软件到阿里云ECS的Ubuntu系统中,或者需要从ECS的Ubuntu系统中下载数据到本地电脑。因此,需要了解如何使用FTP软件向ECS实例中的Ubuntu系统上传和下载文件。
继续阅读

在ECS实例的Ubuntu系统中安装Java

返回《在阿里云中搭建大数据实验环境》首页
提示:本教程是一个系列文章,请务必按照本教程首页中给出的各个步骤列表,按照先后顺序一步步进行操作,本博客假设你已经顺利完成了之前的操作步骤。
无论是Hadoop,还是Spark,都需要Java运行环境,因此,需要在ECS实例的Ubuntu系统中安装Java。由于本教程使用Hadoop2.7.1和Spark2.1.0(要求必须Java8及以上版本),因此,需要安装Java8。如果你的ECS实例中的Ubuntu是Java7,那么版本太旧,必须删除,然后,安装Java8,。
继续阅读

使用Putty软件实现SSH登录到Ubuntu系统

返回《在阿里云中搭建大数据实验环境》首页
提示:本教程是一个系列文章,请务必按照本教程首页中给出的各个步骤列表,按照先后顺序一步步进行操作,本博客假设你已经顺利完成了之前的操作步骤。
假设我们在本地使用台式机或笔记本电脑,有时候,我们要在远程的云服务器ECS的Ubuntu中执行一些Shell命令来完成一些操作,如果采用阿里云网页管理控制台的方式,非常繁琐(要访问官网、登录账户、发起远程连接、进入Ubuntu系统、打开终端),因此,建议在本地电脑上,使用Putty软件实现SSH登录到远程ECS实例中的Ubuntu系统,这样做非常方便快捷。
继续阅读