大数据

在ECS实例的Ubuntu系统中安装HBase

返回《在阿里云中搭建大数据实验环境》首页
提示：本教程是一个系列文章，请务必按照本教程首页中给出的各个步骤列表，按照先后顺序一步步进行操作，本博客假设你已经顺利完成了之前的操作步骤。
HBase是Hadoop生态系统中的一个组件，是一种分布式数据库，可以支持数百万列、超过10亿行的数据的存储。本博客介绍如何在ECS实例的Ubuntu系统中安装HBase。
继续阅读

返回《在阿里云中搭建大数据实验环境》首页
提示：本教程是一个系列文章，请务必按照本教程首页中给出的各个步骤列表，按照先后顺序一步步进行操作，本博客假设你已经顺利完成了之前的操作步骤。
在对使用 Scala 编写的Spark程序进行编译打包时，可以使用 sbt 工具进行编译打包，也可以使用Maven工具进行编译打包。本文介绍如何使用 Maven工具进行编译打包，另一篇博客介绍如何使用sbt工具进行编译打包。这里会通过一个简单的应用程序 SimpleApp 来演示如何通过 Spark API 编写一个独立应用程序，并且在Shell环境中使用Maven进行编译打包。
继续阅读

在ECS实例的Ubuntu系统中安装编译打包工具sbt

返回《在阿里云中搭建大数据实验环境》首页
提示：本教程是一个系列文章，请务必按照本教程首页中给出的各个步骤列表，按照先后顺序一步步进行操作，本博客假设你已经顺利完成了之前的操作步骤。
在对使用 Scala 编写的Spark程序进行编译打包时，可以使用 sbt 工具进行编译打包，也可以使用Maven工具进行编译打包。本文介绍如何使用 sbt 工具进行编译打包，下一篇博客会介绍如何使用Maven工具进行编译打包。这里会通过一个简单的应用程序 SimpleApp 来演示如何通过 Spark API 编写一个独立应用程序，并且在Shell环境中使用sbt进行编译打包。
继续阅读

在阿里云ECS的Ubuntu中安装Spark

返回《在阿里云中搭建大数据实验环境》首页
提示：本教程是一个系列文章，请务必按照本教程首页中给出的各个步骤列表，按照先后顺序一步步进行操作，本博客假设你已经顺利完成了之前的操作步骤。
现在介绍如何在阿里云ECS的Ubuntu系统中安装Spark，本教程采用的版本是Spark2.1.0。Spark部署模式主要有四种：Local模式（单机模式）、Standalone模式（使用Spark自带的简单集群管理器）、YARN模式（使用YARN作为集群管理器）和Mesos模式（使用Mesos作为集群管理器）。这里介绍Local模式（单机模式）的 Spark安装。
继续阅读

在阿里云ECS的Ubuntu中安装Scala

返回《在阿里云中搭建大数据实验环境》首页
提示：本教程是一个系列文章，请务必按照本教程首页中给出的各个步骤列表，按照先后顺序一步步进行操作，本博客假设你已经顺利完成了之前的操作步骤。
现在介绍如何在阿里云ECS的Ubuntu系统中安装Scala。
继续阅读

在阿里云ECS的Ubuntu中安装IntelliJ IDEA和Scala插件

返回《在阿里云中搭建大数据实验环境》首页
现在介绍如何在阿里云ECS的Ubuntu系统中安装开发工具IntelliJ IDEA和Scala插件。
继续阅读

在ECS实例的Ubuntu系统中安装Hadoop

返回《在阿里云中搭建大数据实验环境》首页
提示：本教程是一个系列文章，请务必按照本教程首页中给出的各个步骤列表，按照先后顺序一步步进行操作，本博客假设你已经顺利完成了之前的操作步骤。
在阿里云ECS的Ubuntu系统中安装Hadoop，和在本地电脑安装Hadoop，基本相似，但是，也有略微差别，必须正确配置，否则，会导致无法顺利启动。安装Hadoop之前，请确保已经根据前面的博客《在ECS实例的Ubuntu系统中安装Java》完成了Java的安装。
继续阅读

使用FTP软件向ECS实例中的Ubuntu系统上传和下载文件

返回《在阿里云中搭建大数据实验环境》首页
提示：本教程是一个系列文章，请务必按照本教程首页中给出的各个步骤列表，按照先后顺序一步步进行操作，本博客假设你已经顺利完成了之前的操作步骤。
在大数据实验操作中，我们经常需要从本地电脑上传数据或者软件到阿里云ECS的Ubuntu系统中，或者需要从ECS的Ubuntu系统中下载数据到本地电脑。因此，需要了解如何使用FTP软件向ECS实例中的Ubuntu系统上传和下载文件。
继续阅读

在ECS实例的Ubuntu系统中安装Java

返回《在阿里云中搭建大数据实验环境》首页
提示：本教程是一个系列文章，请务必按照本教程首页中给出的各个步骤列表，按照先后顺序一步步进行操作，本博客假设你已经顺利完成了之前的操作步骤。
无论是Hadoop，还是Spark，都需要Java运行环境，因此，需要在ECS实例的Ubuntu系统中安装Java。由于本教程使用Hadoop2.7.1和Spark2.1.0（要求必须Java8及以上版本），因此，需要安装Java8。如果你的ECS实例中的Ubuntu是Java7，那么版本太旧，必须删除，然后，安装Java8,。
继续阅读

使用Putty软件实现SSH登录到Ubuntu系统

返回《在阿里云中搭建大数据实验环境》首页
提示：本教程是一个系列文章，请务必按照本教程首页中给出的各个步骤列表，按照先后顺序一步步进行操作，本博客假设你已经顺利完成了之前的操作步骤。
假设我们在本地使用台式机或笔记本电脑，有时候，我们要在远程的云服务器ECS的Ubuntu中执行一些Shell命令来完成一些操作，如果采用阿里云网页管理控制台的方式，非常繁琐（要访问官网、登录账户、发起远程连接、进入Ubuntu系统、打开终端），因此，建议在本地电脑上，使用Putty软件实现SSH登录到远程ECS实例中的Ubuntu系统，这样做非常方便快捷。
继续阅读

厦大数据库实验室博客

大数据