大数据原理与应用 第七章 MapReduce 学习指南

大数据技术原理与应用

【版权声明:本指南为厦门大学林子雨编著的《大数据技术原理与应用》教材配套学习资料,版权所有,转载请注明出处,请勿用于商业用途】

本指南介绍MapReduce基本编程方法。请务必仔细阅读完厦门大学林子雨编著的《大数据技术原理与应用》第7章节(MapReduce),再结合本指南进行学习。

MapReduce是一种分布式并行编程模型,是Hadoop核心子项目之一,如果已经安装了Hadoop,就不需要另外安装MapReduce。

学习本指南需要在Linux系统安装好Hadoop,如果机器上没有安装Linux和Hadoop,请返回大数据技术原理与应用 第2章 学习指南,根据指南学习并安装。

第7章涉及到很多的很多的理论知识点,主要的理论知识点包括:MapReduce概述、MapReduce的工作流程,WordCount实例分析,MapReduce的具体应用。这些理论知识点,请自己依靠厦门大学林子雨编著的《大数据技术原理与应用》第7章节进行学习,本指南不再重复表述。

MapReduce的程序可以用Eclipse编译运行或使用命令行编译打包运行,下面提供这两种方法,请点击链接访问。