大数据技术原理与应用 第十六章 Spark 学习指南

【版权声明:本指南为厦门大学林子雨编著的《大数据技术原理与应用》教材配套学习资料,版权所有,转载请注明出处,请勿用于商业用途】

注:第十六章Spark,本章为2016年新增章节,不在2015年8月1日由人民邮电出版社出版发行的《大数据技术原理与应用》中,会被放入到教材的下一个版本中。

Apache Spark 是一个新兴的大数据处理通用引擎,提供了分布式的内存抽象。Spark 最大的特点就是快,可比 Hadoop MapReduce 的处理速度快 100 倍。本指南将介绍 Spark 的安装与基本使用。请务必仔细阅读完厦门大学林子雨编著的《大数据技术原理与应用》第16章节,再结合本指南进行学习。

继续阅读

大数据技术原理与应用 第八章 流计算 学习指南

【版权声明:本指南为厦门大学林子雨编著的《大数据技术原理与应用》教材配套学习资料,版权所有,转载请注明出处,请勿用于商业用途】

Storm 是目前使用最为广泛的开源流计算框架,可用于实时日志分析、个性化推荐、实时监控等应用场景中。本指南将介绍 Storm 的安装与基本使用。请务必仔细阅读完厦门大学林子雨编著的《大数据技术原理与应用》第8章节,再结合本指南进行学习。

继续阅读

大数据技术原理与应用 第十章 数据可视化 学习指南

【版权声明:本指南为厦门大学林子雨编著的《大数据技术原理与应用》教材配套学习资料,版权所有,转载请注明出处,请勿用于商业用途】

本指南介绍了数据可视化的相关教程以及现下一些比较流行的解决方案。请务必仔细阅读完厦门大学林子雨编著的《大数据技术原理与应用》第10章节,再结合本指南进行学习。

数据可视化是现今比较成熟的大数据领域,有很多公司都推出了成熟易用的数据可视化平台,用户可以通过简单的操作完成繁杂的数据可视化过程达到很好的效果。

继续阅读

大数据原理与应用 第五章 NoSQL数据库 学习指南

【版权声明:本指南为厦门大学林子雨编著的《大数据技术原理与应用》教材配套学习资料,版权所有,转载请注明出处,请勿用于商业用途】

本指南介绍NoSQL数据库使用方法。请务必仔细阅读完厦门大学林子雨编著的《大数据技术原理与应用》第5章 NoSQL数据库,再结合本指南进行学习。

继续阅读

Ubuntu/CentOS安装Python机器学习包

Python 虽然是一门脚本语言,但借助诸如 Numpy、Scipy 等功能强大的 package(包),如今 Python 在科学计算、机器学习、数据挖掘方面都有较为广泛的应用。本教程介绍如何在 Ubuntu/CentOS 中安装常用的 Python 机器学习包,包括 NumPy、pandas、SciPy、StatsModels、scikit-learn、matplotlib。

继续阅读

Windows安装Python机器学习包

Python 虽然是一门脚本语言,但借助诸如 Numpy、Scipy 等功能强大的 package(包),如今 Python 在科学计算、机器学习、数据挖掘方面都有较为广泛的应用。本教程介绍如何在 Windows 中安装常用的 Python 机器学习包,包括 NumPy、pandas、SciPy、StatsModels、scikit-learn、matplotlib。

继续阅读

Python安装与基本使用_Windows/Ubuntu

Python 是一种跨平台的开源编程语言,它功能强大且简单易学。Python 目前主要有两个版本:2.x 版本和 3.x 版本。本教程基于 Python2.7,简单介绍了 Windows、Ubuntu 中 Python 的安装与基本使用。

继续阅读

大数据原理与应用 第七章 MapReduce 学习指南

【版权声明:本指南为厦门大学林子雨编著的《大数据技术原理与应用》教材配套学习资料,版权所有,转载请注明出处,请勿用于商业用途】

本指南介绍MapReduce基本编程方法。请务必仔细阅读完厦门大学林子雨编著的《大数据技术原理与应用》第7章节(MapReduce),再结合本指南进行学习。

继续阅读

数据可视化中级教程

数据可视化作为大数据分析的最后一环,直接影响着我们对大数据的分析和使用。相比于枯燥无味的文字描述,数据可视化将大数据集中的数据以图形图像的形式表示,并利用数据分析和开发工具发现数据之间的关系,挖掘数据中潜在的价值。而数据中蕴含的价值,对于企业领导决策具有重要的参考价值。

继续阅读