林子雨编著《大数据技术原理与应用》教材配套上机练习题目

厦门大学林子雨编著《大数据技术原理与应用》

教材配套课后上机练习题目

访问教材官网

作者:厦门大学计算机科学系 林子雨(ziyulin@xmu.edu.cn, http://www.cs.xmu.edu.cn/linziyu)

工信部”全国云计算及大数据应用技术人才培训考试项目”唯一指定大数据教材

全国多所高校大数据课程选用本教材

下载教材配套讲义PPT | 当当网购买本书|京东商城购买本书|亚马逊购买本书

面向教师的大数据课程教师服务站 | 面向学生的大数据课程学生服务站

大数据技术原理与应用教材配套上机练习网页二维码

扫一扫手机访问本主页

相关内容:厦门大学林子雨编著《大数据技术原理与应用》教材配套机房上机实验指南


第1章|第2章|第3章|第4章|第5章|第6章|第7章|第8章|第9章|第10章|第11章|第14章|第16章


林子雨-大数据技术原理与应用教材封面2015年6月1日

版权声明:本站所有教学资源有版权,请勿用于商业用途。

使用说明:为了读者更好地消化理解林子雨编著《大数据技术原理与应用》教材的内容,厦门大学数据库实验室为该教材的每个章节都精心设计了课后上机练习题目,相关上机练习题目都包含了入门级的软件安装和使用指导,让学生在学会基础使用方法后,再去完成相关作业内容。需要说明的是,本套题目,都是用于课后时间内学生在自己宿舍或实验室完成上机练习。如果需要在机房统一上机的实验题目,请访问主页厦门大学林子雨编著《大数据技术原理与应用》教材配套机房上机实验指南,下载机房上机题目。

第1章 大数据概述

本章为概念介绍,暂无配套上机练习题目。

第2章 大数据处理架构Hadoop

【习题2-1】

习题名称:安装Hadoop

习题目的:

1.掌握Linux虚拟机安装方法或者双操作系统安装方法。Hadoop在Linux操作系统上运行可以发挥最佳性能,鉴于目前很多读者可能正在使用Windows操作系统,因此,为了完成本书的后续实验,这里有必要通过本实验让读者掌握在Windows操作系统上搭建Linux虚拟机的方法,以及安装双操作系统的方法(同时安装Windows和Linux系统,电脑开机时,可以选择登录哪个系统)。

2.掌握Hadoop的伪分布式安装方法。很多读者并不具备集群环境,需要在一台机器上模拟一个小的集群,因此,需要通过本实验让读者掌握在单机上进行Hadoop的伪分布式安装方法。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
习题2-1 安装Hadoop 2016年1月24日版本 下载
2015年9月版本 下载

第3章 Hadoop分布式文件系统

【习题3-1】

习题名称:熟悉常用的HDFS操作

习题目的:

(1)     理解HDFS在Hadoop体系结构中的角色;

(2)     熟练使用HDFS操作常用的Shell命令;

(3)     熟悉HDFS操作常用的Java API。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
 习题3-1 熟悉常用的HDFS操作  2016年1月24日版本  下载
 2015年9月版本 下载

【习题3-2】

习题名称:HDFS Java API编程实践

习题说明:上面的习题3-1难度较大,因此,设计了难度叫嚣的习题3-2,在实际本科教学中,建议采用习题3-2.

习题目的:

(1) 熟悉HDFS操作常用的Java API。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
 习题3-2 HDFS Java API编程实践  2016年3月2日版本 下载

 

第4章 分布式数据库HBase

【习题4-1】

习题名称:熟悉常用的HBase操作

习题目的:

  1. 理解HBase在Hadoop体系结构中的角色;
  2. 熟练使用HBase操作常用的Shell命令;
  3. 熟悉HBase操作常用的Java API。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
习题4-1  熟悉常用的HBase操作 2016年1月24日版本 下载
2015年9月版本 下载

【习题4-2】

习题名称:HBase Shell命令和Java API编程实践

习题说明:上面的习题4-1难度较大,因此,设计了难度叫嚣的习题4-2,在实际本科教学中,建议采用习题4-2.

习题目的:

  1. 理解HBase在Hadoop体系结构中的角色;
  2. 熟练使用HBase操作常用的Shell命令;
  3. 熟悉HBase操作常用的Java API。

习题下载:习题版本在不断更新,请下载最新版本。

习题名称 版本号 下载WORD格式
习题4-2 HBase Shell命令和Java API编程实践 2016年3月9日版本 下载

 

第5章 NoSQL数据库

【习题5-1】

习题名称:关系数据库和NoSQL数据库操作实践

习题目的:

旨在让学生了解关系数据库、键值数据库、列族数据库和文档数据库的基本操作,比较同样的数据库操作在不同类型的数据库产品中的实现方法,体会其中的异同点,从而加深对关系数据库和NoSQL数据库的认识。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
 习题5-1 关系数据库和NoSQL数据库操作实践  2016年1月24日版本 下载
2015年9月版本 下载

 

【习题5-2】

习题名称:熟悉MongoDB的基本操作

习题说明:上面的习题5-1如果任务量较大,可以考虑采用相对简单的本习题。

习题目的:

1.理解NoSQL数据库和关系型数据库的区别;

2.熟练使用MongoDB操作常用的Shell命令。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
 习题5-2 熟悉MongoDB的基本操作  2016年3月22日版本 下载

第6章 云数据库

【习题6-1】

习题名称:使用RDS for MySQL数据库

习题目的:

1.以阿里云RDS为实例了解云数据库的使用方法;

2.熟练使用MySQL数据库操作命令;

3.熟悉连接RDS for MySQL数据库的方法。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
习题6-1  使用RDS for MySQL数据库  2016年1月24日版本 下载
2015年9月版本 下载

第7章MapReduce

【习题7-1】

习题名称:MapReduce编程初级实践

习题目的:

1.通过实验掌握基本的MapReduce编程方法;

2.掌握用MapReduce解决一些常见的数据处理问题,包括数据去重、数据排序和数据挖掘等。

习题难度:高难度

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
 习题7-1 MapReduce编程初级实践   2016年1月24日版本 下载
2015年9月版本 下载

 

【习题7-2】

习题名称:用MapReduce实现数据集连接(Join)操作

习题目的:

  • 熟悉MapReduce的工作原理及框架搭建;
  • 掌握使用MapReduce实现多个数据集连接的基本方法;
  • 培养基本的MapReduce项目实现能力。

难度指数:高难度

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
 习题7-2 用MapReduce实现数据集连接(Join)操作   2016年1月24日版本 下载
2015年11月版本  下载

 

【习题7-3】

习题名称:编写MapReduce程序实现词频统计

习题目的:

  • 理解Hadoop中MapReduce模块的处理逻辑
  • 熟悉MapReduce编程

难度指数:容易

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
 习题7-3 编写MapReduce程序实现词频统计   2016年3月29日版本 下载

 

第8章 流计算

【习题8-1】

习题名称:大数据技术与流量分析-网络攻击检测

习题目的:

  • 了解DDoS攻击,了解DDoS攻击的原理与检测方法;
  • 掌握基于Storm的实时流量日志处理流程。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
 习题8-1 大数据技术与流量分析-网络攻击检测   2016年1月24日版本 下载

第9章 图计算

【习题9-1】

习题名称:图计算框架Hama的基础操作实践

习题目的:旨在让学生了解Pregel图计算模型,并学会用Pregel的开源实现Hama实现一些基本操作。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
习题9-1  图计算框架Hama的基础操作实践   2016年1月24日版本 下载

第10章 数据可视化

【习题10-1】

习题名称:D3可视化库安装和使用

习题目的:旨在让学生了解D3可视化库,并掌握最基本的使用方法,会生成一些比较简单的图表。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
习题10-1  D3可视化库安装和使用   2016年1月24日版本 下载
2015年10月版本 下载

【习题10-2】

习题名称:可视化工具Tableau操作实践

习题目的:旨在让学生了解Tableau这款可视化工具,学会简单操作Tableau以及制作简单的图表。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
习题10-2 可视化工具Tableau操作实践   2016年1月24日版本 下载
2015年10月版本 下载

【习题10-3】

习题名称:Easel.ly信息图制作实践

习题目的:旨在让学生了解信息图制作工具Easel.ly,并掌握最基本的使用方法,会生成一些比较简单的信息图。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
习题10-3 Easel.ly信息图制作实践   2016年1月24日版本 下载
2015年10月版本 下载

【习题10-4】

习题名称:数据可视化工具魔镜和基于ECharts可视化库的图表制作

习题目的:

  • 了解数据可视化的基本概念;
  • 掌握魔镜制作基本图表;
  • 掌握ECharts制作中级图表。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
习题10-4 数据可视化工具魔镜和基于ECharts可视化库的图表制作 2016年1月30日版本 下载
  2016年1月24日版本 下载

 

第11章 大数据在互联网领域的应用

【习题11-1】

习题名称:大数据推荐系统

习题目的:

  • 了解大数据在互联网领域的应用——推荐系统;
  • 了解推荐系统原理以及常用的推荐算法;
  • 掌握推荐算法的实践流程。

习题下载:习题版本在不断更新,请下载最新版本

 

习题名称 版本号 下载WORD格式
习题11-1 大数据推荐系统 2016年3月11日版本 下载
  2016年1月24日版本 下载

 

第14章 基于Hadoop的数据仓库Hive

备注:本章为2016年新增章节,不在2015年8月1日出版的《大数据技术原理与应用》教材中,将会放入下一版本教材。

【习题14-1】

习题名称:熟悉Hive的基本操作

习题目的:

(1)认清Hive在Hadoop体系结构中的角色担当;

(2)熟悉Hive中常用的HiveQL语句;

(3)可以完成简单的MapReduce统计任务。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
习题14-1 熟悉Hive的基本操作 2016年4月16日版本 下载

第16章 Spark

备注:本章为2016年新增章节,不在2015年8月1日出版的《大数据技术原理与应用》教材中,将会放入下一版本教材。

【习题16-1】

习题名称:熟悉常用的Spark操作

习题目的:

  1. 熟悉Spark Shell的使用;
  2. 熟悉常用的Spark RDD API、Spark SQL API和Spark DataFrames API。

习题下载:习题版本在不断更新,请下载最新版本

习题名称 版本号 下载WORD格式
习题16-1 熟悉常用的Spark操作 2016年4月20日版本 下载

备注:第12章和第13章是关于大数据的应用,属于学生自学内容,都是概念性介绍,不需要上机练习。第15章Hadoop架构再探讨,属于理论层面内容,不需要上机习题。