Author: 林子雨老师

欢迎参加第2届全国高校大数据教学研讨会（2018年5月12日，厦门大学）

第2届全国高校大数据教学研讨会将于2018年5月12日（周六）在厦门大学举办，欢迎报名参会，报名主页：http://dblab.xmu.edu.cn/post/bdts2018/
2017年第1届全国高校大数据教学研讨会上，来自全国300多所高校的400余位教师来厦门大学参加了会议。

HIVE-分区表详解以及实例

本文转自“博客园”，林子雨老师收藏到厦门大学数据库实验室博客中，原文链接地址是https://www.cnblogs.com/kouryoushine/p/7801924.html
HIVE中的分区表是什么，我们先看操作，然后再来体会。
继续阅读

在Eclipse中创建Dynamic Web Project

在学习大数据综合案例时，需要使用网页来呈现数据挖掘结果，因此，需要在Ubuntu中搭建Tomcat服务器，提供网页服务。同时，需要在Eclipse中建立网页项目Dynamic Web Project。Eclipse默认是不包含这个Web插件的，无法创建Dynamic Web Project，因此，需要额外安装相关插件，才能顺利创建Dynamic Web Project。本指南将引导读者一步步完成该过程。
继续阅读

在Ubuntu16.04中安装Tomcat8

Tomcat 服务器是一个免费的开放源代码的Web 应用服务器，属于轻量级应用服务器，在中小型系统和并发访问用户不是很多的场合下被普遍使用，是开发和调试JSP 程序的首选。对于一个初学者来说，可以这样认为，当在一台机器上配置好Apache 服务器，可利用它响应HTML（标准通用标记语言下的一个应用）页面的访问请求。
继续阅读

Spark上机练习题：统计微博信息

本部分Spark上机练习题，是与林子雨编著《Spark编程基础》教程（官网）配套的题目，在学习完《Spark编程基础》第5章RDD编程的内容以后，可以顺利完成本题目。

【题目】Spark上机练习题：统计微博信息

继续阅读

Spark上机练习题：统计人口性别和身高

【题目】Spark上机练习题：统计人口性别和身高

继续阅读

Spark上机练习题：统计人口平均年龄

【题目】Spark上机练习题：统计人口平均年龄

继续阅读

大数据Linux实验环境虚拟机镜像文件

大数据Linux实验环境虚拟机镜像文件（安装镜像以后，遇到需要输入密码的地方，密码都是hadoop）
【镜像下载地址】请点击这里访问百度云盘下载镜像（需要安装百度云盘客户端，文件大小是6GB）
【制作单位】厦门大学数据库实验室林子雨老师 (ziyulin@xmu.edu.cn)
【版本】2017年11月6日
【配套教材】包含了与林子雨编著《大数据技术原理与应用（第2版）》教材配套的大数据实验环境
【镜像说明】
此镜像是使用VirtualBox虚拟机软件导出来的，里面包含了Ubuntu系统和全套大数据软件。遇到需要输入密码的地方，密码都是hadoop。
继续阅读

林子雨编著《Spark编程基础》教材第8章的代码

林子雨、赖永炫、陶继平编著《Spark编程基础》(教材官网)教材中的代码，在纸质教材中的印刷效果，可能会影响读者对代码的理解，为了方便读者正确理解代码或者直接拷贝代码用于上机实验，这里提供全书配套的所有代码。
查看教材所有章节的代码
 继续阅读

厦大数据库实验室博客

Author: 林子雨老师

欢迎参加第2届全国高校大数据教学研讨会（2018年5月12日，厦门大学）

HIVE-分区表详解以及实例

在Eclipse中创建Dynamic Web Project

在Ubuntu16.04中安装Tomcat8

Spark上机练习题：统计微博信息

【题目】Spark上机练习题：统计微博信息

Spark上机练习题：统计人口性别和身高

【题目】Spark上机练习题：统计人口性别和身高

Spark上机练习题：统计人口平均年龄

【题目】Spark上机练习题：统计人口平均年龄

大数据Linux实验环境虚拟机镜像文件

林子雨编著《Spark编程基础》教材第8章的代码

林子雨编著《Spark编程基础》教材第7章的代码