第2届全国高校大数据教学研讨会将于2018年5月12日(周六)在厦门大学举办,欢迎报名参会,报名主页:http://dblab.xmu.edu.cn/post/bdts2018/
2017年第1届全国高校大数据教学研讨会上,来自全国300多所高校的400余位教师来厦门大学参加了会议。
HIVE-分区表详解以及实例
本文转自“博客园”,林子雨老师收藏到厦门大学数据库实验室博客中,原文链接地址是https://www.cnblogs.com/kouryoushine/p/7801924.html
HIVE中的分区表是什么,我们先看操作,然后再来体会。
继续阅读
在Eclipse中创建Dynamic Web Project
在学习大数据综合案例时,需要使用网页来呈现数据挖掘结果,因此,需要在Ubuntu中搭建Tomcat服务器,提供网页服务。同时,需要在Eclipse中建立网页项目Dynamic Web Project。Eclipse默认是不包含这个Web插件的,无法创建Dynamic Web Project,因此,需要额外安装相关插件,才能顺利创建Dynamic Web Project。本指南将引导读者一步步完成该过程。
继续阅读
在Ubuntu16.04中安装Tomcat8
Tomcat 服务器是一个免费的开放源代码的Web 应用服务器,属于轻量级应用服务器,在中小型系统和并发访问用户不是很多的场合下被普遍使用,是开发和调试JSP 程序的首选。对于一个初学者来说,可以这样认为,当在一台机器上配置好Apache 服务器,可利用它响应HTML(标准通用标记语言下的一个应用)页面的访问请求。
继续阅读
Spark上机练习题:统计微博信息
本部分Spark上机练习题,是与林子雨编著《Spark编程基础》教程(官网)配套的题目,在学习完《Spark编程基础》第5章RDD编程的内容以后,可以顺利完成本题目。
【题目】Spark上机练习题:统计微博信息
Spark上机练习题:统计人口性别和身高
本部分Spark上机练习题,是与林子雨编著《Spark编程基础》教程(官网)配套的题目,在学习完《Spark编程基础》第5章RDD编程的内容以后,可以顺利完成本题目。
【题目】Spark上机练习题:统计人口性别和身高
Spark上机练习题:统计人口平均年龄
本部分Spark上机练习题,是与林子雨编著《Spark编程基础》教程(官网)配套的题目,在学习完《Spark编程基础》第5章RDD编程的内容以后,可以顺利完成本题目。
【题目】Spark上机练习题:统计人口平均年龄
大数据Linux实验环境虚拟机镜像文件
大数据Linux实验环境虚拟机镜像文件(安装镜像以后,遇到需要输入密码的地方,密码都是hadoop)
【镜像下载地址】请点击这里访问百度云盘下载镜像(需要安装百度云盘客户端,文件大小是6GB)
【制作单位】厦门大学数据库实验室 林子雨 老师 (ziyulin@xmu.edu.cn)
【版本】2017年11月6日
【配套教材】包含了与林子雨编著《大数据技术原理与应用(第2版)》教材配套的大数据实验环境
【镜像说明】
此镜像是使用VirtualBox虚拟机软件导出来的,里面包含了Ubuntu系统和全套大数据软件。遇到需要输入密码的地方,密码都是hadoop。
继续阅读
林子雨编著《Spark编程基础》教材第8章的代码
林子雨、赖永炫、陶继平编著《Spark编程基础》(教材官网)教材中的代码,在纸质教材中的印刷效果,可能会影响读者对代码的理解,为了方便读者正确理解代码或者直接拷贝代码用于上机实验,这里提供全书配套的所有代码。
查看教材所有章节的代码
继续阅读
林子雨编著《Spark编程基础》教材第7章的代码
林子雨、赖永炫、陶继平编著《Spark编程基础》(教材官网)教材中的代码,在纸质教材中的印刷效果,可能会影响读者对代码的理解,为了方便读者正确理解代码或者直接拷贝代码用于上机实验,这里提供全书配套的所有代码。
查看教材所有章节的代码
继续阅读