大数据实验平台

中国高校大数据课程公共服务平台LOGO(图上文下)

本服务站是“中国高校大数据课程公共服务平台”的11大工程中的“11号子工程”

大数据实验平台:联合企业为高校提供大数据教学和科研实验实训机房解决方案

建设者:厦门大学计算机科学系  林子雨 博士/助理教授

(E-mail: ziyulin@xmu.edu.cn, 个人主页:http://www.cs.xmu.edu.cn/linziyu)

(版权声明:本平台所有资源有版权,请勿用于商业用途)

大数据实验平台主页二维码

扫一扫手机访问本主页

会议通知:第1届全国高校大数据教学研讨会将于2017年5月12日-13日(周六)在厦门大学举办,欢迎参会


实验平台简介 | 实验平台功能 | 平台建设参与方角色 | 建设单位 | 合作伙伴 | 诚邀加盟

大数据课程综合实验案例:网站用户购物行为分析
Spark课程综合实验案例:淘宝双11数据分析与预测
Spark课程实验案例:Spark+Kafka构建实时分析Dashboard

教材配套机房上机实验指南 |  大数据软件安装和编程实践指南


实验机房图片2

实验平台简介

上机实践是高校大数据教学必不可少的重要环节,可以帮助学生更好消化吸收课程内容、提高学生动手能力、激发学生学习兴趣 。作为“中国高校大数据课程公共服务平台”的第11号子工程,大数据实验平台旨在精心打造针对高校教学和科研工作量身定制的大数据实验平台,满足课程上机实验、课程设计、实习实训、科研训练等多方面需求。为此,厦门大学数据库实验室秉承“强强联合、整合资源”理念,积极联合国内领先的大数据基础实施供应商(国富瑞(福建)信息技术产业园有限公司)、大数据教学科研平台供应商(上海睿亚训软件技术服务有限公司)、大数据产品开发企业(科技谷(厦门)信息技术有限公司)、大数据交易与服务供应商(数据堂),共同构建大数据实验平台生态系统,努力为全国高校提供优质的大数据实验平台解决方案。

大数据实验平台功能

  • 典型实战数据分析实验
  • 提供完整的高校数据挖掘与大数据分析的实验室解决方案
  • 通过典型的算法展示、算法实现结合大数据分析的应用场景与案例对学生进行数据分析方面的综合训练

大数据实验平台架构图

表 大数据实训系统介绍-实训内容

实验类型 实验名称

数据挖掘展示性实验

数据基础统计实验
数据预处理实验
组合算法分析实验
分类算法实验
聚类算法实验
离群检测实验
时间序列分析实验
数据挖掘R语言开发实验 数据基础统计实验
数据预处理实验
组合算法分析实验
分类算法实验
聚类算法实验
离群检测实验
时间序列分析实验
大数据基础实验 Hadoop环境的搭建实验
基础MapReduce开发实验
迭代式MapReduce开发实验
分区、排序和合并算法实验
Hive的使用实验
大数据综合实验 超市零售数据分析实验
Netflix电影数据分析实验
组合算法分析实验
新浪微博消息分析实验
带有感情标签的微博数据分析实验
网络安全日志分析实验
出租车GPS位置分析实验
社交资源共享站点用户行为分析实验

 

实验平台建设参与方角色

大数据实验平台生态系统

(图 大数据实验平台建设参与方)

行业 角色 参与方
大数据基础实施供应商 提供实验平台运行的基础设施 国富瑞(福建)信息技术产业园有限公司
大数据教学科研平台供应商 提供大数据实验平台 上海睿亚训软件技术服务有限公司
大数据课程资源提供方 提供大数据课程内容和实验方案 厦门大学数据库实验室
大数据产品开发企业 提供行业解决方案案例和企业实战环境 科技谷(厦门)信息技术有限公司

深圳前海鹏元数据技术有限公司

大数据交易与服务供应商 提供教学实践和科研训练大数据 数据堂(北京)科技股份有限公司

(2013年5月 厦门大学代表团到中国国际信息技术(福建)产业园访问交流)

IMG_7668

(2016年6月 和上海睿亚训公司签订合作协议,林子雨被聘为首席科学家)

2016年6月14日数据堂公司段傲东等来访

(2016年6月  数据堂公司郭维峰、段傲东、付超等访问实验室)

2016年6月21日林子雨访问科技谷和陈思恩合影

(2016年6月  与科技谷公司进行合作交流,图为林子雨和公司CEO陈思恩合影)

IMG_7886

(2016年7月 与深圳鹏元数据签订合作协议)

实验平台建设单位

(1)厦门大学数据库实验室

厦门大学数据库实验室是“厦门大学信息科学与技术学院文明卫生实验室”和“红旗实验室”,位于厦门大学海韵园,坐落在美丽的厦门珍珠湾,与大海仅有百米之隔。实验室老师包括冯少荣老师(副教授)、张东站老师(副教授)、林子雨老师(助理教授)、林文水老师(助理教授)。 实验室承担计算机系数据库课程的本科生和研究生教学工作,在数据库、数据仓库和数据挖掘领域开展相关研究,为社会培养了众多优秀的本科和硕士毕业生。实验室曾先后承办了第二十一届全国数据库库会议NDBC2004第5届全国高等学校计算机程序设计课程研讨会等大型学术和教学研讨会,受到了广泛好评,在国内高校具有较高的知名度。

实验室建设了国内高校首个也是目前唯一一个“中国高校大数据课程公共服务平台”(平台官网),为教师开展大数据教学和学生学习大数据课程提供全方位、一站式免费服务,包括讲义PPT、教学大纲、备课指南、学习指南、上机习题、授课视频、技术资料等。

中国高校大数据课程公共服务平台LOGO(图上文下)

访问平台主页

IMG_9827

(图  厦门大学数据库实验室大数据课程建设团队)

 

(2)上海睿亚训软件技术服务有限公司

ruiyaxun

上海睿亚训软件技术服务有限公司(官网)成立于2009年,是中国领先的IT教育云应用及服务提供商,为国内高校提供云计算与大数据学生上机实验室解决方案。已构建了包括传统软件开发如Java、.NET、测试,移动开发如Android、IOS及云计算、大数据等实践教育体系,并通过虚拟化云计算及移动互联网技术手段、结合线上及线下整合模式,为用户提供从教育内容建设、教育私有云建设为主,辅以培训、实训、评估到人力资源服务的整体解决方案,为中国的IT教育带来全新的活力。

目前已于全国近200家高等院校建立了合作关系,并与VMware、英特尔及惠普等各厂商建立了合作关系,有近20万高校专业学生通过睿亚训实践体系进行了职业技能提升,是国内IT类实践教育的市场领导者。

上海睿亚训软件技术服务有限公司

地址:上海市徐汇区钦州路100号

科创大厦2号楼206室

邮编:201203

实验平台合作伙伴

(1)国富瑞(福建)信息技术产业园有限公司

国富瑞(福建)信息技术产业园有限公司是培训交流班的联合主办方,公司成立于2010年12月,是中国国际信息技术(福建)产业园管理委员会和中国国际电子商务中心(公司下属全资子公司国富瑞(北京)投资有限的合资公司。

中国国际信息技术(福建)产业园(以下简称“EC产业园”)(官网),位于福建省泉州市安溪县龙门镇南翼新城开发区高新技术产业园内(距离厦门北站约30公里,从厦门北站直接上高速公路20分钟直达园区,全程高速无红绿灯),总占地面积约1300亩。产业园规划建筑面积约100万平方米,主要建设内容包括核心业务区、综合服务区两大板块。其中,核心业务区包括数据灾备机房区、灾备指挥区、云计算中心、物联网研究中心、金融信息化中心、通讯运营中心、医疗运营中心、海峡两岸名品网络交易俱乐部、特色行业无纸化交易中心等功能板块;综合服务区包括海峡电子商务区、APEC电子商务国际交流中心、IT服务外包培训学院区、园区生活配套区等功能板块。产业园项目预计土建投资28亿元人民币,包括设备投资、基础设施投资等在内的总投资额将达60亿元人民币。

产业园致力于以国际最高等级第三方灾备/数据中心为核心,构建以信息技术服务外包为主的绿色生态产业链,打造集数据集中、安全管理、云服务、电子商务、数字金融、信息技术教育、国际交流、投融资环境等功能为一体,覆盖福建、辐射海西的国际一流高科技信息技术产业园区,实现一流环境吸引一流人才,一流人才创造一流业务,一流业务成就一流园区的良性发展目标。

EC产业园内的云计算与大数据培训基地具有以下基础条件和优势:

(a)完善的基础设施。EC产业园已经建成国内一流的教学楼、实验楼、行政办公楼、科学研究中心、文体活动中心、图书馆、餐厅、公寓等设施,是国内最具现代化和最富有特色的教育实训基地之一。

(b)先进的数据中心。EC产业园拥有华东南最大的高可用数据中心,项目总投资为20亿元,主要建设数据机房、动力中心、管理监控、业务处理和后勤保障等功能区建筑。按照国际上最高的T4等级标准设计和施工,可提供T2-T4等级服务,总建筑面积6.7万平方米,可安装4500个标准机柜,可容纳5万台以上的服务器。数据中心由中国国际电子商务中心负责组织运营,为福建省以及周边地区(包括台湾)的各级政府和企事业单位提供数据存储、数据交换、数据处理、数据灾备、系统测试、容灾恢复以及IT咨询、培训和技术支持等专业数据服务。同时还将提供云计算、物联网业务的服务。

(c)完整的产业链条。EC产业园作为信息化重要基础设施,总规划面积约2万亩,规划目标以大规模、多等级数据中心为核心,发展云计算、数字媒体、服务外包、电子商务、文化创意等五大产业,将逐步形成国内产业功能最为完善、布局合理的信息产业园,成为特色鲜明、功能完善、技术领先、带动显著、国内最大的服务外包示范平台。

(d)优惠的政策条件。2014年10月,福建省人民政府出台了支持发展大数据重点园区建设的十条措施,力争把数字福建(长乐)产业园、中国国际信息技术(福建)产业园建设成为全省大数据产业园区和“数字福建”建设的重要承载基地。新举措主要包括完善园区发展规划、引进培育产业龙头、推动资源汇聚开发、建设创新平台、加强人才培养、做好园区用地保障、确保园区用电需求、强化园区网络支撑、提高安全保障能力等。可以说,在政策层面,无论是园区建设还是人才培养,EC产业园都获得了较好的优势发展条件。

(2)数据堂(北京)科技股份有限公司

数据堂(股票代码:831428)成立于2011年,为国内上市的大数据资源服务龙头企业,致力于成为全球最大的数据服务商。秉承“专注数据,共享价值”的服务理念,旨在盘活和融合各类大数据资源,挖掘数据价值,为客户产品和服务增值,为社会发展和进步献策。

数据堂创始及合伙人来自Stanford University、NEC、腾讯、华为等知名高校,互联网和高科技公司。数据堂在非结构化数据处理、大数据云服务等方面拥有国际领先的自主核心技术,50%以上的员工从事创新、研究与技术开发工作。目前数据堂拥有4家全资子公司,并在硅谷下设美国子公司。

通过获取线下大数据、行业大数据以及政府大数据,数据堂整合了涵盖科技、信用、交通、医疗、卫生、通信、天气、地理、质监、环境、商户、电力等数十大领域的大规模数据。以此为基础,为客户提供专业数据采集处理、共享交易及数据云服务。当前数据堂已为百度、腾讯、阿里巴巴、平安、Microsoft、Facebook、Intel、NEC、Canon、Samsung等国内外知名企业,以及众多国内外创新创业公司提供数据服务。

(3)科技谷(厦门)信息技术有限公司

科技谷(厦门)信息技术有限公司成立于2013年,是一家专注于大数据技术与应用服务的高科技企业,在大数据管理和分析、信息检索等方面具有国内领先的自主核心技术和尖端产品,为航空旅游、交通管理、公共安全等领域提供大数据整体优化解决方案。科技谷创业伊始就形成了以海外归国留学人员为核心的研发团队,积极参与国内民航、交通、公共安全等行业的信息化改造,拥有大数据产业链上下游资源和多项数据存储和处理的自主知识产权。
科技谷自主研发的大数据管理平台已成功应用在国内民航、公共安全等领域;科技谷的数据挖掘工具可以让组织通过视觉化海量数据来发现数据之间蛛丝马迹的联系。在未来云计算、大数据和移动互联网的发展浪潮中,公司将致力于大数据技术和服务的持续创新,打造大数据领域卓越品牌,逐步成为全球大数据技术与应用的领导者,做中国的Palantir。

合作加盟

诚邀相关高校企业加盟合作,共建高校大数据实验平台生态系统。

联系方式:

厦门大学数据库实验室  林子雨 老师

E-mail: ziyulin@xmu.edu.cn