本文摘自林子雨编著《大数据导论》(访问教材官网)
作者:厦门大学计算机科学系 林子雨 博士/副教授 全国高校知名大数据教师
E-mail: ziyulin@xmu.edu.cn
大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合。大数据产业包括IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层和数据应用层,具体如表1-6所示。
表1-6 大数据产业链的各个环节
产业链环节 包含内容
IT基础设施层 包括提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务的企业,比如,提供数据中心解决方案的IBM、惠普和戴尔等,提供存储解决方案的EMC,提供虚拟化管理软件的微软、思杰、SUN、Redhat等
数据源层 大数据生态圈里的数据提供者,是生物(生物信息学领域的各类研究机构)大数据、交通(交通主管部门)大数据、医疗(各大医院、体检机构)大数据、政务(政府部门)大数据、电商(淘宝、天猫、苏宁云商、京东等电商)大数据、社交网络(微博、微信、人人网等)大数据、搜索引擎(百度、谷歌等)大数据等各种数据的来源
数据管理层 包括提供数据抽取、转换、存储和管理等服务的各类企业或产品,如分布式文件系统(如Hadoop的HDFS和谷歌的GFS)、ETL工具(Informatica、Datastage、Kettle等)、数据库和数据仓库(Oracle、MySQL、SQL Server、HBase、GreenPlum等)
数据分析层 包括提供分布式计算、数据挖掘、统计分析等服务的各类企业或产品,如分布式计算框架MapReduce、统计分析软件SPSS和SAS、数据挖掘工具Weka、数据可视化工具Tableau、BI工具(MicroStrategy、Cognos、BO)等
数据平台层 包括提供数据分享平台、数据分析平台、数据租售平台等服务的企业或产品,如阿里巴巴、谷歌、中国电信、百度等
数据应用层 提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业、机构或政府部门,如交通主管部门、各大医疗机构、菜鸟网络、国家电网等
目前,我国已形成中西部地区、环渤海地区、珠三角地区、长三角地区、东北地区五个大数据产业区。在政府管理、工业升级转型、金融创新、医疗保健等领域,大数据行业应用已逐步深入。一些地方政府也在积极尝试以“大数据产业园”为依托,加快发展本地的大数据产业。大数据产业园是大数据产业的聚集区或大数据技术的产业化项目孵化区,是大数据企业的孵化平台以及大数据企业走向产业化道路的集中区域。陕西西咸新区沣西新城已在信息产业园中规划了国内首家以大数据处理与服务为特色的产业园区;重庆市政府出台的《重庆市大数据行动计划》中明确提出,重庆市将打造2至3个大数据产业示范园区,培育10家核心龙头企业、500家大数据应用和服务企业,引进和培养1 000名大数据产业高端人才,形成500亿元大数据产业规模,建成国内重要的大数据产业基地;天津市在2013年11月初公布了《滨海新区大数据行动方案(2013—2015)》,方案中明确提出,把天津建设成为具有国际竞争力的大数据产业基地和数据资源聚集服务区。位于福建省泉州市安溪县龙门镇的中国国际信息技术(福建)产业园(见图1-13),于2015年5月建成投入运营,是福建省第一个大数据产业园区,致力于以国际最高等级第三方数据中心为核心,构建以信息技术服务外包为主的绿色生态产业链,打造集数据中心、安全管理、云服务、电子商务、数字金融、信息技术教育、国际交流、投融资环境等功能为一体,覆盖福建、辐射海西的国际一流高科技信息技术产业园区。