本文摘自林子雨编著《大数据导论》(访问教材官网)
作者:厦门大学计算机科学系 林子雨 博士/副教授 全国高校知名大数据教师
E-mail: ziyulin@xmu.edu.cn
在大数据蓬勃发展的大背景下,市场上的大数据人才缺口不断扩大。高校作为人才培养基地,顺应市场需求,培养更多的、高质量的、适应经济和社会发展的数据科学复合型人才是义不容辞的责任,高校需要及时培养出理论型、实践型、应用型的大数据人才,为数据科学研究和大数据应用贡献力量。为满足社会对大数据人才的需求,斯坦福大学、加州大学伯克利分校、密歇根大学等世界著名大学纷纷建立数据科学研究中心并设置大数据专业。在我国,大数据专业也已经成为一个炙手可热的“新工科”专业。目前,国内高校开设的大数据专业主要包括本科院校设立的“数据科学与大数据技术专业”和高职院校设立的“大数据技术与应用”专业。截至2020年,全国已经有1000余所高校设立了大数据专业。
这里简要介绍一下大数据专业的人才培养目标、毕业生就业岗位、大数据专业知识体系、大数据专业课程体系和大数据专业的编程语言。
(1) 大数据专业的人才培养目标
大数据专业致力于培养符合国家战略及大数据产业发展需求,具备较好的数据素养和数理基础、扎实的编程基础以及大数据基础知识与技能,熟练掌握大数据采集、预处理、存储、处理、分析、应用技术,能够运用大数据思维、模型和工具解决实际问题的高级复合型人才。大数据专业的毕业生能在互联网企业、金融机构、科研院所、高等院校等从事大数据分析、挖掘、处理、服务、应用和研究工作,亦可从事各行业大数据系统的集成、设计、开发、管理、维护等工作,也适合在高等院校及科研院所的相关交叉学科继续深造。
(2)毕业生就业岗位
大数据专业毕业生就业岗位包括两大类:应用类(大数据分析师)和系统类(大数据工程师)。其中,应用类岗位还可以分为大数据分析师、业务数据分析师、数据建模师、数据算法师;系统类岗位还可以分为大数据开发工程师、大数据架构师、大数据运维工程师和数据库管理员。
(3) 大数据专业知识体系
从学科角度而言,大数据可以理解为一个跨多学科领域的,从数据中获取知识的科学方法、技术和系统的集合。因此,大数据专业知识体系涵盖了计算机、数学、统计学等多个学科领域,结合了诸多领域中的理论和技术,包括应用数学、统计学、模式识别、机器学习、人工智能、深度学习、数据可视化、数据挖掘、数据仓库、分布式计算、云计算、系统架构设计等。
从大数据分析角度而言,典型的大数据分析过程包括:数据采集与预处理、数据存储与管理、数据处理与分析、数据可视化等。因此,大数据专业知识体系涵盖了数据采集与预处理技术、数据存储与管理技术、数据处理与分析技术、数据可视化技术等。同时,在分析过程中,对商业领域的业务知识也需要一定的理解。
大数据专业课程体系
大数据专业课程体系涵盖通识教育课、学科基础课、专业基础课、专业核心课和专业课,具体如下:
(1)通识教育课:思政类课程、军体类课程、外语课、创新创业课等;
(2)学科基础课:高等数学、线性代数、概率论与数理统计等;
(3)专业基础课:程序设计、计算机系统基础及组成原理、离散数学、计算机网络、算法与数据结构、数据库系统、操作系统、软件工程等;
(4)专业核心课:大数据导论、网络爬虫与数据采集、数据清洗、NoSQL数据库、数据可视化、分布式并行编程、机器学习等;
(5)专业课:云计算、数据安全、数据仓库、数据挖掘等。