本文摘自林子雨编著《大数据导论》(访问教材官网)
作者:厦门大学计算机科学系 林子雨 博士/副教授 全国高校知名大数据教师
E-mail: ziyulin@xmu.edu.cn
大数据的兴起,将在很大程度上改变中国高校信息技术相关专业的现有教学和科研体制。一方面,数据科学家是一个需要掌握统计、数学、机器学习、可视化、编程等多方面知识的复合型人才,在中国高校现有的学科和专业设置中,上述专业知识分布在数学、统计和计算机等多个学科中,任何一个学科都只能培养某个方向的专业人才,无法培养全面掌握数据科学相关知识的复合型人才。另一方面,数据科学家需要大数据应用实战环境,在真正的大数据环境中不断学习、实践并融会贯通,将自身技术背景与所在行业业务需求进行深度融合,从数据中发现有价值的信息,但是,目前大多高校还不具备这种培养环境,不仅缺乏大规模基础数据,也缺乏对领域业务需求的理解。鉴于上述两个原因,目前国内的数据科学家人才并不是由高校培养的,而主要是在企业实际应用环境中通过边工作边学习的方式不断成长起来的,其中,互联网领域集中了大多数的数据科学家人才。
在未来5~10年,市场对数据科学家的需求会日益增加,不仅互联网企业需要数据科学家,类似金融、电信这样的传统企业在大数据项目中也需要数据科学家。由于高校目前尚未具备大量培养数据科学家的基础和能力,传统企业很可能会从互联网行业“挖墙角”,来满足企业发展对数据分析人才的需求,继而造成用人成本高企,制约企业的成长壮大。因此,高校应该秉承“培养人才、服务社会”的理念,充分发挥科研和教学综合优势,培养一大批具备数据分析基础能力的数据科学家,有效缓解数据科学家的市场缺口,为促进经济社会发展做出更大贡献。目前,国内很多高校开始设立大数据专业或者开设大数据课程,加快推进大数据人才培养体系的建立。2014年,中国科学院大学开设首个“大数据技术与应用”专业方向,面向科研发展及产业实践,培养信息技术与行业需求结合的复合型大数据人才;2014 年清华大学成立数据科学研究院,推出多学科交叉培养的大数据硕士项目;2015年10月,复旦大学大数据学院成立,在数学、统计学、计算机、生命科学、医学、经济学、社会学、传播学等多学科交叉融合的基础上,聚焦大数据学科建设、研究应用和复合型人才培养;2016年9月,华东师范大学数据科学与工程学院成立,新设置的本科专业“数据科学与工程”,是华东师大除“计算机科学与技术”和“软件工程”以外,第三个与计算机相关的本科专业。厦门大学于2013年开始在研究生层面开设大数据课程,并建设了国内高校首个大数据课程公共服务平台,为全国高校开展大数据教学提供一站式服务。2016年,北京大学、对外经贸大学、中南大学成为国内首批设立“数据科学与大数据技术专业”的高校,到2020年,全国累计有1000余所高校设立大数据相关专业。
高校培养数据科学家人才需要采取“两条腿”走路的策略,即“引进来”和“走出去”。所谓“引进来”,是指高校要加强与企业的紧密合作,从企业引进相关数据,为学生搭建起接近企业应用实际的、仿真的大数据实战环境,让学生有机会理解企业业务需求和数据形式,为开展数据分析奠定基础,同时,从企业引进具有丰富实战经验的高级人才,承担起数据科学家相关课程教学任务,切实提高教学质量、水平和实用性。所谓“走出去”,是指积极鼓励和引导学生走出校园,进入互联网、金融、电信等具备大数据应用环境的企业去开展实践活动,同时,努力加强产、学、研合作,创造条件让高校教师参与到企业大数据项目中,实现理论知识与实际应用的深层次融合,锻炼高校教师的大数据实战能力,为更好培养数据科学家人才奠定基础。
在课程体系的设计上,高校应该打破学科界限,设置跨院系跨学科的“组合课程”,由来自计算机、数学、统计等不同院系的教师构建联合教学师资力量,多方合作,共同培养具备大数据分析基础能力的数据科学家,使其全面掌握包括数学、统计学、数据分析、商业分析和自然语言处理等在内的系统知识,具有独立获取知识的能力,并具有较强的实践能力和创新意识。