林子雨先后编写了两本教材《大数据技术基础》和《大数据技术原理与应用》。2013年编写的《大数据技术基础》教材(点击这里访问该教材官网),是2014年编写的《大数据技术原理与应用》教材的内容基础,后者是对前者的全面改进和系统提升。《大数据技术原理与应用》定位明确,就是打造成为入门级大数据教材精品,因此,在撰写教材内容时,重点突出了大数据知识体系的构建,让读者形成对大数据知识领域的全面轮廓性认识,让读者了解“大数据是什么”、“大数据技术有哪些”“大数据可以应用到哪些领域”以及一些关键大数据技术的背后原理。《大数据技术基础》教材中,一些偏向学术研究以及不属于普及性大数据知识的内容,都被删除,没有放入《大数据技术原理与应用》。《大数据技术原理与应用》增加了《大数据技术基础》中没有的数据可视化、大数据应用领域等内容。
总体而言,两本教材既有相同部分,又有很大的不同,建议读者首先阅读《大数据技术原理与应用》,然后,再阅读《大数据技术基础》获取一些在《大数据技术原理与应用》中没有涉及的其他知识。
两本教材的具体联系与区别如下:
大数据技术基础 | 大数据技术原理与应用 | |
官网 | https://dblab.xmu.edu.cn/post/1089/ | https://dblab.xmu.edu.cn/post/bigdata/ |
编写时间 | 2013年6月到12月,2013年12月正式发布 | 2014年3月到2015年3月,2015年8月1日正式出版发行 |
是否共享 | 免费共享,发布教材PDF版本电子书到网络上与网友分享 | 人民邮电出版社约稿并出版发行,有版权协议约束,不提供教材电子版,需要到京东、当当等网店购买纸质教材 |
讲义PPT | 发布到官网免费共享 | 发布到官网免费共享 |
质量 | 知识没有进行全面系统梳理,许多内容直接复制网络资料,没有经过严格文字校对,许多图片清晰度不高 | 系统梳理大数据知识,知识点反复确认,涉及到版权问题,所有内容全部根据自己的理解和教学实践进行重新撰写,文字经过严格校对,重新绘制高清晰度图片,出版社专业排版印刷 |
写作经验 | 该书是林子雨在刚刚开设大数据课程时撰写的教材,存在经验不足和知识未成体系的问题 | 该书是林子雨经过丰富教学实践和大量补充阅读和研究的基础上全新撰写的,具有成熟的知识体系 |
内容 | 教程共13章,内容包括:第1章 大数据概述、第2章 大数据关键技术与挑战、第3章 Hadoop、第4章 MapReduce、第5章 HDFS、第6章 Zookeeper、第7章 HBase、第8章 流计算、第9章 图计算、第10章 NoSQL数据库、第11章 云数据库、第12章 Google Spanner和第13章 Google Dremel。 | 系统介绍了大数据相关知识,全书共有13章,系统地论述了大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、流计算、图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。在Hadoop、HDFS、HBase和MapReduce等重要章节,安排了入门级的实践操作,让读者更好地学习和掌握大数据关键技术。 |
内容异同说明 | (1)《大数据技术基础》的第1章大数据概述,经过大幅度修改后,成为《大数据技术原理与应用》的第1章大数据概述。(2)《大数据技术基础》第2章 大数据关键技术与挑战,偏于学术研究,不适合作为教学内容,已经删除,没有放入《大数据技术原理与应用》。
(3)《大数据技术基础》第3章 Hadoop,经过大幅度修改后,成为《大数据技术原理与应用》的第2章大数据处理架构Hadoop。 (4)《大数据技术基础》第4章 MapReduce,经过大幅度修改后,成为《大数据技术原理与应用》第7章MapReduce。 (5)《大数据技术基础》第5章 HDFS,经过大幅度修改后,成为《大数据技术原理与应用》第3章 Hadoop分布式文件系统。 (6)《大数据技术基础》第6章 Zookeeper,不适合作为大数据课程的普及性知识,已经删除,没有放入《大数据技术原理与应用》。 (7)《大数据技术基础》第7章 HBase,经过大幅度修改后,成为《大数据技术原理与应用》第4章 分布式数据库HBase。 (8)《大数据技术基础》第8章 流计算,经过大幅度修改后,成为《大数据技术原理与应用》第8章流计算。 (9)《大数据技术基础》第9章 图计算,经过大幅度修改后,成为《大数据技术原理与应用》第9章图计算。 (10)《大数据技术基础》第10章 NoSQL数据库,经过大幅度修改后,成为《大数据技术原理与应用》第5章,NoSQL数据库。 (11)《大数据技术基础》第11章 云数据库,经过大幅度修改和重新撰写后,成为《大数据技术原理与应用》第6章云数据库。 (12)《大数据技术基础》第12章 Google Spanner和第13章 Google Dremel,知识比较深,偏向于数据库学科,不适合作为大数据入门教材的普及性知识,因此,被删除,没有放入《大数据技术原理与应用》。 (13)《大数据技术基础》教材中,没有涉及数据可视化的内容,鉴于数据可视化是大数据时代的重要技术,因此,在《大数据技术原理与应用》中增加了第10章数据可视化的内容。 (14)《大数据技术基础》教材中,没有介绍大数据的应用,无法让读者形成对大数据应用领域和应用方法的轮廓认识,因此,在《大数据技术原理与应用》教材中,增加了第11章大数据在互联网领域的应用和第12章大数据在生物医学领域的应用以及第13章大数据的其他应用。 |