适读人群 :大数据专业的本科生、高职学生1.本书作者为大数据领域的知名作者——厦门大学林子雨,作者长期从事大数据教学,在大数据教育领域有较高的知名度和较大的影响力,其编著的《大数据技术原理与应用 ——概念、存储、处理、 分析与应用(第3版)》一书今年销售预计超过5万册;
2.本书内容全面,配套资源丰富:PPT、教学大纲、授课视频、实验指南、课后习题答案等;
3.有服务平台:作者教学团队打造了在线的“高校大数据课程公共服务平台”,为全国高校师生提供相关教学服务并经常更新。目前该平台已经成为国内高校大数据教学品牌,平台累计访问量超过1300万次;
4.有教师服务QQ群:916443807。
本书详细阐述了大数据领域数据采集与预处理的相关理论和技术。全书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。本书在第3章至第8章中安排了丰富的实践操作,以便读者更好地学习和掌握数据采集与预处理的关键技术。 本书可以作为高等院校大数据专业的大数据课程教材,也可供相关技术人员参考。