Python大数据处理库PySpark实战

作品编号:HWK226341
作者:汪明
出版社:清华大学出版社
出版年:2021-03-01
定价:79.0
ISBN:9787302575085
开本:其他
页数:310
火悟空打分
0.0
共有0人进行评价
内容简介

Python大数据处理库PySpark实战 本书特色



PySpark可以对大数据进行分布式处理,降低了大数据的学习门槛。本书是一本PySpark入门教材,重点讲述PySpark安装、PySpark用法、ETL数据处理、PySpark机器学习及其实战,*后给出一个综合实战案例。本书逻辑线索清晰,内容体系合理,适合有一定Python基础的大数据分析和处理人员学习使用。


Python大数据处理库PySpark实战 内容简介


我国提出新基建概念,要加快大数据中心、人工智能等新型基础设施的建设进度,这无疑需要更多的大数据人才。PySpark可以对大数据进行分布式处理,降低大数据学习门槛,本书正是一本PySpark入门教材,适合有一定Python基础的读者学习使用。
本书分为7章,章介绍大数据的基本概念、常用的大数据分析工具;第2章介绍Spark作为大数据处理的特点和算法;第3章介绍Spark实战环境的搭建,涉及Windows和Linux操作系统;第4章介绍如何灵活应用PySpark对数据进行操作;第5章介绍PySpark ETL处理,涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容;第6章介绍PySpark如何利用MLlib库进行分布式机器学习(Titanic幸存者预测);第7章介绍一个PySpark和Kafka结合的实时项目。
本书内容全面、示例丰富,可作为广大PySpark入门读者推荐的参考书,同时能作为大中专院校师生的教学参考书,也可作为高等院校计算机及相关专业的大数据技术教材使用。

相关图片
暂无相关图片
用户评价

暂无用户评价
类似作品
傲慢与偏见【热门读物】
10.0
读书、小说
作者:[英] 奥斯丁
简介:《傲慢与偏见》是简·奥斯汀的代表作,是一部描写爱情与婚姻的经典小说。作品以男女主人公达西和伊丽莎白由于傲慢和偏见而产生的爱情纠葛为线索,共写了四起姻缘:伊丽莎白与达西、简与宾利、莉迪亚与威克姆、夏洛蒂...
霍乱时期的爱情【热门读物】
9.0
读书、小说
作者:[哥伦比亚] 加西亚·马尔克斯
简介:《霍乱时期的爱情》是加西亚•马尔克斯获得诺贝尔文学奖之后完成的第一部小说。讲述了一段跨越半个多世纪的爱情史诗,穷尽了所有爱情的可能性:忠贞的、隐秘的、粗暴的、羞怯的、柏拉图式的、放荡的、转瞬即逝的、生...
倾城之恋【张爱玲作品】
9.0
读书、小说
作者:张爱玲
简介:一对现实庸俗的男女,在战争的兵荒马乱之中被命运掷骰子般地掷到了一起,于“一刹那”体会到了“一对平凡的夫妻”之间的“一点真心”⋯⋯张爱玲是作为中国现代文学史上的一位杰出作家,而不是作为一个怪人、异人而存...
相关盒子
还没有加入任何书单!添加到盒子