当前位置:首页 > 科技 - Hadoop+Spark生态系统操作与实战指南 pdf电子版图书
Hadoop+Spark生态系统操作与实战指南 简介
本书共12章,大致分为3个部分,第1部分(第1~7章)讲解Hadoop的原生态组件,包括Hadoop、ZooKeeper、HBase、Hive环境搭建与安装,以及介绍MapReduce、HDFS、ZooKeeper、HBase、Hive原理和Apache版本环境下实战操作。第2部分(第8~11章)讲解Spark的原生态组件,包括Spark Core、Spark SQL、Spark Streaming、DataFrame,以及介绍Scala、Spark API、Spark SQL、Spark Streaming、DataFrame原理和CDH版本环境下实战操作,其中Flume和Kafka属于Apache顶级开源项目也放在本篇讲解。第3部分(第12章)讲解两个大数据项目,包络网页日志离线项目和实时项目,在CDH版本环境下通过这两个项目将Hadoop和Spark原生态组件进行整合,一步步带领读者学习和实战操作。
关于我们 - 网站帮助 - 版权声明 - 友情连接 - 网站地图
本站所收录作品、社区话题、书库评论及本站所做之广告均属其个人行为,与本站立场无关
本站所有的作品,图书,资料均为网友更新,如果侵犯了您的权利,请与本站联系,本站将立刻删除(E-MAIL:847151540@qq.com)
Copyright © 2005-2016 www.gbook.cc All Rights Reserved.备案号

