猜你喜欢

星空摄影笔记（第二版）阿五在路上
一定要告诉孩子的18堂商业思维课林明樟
RRU设计原理与实现韦兆碧
智能运维之道基于AI技术的应用实践钱兵
环球博物百科美国国家地理
掌控细节连山
架空输电线路设计（第三版）唐波
故宫中国年故宫出版社
影帝和黑粉HE了江淮度
钱穆先生著作系列（简体精装版）：论语新解钱穆
象棋竞赛规则（2020版）中国象棋协会
职场快成长：你不知道的11个高手思维刘荣
好兵帅克历险记美绘插图版教育部“语文课程标准”推荐阅读名词美句名师点评中小学生必读书系哈谢克
屏幕时代的养育盖瑞·查普曼
谈话的艺术陶辉
中国国家地理 2022年3月号旅游地理百科知识人文风俗自然旅游人文景观科普百科地理知识单之蔷
古代中国十二时辰：两汉之际庄奕杰
煙花鄧正祺
寻找经济最优解魏尚进
高能要事叶武滨
尚待商榷的爱情 [英] 朱利安·巴恩斯
人类的演化罗伯特·博伊德
5G商用：打造高速智能应用场景潘文
超级记忆/全想脑力提升书系刘志华
经方六经类方证冯世纶
经营企业与经营人生（仅限500册及以上购买）济群
科幻电影中的科学：科学家奶爸的智能体手绘王元卓
计算广告互联网商业变现的市场与技术第2版刘鹏
儿童节礼物甲骨文学校大语文素养套装（8册）历史知识传统文化冒险幻想小说儿童文学徐则臣曹文轩推荐 7-10岁黄加佳
东京制果名师的玛芬蛋糕和杯子蛋糕 [日] 若山曜子
独异之物让·努维尔
善解童真：小学生性健康教育读本（五年级）胡萍
我爱问连岳之少年问答连岳
留住手艺2 [日] 盐野米松
到太空去郝杰
年龄革命谢尔盖·扬
黄渤：做一个有趣又情商高的人邢瑜
精通PostgreSQL 11（第2版） [奥] 汉斯·尤尔根·舍尔希
糖尿病让血糖降下来干货分享陈伟
土木工程图读绘基础习题集（第4版）远方
法治的追问：基层司法观察笔记赵耀彤
英皇考级必备快速学会音乐知识 How to Blitz Music Knowledge [澳] 萨曼莎·科茨
Adobe After Effects CC 高手之路李涛
李清照：人生不过一场绚烂花事（附《李清照词精选》）(2018年重装上市）卫淇
梁永安：爱情这门课，你可别挂科！梁永安
少儿流行声乐1—10级方雨儿
“笨办法”学Python 3：进阶篇泽德·A.
给孩子受用一生的口才课（全五册）（套装版）演讲与口才杂志社
看图自学吉他弹唱教程陈飞
卫星通信干扰感知及智能抗干扰技术朱立东

精通Hadoop 3

书籍作者：尚沙勒·辛格	ISBN：9787302596875
书籍语言：简体中文	连载状态：全集
电子书格式：pdf,txt,epub,mobi,azw3	下载次数：4531
创建日期：2023-03-25	发布日期：2023-03-25
运行环境：PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
下载地址

内容简介

《精通Hadoop3》详细阐述了与Hadoop 3相关的基础知识，主要包括Hadoop 3简介、深入理解Hadoop分布式文件系统、YARN资源管理器、MapReduce内部机制、Hadoop中的SQL、实时处理引擎、Hadoop生态圈组件、定义Hadoop中的应用程序、Hadoop中的实时流处理、Hadoop中的机器学习、云端中的Hadoop、Hadoop集群分析、Hadoop中的角色及其执行内容、网络和数据安全、监测Hadoop等内容。此外，本书还提供了相应的示例、代码，以帮助读者进一步理解相关方案的实现过程。本书适合作为高等院校计算机及相关专业的教材和教学参考书，也可作为相关开发人员的自学用书和参考手册。

编辑推荐

《精通Hadoop3》阐述了Hadoop生态圈中的高级概念，并通过安全机制、监测机制和数据管理机制构建高性能的Hadoop数据管线。
除此之外，本书还利用Apache Spark 和Flink改进企业级应用程序，并考查Hadoop的内部工作机制，包括一些真实案例的构建方案。同时，我们还将通过Hadoop 3数据平台探讨企业级应用程序的最佳实践方案，其中涉及授权和身份验证机制。随后，我们将学习如何在Hadoop中对数据进行建模、深入了解基于Hadoop 3的分布式计算机制，并查看不同的数据批处理模式。
最后，本书讨论如何高效地继承Hadoop生态圈中的组件，以实现高速、可靠的大数据管线。

《精通Hadoop 3》电子书免费下载

pdf下载 txt下载 epub下载 mobi下载 azw3下载

前言

本书阐述了Hadoop生态圈中的高级概念，并通过安全机制、监测机制和数据管理机制构建高性能的Hadoop数据管线。

除此之外，本书还利用Apache Spark 和Flink改进企业级应用程序，并考查Hadoop的内部工作机制，包括一些真实案例的构建方案。同时，我们还将通过Hadoop 3数据平台探讨企业级应用程序的最佳实践方案，其中涉及授权和身份验证机制。随后，我们将学习如何在Hadoop中对数据进行建模、深入了解基于Hadoop 3的分布式计算机制，并查看不同的数据批处理模式。

最后，本书讨论如何高效地继承Hadoop生态圈中的组件，以实现高速、可靠的大数据管线。

读者范围

如果读者希望掌握Hadoop的高级概念，进而成为一名大数据的专业人士，那么本书将十分适合您，如果读者已经具备一定的Hadoop基础，并希望进一步强化Hadoop生态圈所涉及的专业知识，本书将十分有用。阅读本书时，读者应具备Java编程和Hadoop方面的基础知识。

本书内容

第1章讨论Hadoop的主要概念并简要描述Hadoop的起源。另外，本章还进一步揭示Hadoop 3的特征，同时还提供Hadoop生态圈和不同Hadoop版本的逻辑概述。

第2章主要讨论Hadoop分布式文件系统及其内部概念。另外，本章还深度介绍HDFS操作、Hadoop 3中HDFS所加入的新功能，以及HDFS缓存机制和HDFS Federation。

第3章介绍YARN资源管理框架，并重点考查提交至YARN中的高效的作业调度机制，同时还简要地介绍YARN中调度器的优缺点。此外，本章还重点讨论Hadoop 3中引入的YARN 3特性，特别是REST API。随后，介绍Apache Slider的架构和内部机制，其中涉及Apache Tez、分布式处理引擎，进而优化运行于YARN上的应用程序。

第4章讨论分布式批处理引擎，即MapReduce。另外，本章还介绍MapReduce的内部概念，并详细考查各项操作步骤。随后，本章重点讨论某些重要的参数和MapReduce中的公共模式。

第5章探讨Hadoop生态圈中一些较为重要的、与SQL类似的引擎。首先考查Presto架构的详细内容，随后介绍某些较为常见的连接器示例。然后，本章考查目前较为流行的查询引擎Hive，并介绍其架构和高级概念。最后，本章考查Impala，一个高速处理引擎及其内部的架构概念。

第6章重点介绍不同的处理引擎，并单独讨论每种处理引擎，包括与Spark框架内部工作机制相关的详细内容，以及弹性分布式数据集（RDD）的概念。另外，本章还考查Apache Flink和Apache Storm/Heron的内部机制。

第7章探讨Hadoop平台上所使用的一些重要工具，包括用于ETL操作的Apache Pig及其架构中的一些概念和操作。其间涉及Apache Kafka和Apache Flume的详细内容。另外，Apache HBase也是本章讨论的重点。

第8章首先介绍一些与文件格式相关的高级概念，随后重点讨论数据压缩和序列化概念。接下来，本章依次讨论数据处理、数据访问以及相关示例。

第9章主要关注Hadoop中微批量应用程序的设计和实现。本章讨论如何执行流数据摄入，以及消息队列所扮演的角色。此外，本章还进一步解释某些通用的数据处理模式，以及低延迟设计方面的一些思考。此类概念将与实时和微批量处理示例结合使用。

第10章学习如何在Hadoop平台上实现设计和搭建机器学习应用程序，并尝试处理Hadoop中常见的一些机器学习挑战性问题和解决方案。另外，本章还介绍不同的机器学习库和处理引擎、机器学习中的一些常见操作步骤，并通过具体学习用例加以讲解。

第11章主要介绍云端的Hadoop操作，包括与Hadoop生态圈在云端的表现方式相关的详细信息、如何管理云端的资源、如何创建云端中的数据管线，以及如何确保云之间的高可用性。

第12章介绍对Hadoop集群进行基准测试和分析的工具和技术。除此之外，本章还考查不同Hadoop负载的分析方法。

第13章讨论Hadoop集群的安全机制，包括Hadoop安全的基本概念、实现和设计Hadoop的权限和验证机制。

第14章是第13章的扩展内容，包括Hadoop网络和数据安全的某些高级概念、网络分段、边界安全以及行/列级别的安全。此外，本章还讨论加密Hadoop中的移动数据和静止数据。

第15章介绍Hadoop监测机制的基本内容。本章被划分为两个主要部分。其中，第一部分讨论通用的Hadoop监测机制，第二部分则关注识别安全漏洞的特定监测机制。

背景知识

设置Hadoop并不需要过多的硬件配置。具体来说，最低配置是一台机器/虚拟机；而3台机器则是推荐配置方案。

这里，读者应具备基本的Java应用程序编写和运行经验，以及某些开发工具的使用经验，如Eclipse。

下载示例代码文件

读者可访问http://www.packt.com并通过个人账户下载本书的示例代码文件。在http:// www.packt.com/support网站注册成功后，我们将以电子邮件的方式将相关文件发与读者。

读者可根据下列步骤下载代码文件。

（1）登录www.packt.com并在网站注册。

（2）选择Support选项卡。

（3）单击CODE DOWNLOADS & ERRATA。

（4）在Search文本框中输入本书英文名称的一部分Mastering Hadoop 3并执行后续命令。

当文件下载完毕后，确保使用下列最新版本软件解压文件夹。

? Windows系统下的WinRAR/7-Zip。

? Mac系统下的Zipeg/iZip/UnRarX。

? Linux系统下的7-Zip/PeaZip。

另外，读者还可访问GitHub获取本书的代码包，对应网址为https://github.com/ PacktPublishing/Mastering-Hadoop-3。

此外，读者还可访问https://github.com/PacktPublishing/网站，以了解丰富的代码和视频资源。

下载彩色图像

读者可访问https://www.packtpub.com/sites/default/files/downloads/9781788620444_ ColorImages.pdf下载本书的PDF文件，其中包含了书中展示的屏幕截图和图表的彩色图像。

代码操作

读者可访问http://bit.ly/2XvW2SD链接查看运行代码的视频内容。

本书约定

本书在文本内容方面包含以下约定。

（1）代码块则通过下列方式设置。

dfs.ha.namenodes.mycluster

nn1,nn2,nn3

（2）代码中的重点内容则采用粗体表示，示例如下。

dfs.ha.namenodes.mycluster

nn1,nn2,nn3

（3）任何命令行输入或输出都采用如下所示的粗体代码形式。

hdfs dfsadmin -fetchImage /home/packt

（4）本书还使用了以下两个图标。

图标表示较为重要的说明事项。

图标表示提示信息和操作技巧。

读者反馈和客户支持

欢迎读者对本书提出建议或意见并予以反馈。

若读者对本书有任何疑问，可向[email protected]发送邮件，并以书名作为邮件标题。我们将竭诚为您服务。

勘误表

尽管我们希望做到尽善尽美，但疏漏在所难免。如果读者发现谬误之处，无论是文字错误抑或是代码错误，还望不吝赐教。对此，读者可访问www.packt.com/submit-errata，选取对应书籍，输入并提交相关问题的详细内容。

版权须知

一直以来，互联网上的版权问题从未间断，Packt出版社对此类问题异常重视。若读者在互联网上发现本书任意形式的副本，请告知我们网络地址或网站名称，我们将对此予以处理。关于盗版问题，读者可发送邮件至[email protected]。

若读者针对某项技术具有专家级的见解，抑或计划撰写书籍或完善某部著作的出版工作，则可访问authors.packtpub.com。

精通Hadoop 3

内容简介

编辑推荐

《精通Hadoop 3》电子书免费下载

前言

目录

产品特色