Hadoop 3 大數據技術快速入門
牛搞
買這商品的人也買了...
-
系統管理員懶人包|Shell Script 自動化指令集 (Wicked Cool Shell Scripts)$480$408 -
極詳細 + 超深入:最新版 TensorFlow 1.x/2.x 完整工程實作$1,200$1,020 -
$403大數據 Hadoop 3.X 分佈式處理實戰 -
實況直播:用 Docker 建構大型資料中心$880$695 -
$403Python 滲透測試實戰 -
數據庫程序員面試筆試通關寶典$419$398 -
圖解雲端技術的原理與商業應用$450$356 -
CSS 視覺辭典 (CSS Visual Dictionary)$520$411 -
$505Hadoop + Spark + Python 大數據處理從算法到實戰 -
Kettle 構建 Hadoop ETL 系統實踐$474$450 -
$305Hadoop 大數據開發技術 -
AI 源碼解讀:機器學習案例 (Python版)$654$621 -
$505多雲和混合雲:雲原生多集群和應用管理 -
C++ 程式設計的樂趣|範例實作與專題研究的程式設計課 (C++ Crash Course: A Fast-Paced Introduction)$880$748 -
$284Hive數據倉庫應用 -
圖解 Docker & Kubernetes 的知識與使用方法$620$490 -
黑帽 Python|給駭客與滲透測試者的 Python 開發指南, 2/e (Black Hat Python : Python Programming for Hackers and Pentesters, 2/e)$450$356 -
$560圖解 Spark 大數據快速分析實戰 -
排隊論基礎, 5/e (Fundamentals of Queueing Theory, 5/e)$1,074$1,020 -
精通 Hadoop 3$894$849 -
$473Spark和Python機器學習實戰:預測分析核心方法(第2版) -
Terraform 實戰$599$569 -
AI 神助攻!程式設計新境界 – GitHub Copilot 開發 Python 如虎添翼 : 提示工程、問題分解、測試案例、除錯$560$442 -
深入理解 Prometheus 監控系統$479$455 -
資料庫內部原理|深入了解分散式資料系統的運作方式$780$616
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
VIP 95折
深入淺出 SSD 測試 : 固態存儲測試流程 方法與工具$594$564 -
VIP 95折
MCP 開發從入門到實戰$515$489 -
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
RISC-V 架構 DSP 處理器設計$534$507 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
85折
$454RAG 實踐權威指南:構建精準、高效大模型之道 -
VIP 95折
CUDA 並行編程與性能優化$714$678 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
VIP 95折
大模型驅動的具身智能 架構,設計與實現$534$507 -
VIP 95折
納米級CMOS VLSI電路(可制造性設計)$474$450 -
VIP 95折
Manus應用與AI Agent設計指南:從入門到精通$359$341 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
VIP 95折
芯片的較量 (日美半導體風雲)$414$393 -
VIP 95折
Manus AI 智能體從入門到精通$294$279 -
VIP 95折
深度學習:基礎與概念$1,128$1,072 -
85折
$505GitHub Copilot 編程指南 -
87折
$469Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化 -
85折
$551C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
Verilog HDL 計算機網絡典型電路算法設計與實現$354$336 -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
85折
$505GitHub Copilot 編程指南 -
85折
$551C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673 -
VIP 95折
深入淺出 Docker, 2/e$419$398 -
85折
$658Unity 特效制作:Shader Graph 案例精講 -
79折
$275零基礎玩轉國產大模型DeepSeek -
VIP 95折
人工智能大模型:機器學習基礎$774$735 -
VIP 95折
RAG 極簡入門:原理與實踐$419$398 -
VIP 95折
大模型實戰 : 從零實現 RAG 與 Agent 系統$419$398 -
VIP 95折
算法趣學(第2版)$348$331 -
VIP 95折
大模型理論與實踐——打造行業智能助手$354$336 -
VIP 95折
大模型應用開發 RAG 實戰課$599$569 -
85折
$509生成式人工智能 (基於 PyTorch 實現) -
VIP 95折
機器人抓取力學$894$849 -
VIP 95折
集成電路版圖設計從入門到精通$474$450 -
VIP 95折
Java 學習筆記, 6/e$839$797
相關主題
商品描述
本書基於Hadoop 3.3.0,覆蓋Hadoop、HBase、Hive的核心概念、實踐應用、程序開發等方面的內容,幫你快速解決大數據是什麼和怎麼用的問題,書中還利用Docker來部署Hadoop分佈式集群,讓你同時學會4種流行的技術。 本書共9章,主要內容包括Hadoop概述、HDFS原理詳解、Yarn原理詳解、Hadoop系統配置、高可用Hadoop配置、HDFS編程、MapReduce編程、Hive實戰、HBase實戰。 本書從案例入手、通俗易懂,能使讀者在最短時間內迅速掌握Hadoop大數據技術。本書既適合Hadoop大數據初學者、大數據應用開發人員、大數據處理人員使用,也適合高等院校和培訓機構大數據相關專業的師生教學參考。
作者簡介
牛搞,軟件開發從業15年編程實戰經驗,流媒體技術專家,高性能服務器專家。
CSDN知名博主。
現為IOS、Adroid、C++高級培訓講師。
著有圖書《Android 9編程通俗演義》《Android 10 Kotlin編程通俗演義》。
目錄大綱
目錄
第1章 概述 1
1.1 什麼是大數據 1
1.1.1 大數據系統的定位 1
1.1.2 與傳統分佈式系統的區別 1
1.1.3 成功的大數據系統項目 2
1.2 Hadoop的原理 2
1.2.1 存儲與資源調度 2
1.2.2 計算框架原理 2
1.3 總結 5
第2章 HDFS原理詳解 6
2.1 主從節點架構 6
2.2 數據冗餘 7
2.3 fsimage與edits 8
2.4 SecondaryNameNode 9
2.5 HA 10
2.6 自動故障轉移 11
2.7 ZooKeeper 13
2.8 防腦裂 14
2.9 聯邦 15
2.10 總結 16
第3章 Yarn原理詳解 17
3.1 概述 17
3.2 作業調度策略 19
3.2.1 容量調度器 19
3.2.2 公平調度器 21
3.2.3 隊列其他事項 22
3.3 Yarn與MapReduce程序 22
第4章 配置Hadoop系統 24
4.1 Docker簡介 24
4.2 安裝Docker 25
4.2.1 Windows、macOS做宿主系統 25
4.2.2 Linux做宿主系統 26
4.2.3 測試Docker容器 30
4.3 創建Hadoop容器 32
4.4 配置獨立模式Hadoop 34
4.5 配置偽分佈Hadoop 37
4.5.1 安裝並配置SSH 37
4.5.2 安裝其他命令行程序 38
4.5.3 編輯core-site.xml 38
4.5.4 編輯hdfs-site.xml 39
4.5.5 編輯mapred-site.xml 40
4.5.6 編輯yarn-site.xml 40
4.5.7 編輯hadoop-env.sh 41
4.5.8 運行偽分佈式Hadoop 41
4.5.9 狀態監控 43
4.6 基於Dockerfile的偽分佈Hadoop 45
4.6.1 Dockerfile 45
4.6.2 構建Hadoop鏡像 46
4.6.3 運行容器 47
4.6.4 配置Hadoop 48
4.7 配置全分佈式Hadoop 49
4.7.1 組件部署架構 49
4.7.2 配置思路 50
4.7.3 修改配置文件 50
4.7.4 創建集群 51
4.7.5 啟動集群 53
4.8 Windows下運行Hadoop 55
4.8.1 配置獨立模式Hadoop 55
4.8.2 配置偽分佈式Hadoop 56
4.9 Yarn調度配置 60
4.9.1 容量調度器 61
4.9.2 公平調度器 63
第5章 配置高可用Hadoop 66
5.1 HDFS高可用 66
5.1.1 組件部署架構 66
5.1.2 修改配置文件 67
5.1.3 創建鏡像 70
5.1.4 創建HA HDFS集群 72
5.1.5 運行HA HDFS 73
5.1.6 測試HA HDFS 74
5.1.7 NameNode自動故障轉移 75
5.2 Yarn高可用 78
第6章 HDFS編程 81
6.1 安裝開發工具 81
6.1.1 安裝Git 81
6.1.2 安裝Maven 83
6.1.3 安裝VSCode 84
6.1.4 安裝VSCode插件 85
6.2 Native編程 87
6.2.1 創建HDFS客戶端項目 87
6.2.2 示例1:查看目錄狀態 91
6.2.3 添加依賴庫 92
6.2.4 運行程序 96
6.2.5 示例2:創建目錄和文件 97
6.2.6 示例3:讀取文件內容 99
6.2.7 示例4:上傳和下載文件 100
6.3 WebHDFS與HttpFS 101
6.3.1 WebHDFS 101
6.3.2 VSCode插件RestClient 103
6.3.3 HttpFS 104
第7章 MapReduce編程 106
7.1 準備測試環境與創建項目 106
7.2 添加MapReduce邏輯 107
7.2.1 添加Map類 108
7.2.2 添加Reduce類 109
7.3 創建Job 110
7.4 添加依賴庫 111
7.5 運行程序 112
7.6 查看運行日誌 114
7.7 在Hadoop中運行程序 116
7.8 Combiner 117
7.9 Mapper與Reducer數量 119
7.10 實現SQL語句 120
7.10.1 簡單查詢 120
7.10.2 排序 127
7.10.3 復雜排序 129
7.10.4 分區 132
7.10.5 組合 134
7.10.6 總結 135
7.11 實現SQL JOIN 136
7.11.1 INNER JOIN 136
7.11.2 MapReduce實現JOIN 137
7.11.3 Mapper JOIN 142
7.11.4 DistributedCache 146
7.12 Counter 148
7.13 其他組件 149
7.14 升級版的WordCount 150
7.15 分佈式k-means 154
7.15.1 Mapper類 155
7.15.2 Reducer類 156
7.15.3 執行任務的方法 158
7.15.4 輔助類 159
7.15.5 運行 162
7.15.6 MapReduce深入剖析 162
第8章 Hive 166
8.1 Hive的設計架構 166
8.2 運行架構 167
8.3 安裝配置Hive3 168
8.3.1 安裝依賴軟件 168
8.3.2 創建Hive鏡像Dockerfile 170
8.3.3 創建docker-compose.yml 171
8.3.4 Hadoop配置調整 172
8.3.5 為Hive準備數據庫 172
8.4 運行Hive3 173
8.5 其他運行方式 175
8.5.1 MetaStore單獨運行 175
8.5.2 嵌入Meta數據庫 176
8.5.3 HiveServer2與beeline合體 176
8.6 Hive數據管理 176
8.6.1 基本操作 177
8.6.2 Hive表 178
8.6.3 數據傾斜 189
8.7 Hive查詢優化 190
8.8 索引 192
8.9 HCatalog 192
8.10 Hive編程 194
8.10.1 JDBC操作Hive 194
8.10.2 自定義函數 196
8.11 總結 208
第9章 HBase 209
9.1 什麼是HBase 209
9.2 HBase架構 210
9.3 安裝與配置 211
9.3.1 獨立模式運行 211
9.3.2 偽分佈模式 215
9.3.3 全分佈模式 216
9.4 基本數據操作 218
9.4.1 表管理 218
9.4.2 添加數據 220
9.4.3 修改數據 221
9.4.4 獲取數據 221
9.4.5 刪除數據 223
9.5 HBase設計原理 224
9.5.1 Region 224
9.5.2 定位數據 225
9.5.3 數據存儲模型 226
9.5.4 快速寫的秘密 227
9.5.5 快速讀的秘密 228
9.5.6 合並StoreFile 229
9.5.7 Region拆分與合並 229
9.5.8 故障恢復 230
9.5.9 總結 231
9.6 HBase應用編程 232
9.6.1 Java API訪問HBase 232
9.6.2 使用掃描過濾器 238
9.6.3 MapReduce訪問HBase表 239
9.7 總結 245
後記 246



