機器學習(第2版)

趙衛東 董亮

  • 出版商: 人民郵電
  • 出版日期: 2022-11-01
  • 定價: $539
  • 售價: 8.5$458
  • 語言: 簡體中文
  • 頁數: 372
  • ISBN: 7115598487
  • ISBN-13: 9787115598486
  • 相關分類: Machine Learning
  • 下單後立即進貨 (約4週~6週)

  • 機器學習(第2版)-preview-1
  • 機器學習(第2版)-preview-2
機器學習(第2版)-preview-1

相關主題

商品描述

機器學習是人工智能的重要技術基礎,涉及的內容十分廣泛。本書涵蓋了機器學習和深度學習的基礎知識,主要包括機器學習的概述、統計學基礎、分類、聚類、神經網絡、貝葉斯網絡、支持向量機、文本分析、分佈式機器學習算法等經典的機器學習基礎知識,還包括捲積神經網絡、循環神經網絡、生成對抗網絡、目標檢測、自編碼器等深度學習的內容。此外,本書還介紹了機器學習的熱門應用領域推薦系統以及強化學習等主題。

本書深入淺出、內容全面、案例豐富,每章都提供Python程序代碼和習題,供讀者鞏固所學知識。另外,本書還為讀者提供了配套的微課視頻。

作者簡介

赵卫东,复旦大学副教授,主要负责本科生和各类研究生机器学习、大数据核心技术和人工智能(机器学习)(商务数据分析)等课程的教学,2011年纽约大学访问学者。人工智能(机器学习)被评为上海市精品课程以及CMOOC联盟线上线下混合式教学改革项目,获得2013年高等教育上海市教学成果奖二等奖。目前主要研究方向包括机器学习应用和大数据分析等。主持国家自然科学基金2项、国家重点研发计划子课题、上海市浦江人才以及企业合作课题等30多项目。已在Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers,Intelligent Data Analysis,Applied Intelligence等国内外刊物和学术会议发表论文100多篇。出版专著、教材《机器学习》《机器学习案例实战》《Python机器学习实战案例》等10多部。获得上海市2015年上海市科技进步二等奖。CDA三级认证数据科学家,腾讯云和百度云机器学习认证讲师。

目錄大綱

第 1章 機器學習概述 1

1.1 機器學習簡介 1

1.1.1 機器學習簡史 1

1.1.2 機器學習主要流派 3

1.2 機器學習、人工智能和數據挖掘 4

1.2.1 什麽是人工智能 4

1.2.2 什麽是數據挖掘 5

1.2.3 機器學習、人工智能與數據挖掘的關系 6

1.3 典型機器學習應用領域 6

1.4 機器學習算法 12

1.5 機器學習的一般流程 18

習題 19

第 2章 機器學習基本方法 20

2.1 統計分析 20

2.1.1 統計基礎 20

2.1.2 常見概率分佈 25

2.1.3 參數估計 26

2.1.4 假設檢驗 28

2.1.5 線性回歸 28

2.1.6 邏輯回歸 32

2.1.7 判別分析 33

2.1.8 非線性模型 35

2.2 高維數據降維 35

2.2.1 主成分分析 35

2.2.2 奇異值分解 38

2.2.3 線性判別分析 39

2.2.4 局部線性嵌入 42

2.2.5 拉普拉斯特徵映射 43

2.3 特徵工程 44

2.3.1特徵構造 44

2.3.2特徵選擇 45

2.3.3特徵提取 46

2.4 模型訓練 46

2.4.1 模型訓練常見術語 46

2.4.2 訓練數據收集 47

2.5 可視化分析 47

2.5.1 可視化分析的作用 48

2.5.2 可視化的基本流程 48

2.5.3 可視化分析方法 48

2.5.4 可視化分析常用工具 50

2.5.5 常見的可視化圖表 51

2.5.6 可視化分析面臨的挑戰 61

習題 61

第3章 決策樹與分類算法 63

3.1 決策樹算法 63

3.1.1 分支處理 65

3.1.2 連續屬性離散化 70

3.1.3 過擬合問題 72

3.1.4 分類效果評價 75

3.2 集成學習 79

3.2.1 裝袋法 79

3.2.2 提升法 80

3.2.3 GBDT 81

3.2.4 XGBoost算法 82

3.2.5 隨機森林 86

3.3 決策樹應用 88

習題 90

第4章 聚類分析 92

4.1 聚類分析概念 92

4.1.1 聚類方法分類 92

4.1.2 良好聚類算法的特徵 93

4.2 聚類分析的度量 94

4.2.1 外部指標 94

4.2.2 內部指標 95

4.3 基於劃分的聚類 96

4.3.1 k-均值算法 97

4.3.2 k-medoids算法 101

4.3.3 k-prototype算法 102

4.4 基於密度的聚類 102

4.4.1 DBSCAN算法 102

4.4.2 OPTICS算法 105

4.4.3 DENCLUE算法 105

4.5 基於層次的聚類 107

4.5.1 BIRCH聚類 108

4.5.2 CURE算法 110

4.6 基於網格的聚類 112

4.7 基於模型的聚類 113

4.7.1 概率模型聚類 113

4.7.2 模糊聚類 118

4.7.3 Kohonen神經網絡聚類 118

習題 123

第5章 文本分析 124

5.1 文本分析介紹 124

5.2 文本特徵提取及表示 125

5.2.1 TF-IDF 125

5.2.2 信息增益 125

5.2.3 互信息 126

5.2.4 卡方統計量 127

5.2.5 詞嵌入 127

5.2.6 語言模型 128

5.2.7 向量空間模型 129

5.3 知識圖譜 131

5.3.1 知識圖譜相關概念 132

5.3.2 知識圖譜的存儲 132

5.3.3 知識圖譜挖掘與計算 133

5.3.4 知識圖譜的構建過程 135

5.4 詞法分析 139

5.4.1 文本分詞 139

5.4.2 命名實體識別 142

5.4.3 詞義消歧 142

5.5 句法分析 143

5.6 語義分析 145

5.7 文本分析應用 146

5.7.1 文本分類 146

5.7.2 信息抽取 148

5.7.3 問答系統 149

5.7.4 情感分析 150

5.7.5 自動摘要 151

習題 152

第6章 神經網絡 153

6.1 神經網絡介紹 153

6.1.1 前饋神經網絡 153

6.1.2 反饋神經網絡 158

6.1.3 自組織神經網絡 160

6.2 神經網絡相關概念 161

6.2.1 激活函數 162

6.2.2 損失函數 171

6.2.3 學習率 175

6.2.4 過擬合與網絡正則化 179

6.2.5 預處理 181

6.2.6 訓練方式 182

6.2.7 模型訓練中的問題 182

6.2.8 神經網絡效果評價 190

6.3 神經網絡應用 190

習題 195

第7章 貝葉斯網絡 196

7.1 貝葉斯理論概述 196

7.2 貝葉斯概率基礎 196

7.2.1 概率論 196

7.2.2 貝葉斯概率 197

7.3 樸素貝葉斯分類模型 198

7.4 貝葉斯網絡推理 201

7.5 貝葉斯網絡的應用 206

7.5.1 中文分詞 206

7.5.2 機器翻譯 206

7.5.3 故障診斷 207

7.5.4 疾病診斷 207

習題 209

第8章 支持向量機 210

8.1 線性可分SVM 210

8.1.1 間隔與超平面 210

8.1.2 支持向量 210

8.1.3 對偶問題求解 212

8.1.4 軟間隔 213

8.2 非線性SVM 214

8.2.1 非線性SVM原理 214

8.2.2 常見核函數 214

8.3 支持向量機應用 215

習題 219

第9章 分佈式機器學習 220

9.1 分佈式機器學習基礎 220

9.1.1 參數服務器 220

9.1.2 分佈式並行計算類型 221

9.2 分佈式機器學習框架 222

9.3 並行決策樹 227

9.4 並行k-均值算法 228

習題 230

第 10章 深度學習基礎 231

10.1 捲積神經網絡 231

10.1.1 捲積神經網絡簡介 232

10.1.2 捲積神經網絡的結構 232

10.1.3 捲積神經網絡的訓練 241

10.1.4 常見捲積神經網絡 243

10.2 循環神經網絡 268

10.2.1 RNN基本原理 269

10.2.2 長短期記憶網絡 276

10.2.3 門限循環單元 280

10.2.4 循環神經網絡的其他改進 281

10.3 深度學習流行框架 284

習題 285

第 11章 高級深度學習 286

11.1 高級循環神經網絡 286

11.1.1詞嵌入 286

11.1.2自註意力模型 288

11.1.3多頭註意力機制 290

11.1.4 Transformer 291

11.1.5 BERT模型 294

11.2 無監督式深度學習 295

11.2.1 深度信念網絡 295

11.2.2 自動編碼器網絡 297

11.3 生成對抗網絡 299

11.3.1 生成對抗網絡基本原理 299

11.3.2 常見的生成對抗網絡 302

11.4 遷移學習 305

11.5 對偶學習 307

習題 308

第 12章 推薦系統 309

12.1 推薦系統基礎 309

12.1.1 推薦系統的應用場景 309

12.1.2 相似度計算 310

12.2 推薦系統通用模型 312

12.2.1 推薦系統結構 312

12.2.2 基於人口統計學的推薦 313

12.2.3 基於內容的推薦 313

12.2.4 基於協同過濾的推薦算法 314

12.2.5 基於圖的模型 316

12.2.6 基於關聯規則的推薦 318

12.2.7 基於知識的推薦 323

12.2.8 基於標簽的推薦 324

12.3 推薦系統評測 325

12.3.1 評測方法 325

12.3.2 評測指標 326

12.4 推薦系統常見問題 330

12.5 推薦系統實例 333

12.6 深度學習在推薦系統中的應用 340

習題 343

第 13章 強化學習 345

13.1 強化學習概況 345

13.2 強化學習基礎 346

13.2.1 馬爾可夫鏈 346

13.2.2 強化學習基本概念 346

13.2.3 強化學習的目標函數 348

13.2.4 價值函數 349

13.3 強化學習基本算法 353

13.3.1 蒙特卡洛強化學習 353

13.3.2 時序差分算法 355

13.3.3 SARSA算法 355

13.3.4 Q-Learning算法 356

13.4 深度強化學習 361

13.4.1 DQN算法 361

13.4.2 運動員-裁判員算法 367

習題 373