Python機器學習與可視化分析實戰

王曉華

  • 出版商: 清華大學
  • 出版日期: 2022-09-01
  • 定價: $414
  • 售價: 8.0$331
  • 語言: 簡體中文
  • ISBN: 7302616175
  • ISBN-13: 9787302616177
  • 相關分類: Machine Learning
  • 立即出貨 (庫存 < 4)

  • Python機器學習與可視化分析實戰-preview-1
  • Python機器學習與可視化分析實戰-preview-2
  • Python機器學習與可視化分析實戰-preview-3
Python機器學習與可視化分析實戰-preview-1

買這商品的人也買了...

相關主題

商品描述

使用機器學習進行數據可視化分析是近年來研究的熱點內容之一。本書使用**的Python作為機器學習的基本語言和工具,從搭建環境開始,逐步深入到理論、代碼、應用實踐中去,從而使初學者能夠獨立使用機器學習完成數據分析。本書配套示例代碼、PPT課件和答疑服務。 本書分為10章,內容包括:機器學習與Python開發環境、用於數據處理及可視化展示的Python類庫、NBA賽季數據可視化分析、聚類算法與可視化實戰、線性回歸與可視化實戰、邏輯回歸與可視化實戰、決策樹算法與可視化實戰、基於深度學習的酒店評論情感分類實戰、基於深度學習的手寫體圖像識別實戰、TensorFlow Datasets和TensorBoard訓練可視化。 本書內容詳盡、示例豐富,是機器學習初學者的入門書和必備的參考書,也可作為高等院校電腦及大數據相關專業的教材使用。

目錄大綱

目    錄

 

第1章  機器學習與Python開發環境 1

1.1  機器學習概述 1

1.1.1  機器學習的前世今生 1

1.1.2  機器學習的研究現狀與方向 3

1.1.3  機器學習之美——數據的可視化 4

1.2  Python的基本安裝和用法 5

1.2.1  Anaconda的下載與安裝 6

1.2.2  Python編譯器PyCharm的安裝 8

1.2.3  使用Python實現softmax函數計算 11

1.3  Python常用類庫中的threading 12

1.3.1  threading模塊中的Thread類 13

1.3.2  threading中Lock類 14

1.3.3  threading中Join類 15

1.4  本章小結 16

第2章  用於數據處理及可視化展示的 Python類庫 17

2.1  從小例子起步——NumPy的初步使用 17

2.1.1  數據的矩陣化 17

2.1.2  數據分析 19

2.1.3  基於統計分析的數據處理 20

2.2  圖形化數據處理——Matplotlib包的使用 21

2.2.1  差異的可視化 21

2.2.2  坐標圖的展示 22

2.2.3  大數據的可視化展示 23

2.3  常用的統計分析方法——相似度計算 26

2.3.1  歐幾里得相似度計算 26

2.3.2  餘弦相似度計算 27

2.3.3  歐幾里得相似度與餘弦相似度的比較 28

2.4  數據的統計學可視化展示 28

2.4.1  數據的四分位數 28

2.4.2  數據的四分位數示例 29

2.4.3  數據的標準化 32

2.4.4  數據的平行化處理 34

2.4.5  熱力圖——屬性相關性檢測 35

2.5  Python分析某地降雨量變化規律 36

2.5.1  不同年份的相同月份統計 36

2.5.2  不同月份之間的增減程度比較 38

2.5.3  每月降雨是否相關 39

2.6  本章小結 40

第3章  NBA賽季數據可視化分析 41

3.1  基於球員薪資的數據分析 41

3.1.1  關於球員薪資的一些基本分析 41

3.1.2  關於球員RPM相關性的分析 44

3.1.3  關於球員RPM數據的分析 45

3.2  Seaborn常用的數據可視化方法 46

3.2.1  關於RPM、薪資和年齡的一元可視化分析 46

3.2.2  關於RPM、薪資、年齡的二元可視化分析 47

3.2.3  關於衍生變量的可視化分析 49

3.2.4  NBA球隊數據的分析結果 51

3.3  NBA賽季數據分析 53

3.3.1  關於賽季發展的一些基本分析 53

3.3.2  群星璀璨的NBA 57

3.3.3  關於球員高級數據的一些基本分析 65

3.4   本章小結 66

第4章  聚類算法與可視化實戰 67

4.1  聚類的定義 67

4.1.1  衡量距離的方法 68

4.1.2  聚類算法介紹 72

4.2  經典K-means聚類算法實戰 76

4.2.1  經典K-means算法的Python實現 76

4.2.2  基於Iris數據集的可視化分析 78

4.2.3  投某音還是投某寶?基於K-means的廣告效果聚類分析 81

4.3  基於密度的聚類算法DBSCAN 88

4.3.1  DBSCAN算法原理與Python實現 89

4.3.2  基於sklearn的DBSCAN實戰 93

4.3.3  DBSCAN的優缺點比較 95

4.4  基於層次的聚類算法 96

4.4.1  基於層次算法的原理 96

4.4.2  Agglomerative算法與示例 98

4.5  本章小結 101

第5章  線性回歸與可視化實戰 102

5.1  線性回歸的基本內容與Python實現 102

5.1.1  什麽是線性回歸 102

5.1.2  最小二乘法詳解 103

5.1.3  道士下山的故事——隨機梯度下降算法 105

5.1.4  基於一元線性回歸的比薩餅價格計算 107

5.1.5  線性回歸的評價指標 109

5.1.6  線性回歸應用 110

5.2  多元線性回歸實戰 111

5.2.1  多元線性回歸的基本內容 112

5.2.2  多元線性回歸的Python實現 113

5.2.3  基於多元線性回歸的房價預測實戰 115

5.3  本章小結 122

第6章  邏輯回歸與可視化實戰 123

6.1  邏輯回歸的基本內容與Python實現 123

6.1.1  邏輯回歸是一個分類任務 124

6.1.2  邏輯回歸的基本內容 124

6.1.3  鏈式求導法則 126

6.1.4  邏輯回歸中的Sigmoid函數 131

6.2  基於邏輯回歸的鳶尾花(Iris)分類 132

6.2.1  鳶尾花數據集簡介與基礎可視化分析 132

6.2.2  鳶尾花數據集進階可視化分析 135

6.2.3  基於鳶尾花數據集的數據挖掘 137

6.2.4  基於線性回歸與K-means的鳶尾花數據集分類 140

6.2.5  基於邏輯回歸的鳶尾花數據集分類 143

6.3  本章小結 147

第7章  決策樹算法與可視化實戰 148

7.1  水晶球的秘密 148

7.1.1  決策樹 149

7.1.2  決策樹的算法基礎——信息熵 149

7.1.3  決策樹的算法基礎——ID3算法 151

7.2  決策樹背後的信息——信息熵與交叉熵 152

7.2.1  交叉熵基本原理詳解 152

7.2.2  交叉熵的表述 154

7.3  決策樹實戰——分類與回歸樹 156

7.3.1  分類樹與回歸樹的區別 156

7.3.2  基於分類樹的鳶尾花分類實戰 157

7.3.2  基於回歸樹的波士頓房價預測 158

7.4  基於隨機森林的信用卡違約實戰 159

7.4.1  隨機森林的基本內容 159

7.4.2  隨機森林與決策樹的可視化比較 161

7.4.3  基於隨機森林的信用卡違約檢測 164

7.5  本章小結 175

第8章  基於深度學習的酒店評論情感分類實戰 176

8.1  深度學習 176

8.1.1  何為深度學習 176

8.1.2  與傳統的“淺層學習”的區別 178

8.2  酒店評論情感分類——深度學習入門 178

8.3  深度學習的流程、應用場景和模型分類 182

8.3.1  深度學習的流程與應用場景 182

8.3.2  深度學習的模型分類 183

8.3  本章小結 184

第9章  基於深度學習的手寫體圖像識別實戰 185

9.1  捲積運算的基本概念 185

9.1.1  捲積運算 186

9.1.2  TensorFlow中捲積函數的實現 187

9.1.3  池化運算 189

9.1.4  softmax激活函數 190

9.1.5  捲積神經網絡原理 191

9.2  MNIST手寫體識別 193

9.2.1  MNIST數據集 193

9.2.2  MNIST數據集特徵和標簽 195

9.2.3  捲積神經網絡編程實戰:MNIST數據集 197

9.3  基於多層感知機的手寫體識別 200

9.3.1  多層感知機的原理與實現 201

9.3.2  多層感知機的激活函數 203

9.4  消除過擬合——正則化與dropout 205

9.4.1  正則化與dropout概述 205

9.4.2  使用防過擬合處理的多層感知機 206

9.4.3  Keras創建多層感知機的細節問題 207

9.5  本章小結 208

第10章  TensorFlow Datasets和TensorBoard 訓練可視化 210

10.1  TensorFlow Datasets簡介 210

10.1.1  TensorFlow Datasets的安裝 212

10.1.2  TensorFlow Datasets的使用 212

10.2  TensorFlow Datasets數據集的使用——FashionMNIST 214

10.2.1  FashionMNIST數據集的下載與展示 215

10.2.2  模型的建立與訓練 216

10.3  使用Keras對FashionMNIST數據集進行處理 218

10.3.1  獲取數據集 218

10.3.2  數據集的調整 218

10.3.3  使用Python類函數建立模型 219

10.3.4  Model的查看和參數打印 220

10.3.5  模型的訓練和評估 221

10.4  使用TensorBoard可視化訓練過程 223

10.4.1  TensorBoard的文件夾的設置 223

10.4.2  TensorBoard的顯式調用 224

10.4.3  TensorBoard的使用 225

10.5  本章小結 229