Scikit-learn機器學習高級進階

潘風文、黃春芳

  • 出版商: 化學工業
  • 出版日期: 2023-01-01
  • 定價: $534
  • 售價: 8.5$454
  • 語言: 簡體中文
  • 頁數: 216
  • 裝訂: 平裝
  • ISBN: 7122422623
  • ISBN-13: 9787122422620
  • 相關分類: Machine Learning
  • 立即出貨

買這商品的人也買了...

相關主題

商品描述

本書是《Scikit-learn機器學習詳解》(潘風文編著)的進階篇,
講解了Sklearn(Scikit-learn)機器學習框架的各種高級應用技術,
包括數據集導入工具、集成學習、模型選擇和交叉驗證、異常檢測、
管道、 信號分解、模型持久化以及Sklearn系統高級配置。
通過本書的學習,讀者可快速掌握Sklearn框架的高級知識,邁入人工智能殿堂的大門。
本書適合有志於從事機器學習、人工智能技術開發的人員或愛好者使用,也可作為相關專業的教材。

目錄大綱

1 機器學習概述1
1.1 有監督學習2
1.2 無監督學習3
1.3 半監督學習3
1.4 Sklearn概述4

2 數據集導入工具6
2.1 通用數據集導入API7
2.1.1 數據集加載器7
2.1.2 數據集提取器8
2.1.3 數據集生成器10
2.1.4 文件導入方法11
2.2 專用數據集導入API14
2.2.1 加載樣本圖像數據集14
2.2.2 加載svmlight/libsvm格式數據集15
2.2.3 從openml.org 下載數據集16
2.3 加載外部數據集16
2.3.1 列表式數據讀取16
2.3.2 多媒體文件讀取17

3 集成學習18
3.1 自助抽樣(bootstrap)19
3.2 自助聚合算法(bagging)20
3.2.1 標準自助聚合算法(Bagging)21
3.2.2 隨機森林(Random Forest)29
3.2.3 極端隨機樹(Extremely randomized trees)30
3.3 加速提升算法(boosting)30
3.3.1 自適應提升算法(Adaboost)30
3.3.2 梯度提升樹算法(GBDT)38
3.4 投票集成算法(voting)49
3.5 堆棧泛化(stacking)56

4 模型選擇和交叉驗證62
4.1 交叉驗證評估器64
4.1.1 交叉驗證64
4.1.2 交叉驗證生成器66
4.1.3 使用交叉驗證70
4.2 度量指標和評估(評分)75
4.2.1 評分參數scoring的設置76
4.2.2 啞分類評估器和啞回歸評估器86
4.3 模型超參數調優90
4.3.1 窮盡網格超參數搜索91
4.3.2 隨機超參數搜索99
4.3.3 非暴力參數搜索方法101
4.3.4 貝葉斯優化103
4.4 驗證曲線104
4.4.1 交叉驗證曲線105
4.4.2 學習曲線108

5 異常檢測115
5.1 新穎點檢測117
5.2 離群點檢測123
5.2.1 橢圓包絡線算法123
5.2.2 孤立森林算法129
5.2.3 局部離群點因子算法130

6 管道138
6.1 概念介紹139
6.1.1 評估器(estimator)139
6.1.2 轉換器(transformer)140
6.1.3 管道(pipeline)141
6.2 管道機制概述142
6.3 中間評估器及子管道148
6.3.1 獲取中間評估器148
6.3.2 獲取子管道對象149
6.3.3 設置評估器參數150
6.4 特徵聚合轉換器150
6.5 列轉換機制154
6.5.1 數據洩露154
6.5.2 列轉換器155
6.6 模型選擇162

7 信號分解164
7.1 主成分分析PCA165
7.2 核主成分分析KPCA173
7.3 字典學習180
7.3.1 預置字典編碼180
7.3.2 通用字典學習186
7.4 因子分析189
7.5 其他信號分解194
7.5.1 獨立成分分析195
7.5.2 非負矩陣分解196
7.5.3 隱含狄利克雷分佈199

8 模型持久化200
8.1 針對Python對象的序列化201
8.1.1 使用模塊pickle序列化201
8.1.2 使用模塊joblib序列化204
8.2 模型互操作方式205

9 Sklearn系統配置210
9.1 系統環境變量211
9.2 運行時環境變量211
後記215