Python 數據分析與機器學習 (微課視頻版)
楊年華
- 出版商: 清華大學
- 出版日期: 2023-01-01
- 定價: $660
- 售價: 8.5 折 $561
- 語言: 簡體中文
- ISBN: 7302611513
- ISBN-13: 9787302611516
-
相關分類:
Data Science、Machine Learning
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
-
$352敏捷項目管理(從入門到精通實戰指南)
-
$534$507 -
$534$507 -
$359$341 -
$356集成學習入門與實戰:原理、算法與應用
-
$454Vue.js 3 應用開發與核心源碼解析
-
$505自然語言處理的 Python 實踐
-
$509Python 編程快速上手2:趣味小項目輕松學
-
$630$599 -
$534$507 -
$1,199$1,139 -
$505移動終端人工智能技術與應用開發
-
$551$518 -
$912圖神經網絡:基礎、前沿與應用
-
$454人工智能安全基礎
-
$356業務敏捷 打造數智時代的高適應力組織
-
$383ChatGPT : 智能對話開創新時代
-
$516$490 -
$779$740 -
$594$564 -
$658高級 Python 核心編程開啟精通 Python 編程世界之旅
-
$505python核心編程:從入門到實踐:學與練
-
$659$626 -
$659$626 -
$607前端工程化 : 基於 Vue.js 3.0 的設計與實踐
相關主題
商品描述
本書首先簡要介紹Python語言的基礎知識,為後續內容的學習提供基礎,接著介紹NumPy、Matplotlib和Pandas三個數據分析基礎模塊的用法,同時也為後面基於scikitlearn的機器學習提供基礎,最後介紹基於scikitlearn機器學習及其模型的評價方法、超參數調優方法。全書通過大量案例,希望能讓讀者快速提高實踐能力。 本書適合作為高校本科生或研究生數據分析、機器學習等相關課程的教材或參考書,也可作為數據分析和機器學習愛好者的自學教程,還可以作為相關科研工作者與工程實踐者的參考書。
目錄大綱
目錄
源碼下載
第1章Python語言與開發環境概述
1.1Python語言的特點
1.2Python的下載與安裝
1.3開始使用Python
1.3.1交互方式
1.3.2代碼文件方式
1.3.3代碼文件的打開
1.3.4代碼風格
1.4模塊與庫
1.4.1模塊及其導入方式
1.4.2標準模塊與第三方模塊
1.5使用幫助
1.6Anaconda簡介
1.6.1Anaconda模塊的安裝
1.6.2Spyder的使用
1.6.3Jupyter Notebook的使用
1.6.4Jupyter Notebook默認路徑的設置
1.6.5任意路徑下創建Jupyter Notebook文件
習題1
第2章Python語言基礎
2.1控制台的輸入與輸出
2.1.1數據的輸入
2.1.2數據的輸出
2.2標識符、變量與賦值語句
2.2.1標識符
2.2.2變量
2.2.3賦值語句
2.3常用數據類型
2.3.1數值類型
2.3.2布爾類型
2.3.3常用序列類型
2.3.4映射類型
2.3.5集合類型
2.4運算符與表達式
2.4.1運算符分類
2.4.2運算規則與表達式
2.4.3條件表達式
2.4.4復合賦值運算符
2.5分支結構
2.5.1單分支if語句
2.5.2雙分支if/else語句
2.5.3多分支if/elif/else語句
2.5.4分支結構的嵌套
2.5.5分支結構的三元運算
2.5.6match/case分支結構
2.6循環結構
2.6.1簡單的while循環結構
2.6.2簡單的for循環結構
2.6.3break語句和continue語句
2.6.4循環的嵌套
2.7常用組合類型
2.7.1列表
2.7.2元組
2.7.3列表與元組之間的相互生成
2.7.4字符串
2.7.5字典
2.7.6集合
2.7.7推導式
2.7.8常用的內置函數
2.8正則表達式
習題2
第3章函數
3.1函數的定義
3.2函數的調用
3.3形參與實參
3.4函數的返回
3.5位置參數與關鍵參數
3.6默認參數
3.7個數可變的參數
3.7.1以組合對象為形參接收多個實參
3.7.2以組合對象為實參給多個形參分配參數
3.7.3形參和實參均為組合類型
3.8參數與返回值類型註解
3.9lambda表達式
3.10函數式編程的常用類與函數
習題3
第4章自定義類與對象
4.1Python中的對象與方法
4.2類的定義與對象的創建
4.3類的繼承
4.3.1父類與子類
4.3.2繼承的語法
4.3.3子類繼承父類的屬性
4.3.4子類繼承父類的方法
習題4
第5章NumPy數據處理基礎
5.1數據結構
5.1.1利用numpy.array()函數創建數組
5.1.2訪問數組對象屬性
5.1.3數組對象的類型
5.1.4創建常用數組
5.2數據準備
5.2.1隨機數的生成
5.2.2NumPy數組在文本文件中的存取
5.3常用數組運算與函數
5.3.1數組的索引
5.3.2數組的切片
5.3.3改變數組的形狀
5.3.4數組對角線上替換新元素值
5.3.5用np.newaxis或None插入一個維度
5.3.6數組的基本運算
5.3.7數組的排序
5.3.8數組的組合
5.3.9數組的分割
5.3.10隨機打亂數組中的元素順序
5.3.11多維數組的展開
5.3.12其他常用函數與對象
5.4使用NumPy進行簡單統計分析
5.5數組在其他文件中的存取
5.5.1數組在無格式二進制文件中的存取
5.5.2數組在npy文件中的存取
5.5.3數組在npz文件中的存取
5.5.4數組在hdf5文件中的存取
習題5
第6章Matplotlib數據可視化基礎
6.1繪制基本圖形
6.1.1折線圖
6.1.2線條屬性的設置
6.1.3圖標題、坐標軸標題和坐標軸範圍的設置
6.1.4繪制多圖與圖例的設置
6.1.5散點圖
6.1.6直方圖
6.1.7餅圖
6.2繪制多軸圖
6.2.1用subplot()函數繪制多軸圖
6.2.2用subplot2grid()函數繪制多軸圖
6.2.3多軸圖的軸展開與遍歷
6.3坐標軸的刻度標簽
6.4坐標軸的主次刻度、網格設置
6.5移動坐標軸
6.6文字說明和註釋
6.7顯示圖片
6.8日期作為橫坐標
6.9繪制橫線與豎線作為輔助線
6.9.1使用hlines()和vlines()函數繪制輔助線
6.9.2使用axhline()和axvline()函數繪制輔助線
6.10繪制其他二維圖表
6.10.1箱線圖
6.10.2小提琴圖
6.10.3熱力圖
6.10.4填充圖
6.10.5等高線圖
6.11繪制三維圖表
6.11.1三維折線圖
6.11.2三維散點圖
6.11.3三維曲面圖
習題6
第7章Pandas數據處理與分析
7.1數據結構與基本操作
7.1.1Series基礎
7.1.2DataFrame基礎
7.2文件與數據庫中存取DataFrame對象
7.2.1csv文件中存取DataFrame對象
7.2.2Excel文件中存取DataFrame對象
7.2.3數據庫中存取DataFrame對象
7.3常用函數與方法
7.3.1用drop()刪除指定的行或列
7.3.2用append()添加元素
7.3.3用unique()去除重復元素
7.3.4用Series.map()實現數據替換
7.3.5用apply()將指定函數應用於數據
7.3.6用applymap()將指定函數應用於元素
7.3.7用replace()替換指定元素
7.3.8用align()對齊兩個對象的行列
7.3.9用groupby()實現分組
7.3.10用assign()添加新列
7.3.11用where()篩選與替換數據
7.3.12用value_counts()統計元素出現的次數或頻率
7.3.13用pivot()按指定列值重新組織數據
7.3.14用pivot_table()創建數據透視圖
7.3.15用idxmax()/idxmin()獲取最大值/最小值所在的行或列
標簽
7.4DataFrame對象的數據清洗與處理
7.4.1用concat()根據行列標簽合並數據
7.4.2數據排序
7.4.3記錄排名
7.4.4記錄抽取
7.4.5重建索引
7.4.6根據新索引填充新位置的值
7.4.7缺失值處理
7.4.8重復值處理
7.4.9數據轉換與替代
7.4.10數據計算
7.4.11用merge()根據列內容或行標簽合並數據對象
7.4.12combine()基於指定函數合並數據
7.4.13combine_first()用一個對象更新另一個對象中的空值
7.5時間處理
7.5.1Python標準庫中的時間處理
7.5.2用dateutil解析字符串格式的日期
7.5.3Pandas中的時間數據處理
7.5.4時間作為行或列的標簽
7.5.5根據時間頻率重新採樣
7.6移動數據與時間索引
7.7統計分析
7.7.1基本統計分析
7.7.2相關分析
7.8Pandas中的繪圖方法
7.8.1繪圖基本接口plot()
7.8.2其他繪圖函數
習題7
第8章機器學習方法概述與數據加載
8.1機器學習概述
8.1.1用有監督學習做預測
8.1.2用無監督學習發現數據之間的關系
8.2scikitlearn的簡介與安裝
8.2.1scikitlearn的安裝
8.2.2scikitlearn中的數據表示
8.2.3scikitlearn中的機器學習基本步驟
8.3加載數據
8.3.1加載scikitlearn中的小數據集
8.3.2下載並加載scikitlearn中的大數據集
8.3.3用scikitlearn構造模擬數據集
8.3.4加載scikitlearn中的其他數據集
8.3.5通過pandasdatareader導入金融數據
8.3.6通過第三方平臺API加載數據
8.4劃分數據分別用於訓練和測試
8.5scikitlearn中機器學習的基本步驟示例
8.5.1有監督分類學習步驟示例
8.5.2有監督回歸學習步驟示例
8.5.3無監督聚類學習步驟示例
8.6scikitlearn編程接口的風格
習題8
第9章數據預處理
9.1特徵的離散化
9.1.1使用NumPy中的digitize()函數離散化
9.1.2使用Pandas中的cut()函數離散化
9.2識別與處理異常值
9.3特徵值的MinMax縮放
9.4特徵值的標準化
9.5特徵值的穩健縮放
9.6無序分類數據的熱編碼
9.7有序分類數據編碼
9.8每個樣本特徵值的正則化
習題9
第10章模型評估與軌道
10.1模型評估的基本方法
10.1.1監督學習下的泛化、過擬合與欠擬合
10.1.2模型評估指標
10.1.3交叉驗證
10.2軌道的創建與使用
10.2.1創建和使用軌道
10.2.2交叉驗證中使用軌道
習題10
第11章有監督學習之分類與回歸
11.1分類與回歸概述
11.2線性回歸
11.2.1普通線性回歸
11.2.2嶺回歸使用l2正則化減小方差
11.2.3Lasso回歸使用l1正則化減小特徵個數
11.2.4同時使用l1和l2正則化的彈性網絡
11.2.5多項式回歸
11.3邏輯回歸與嶺回歸實現線性分類
11.3.1單標簽二分類
11.3.2單標簽多分類
11.3.3通過正則化降低過擬合
11.4支持向量機用於分類和回歸
11.4.1支持向量機線性分類
11.4.2支持向量機非線性分類
11.4.3支持向量機回歸模型
11.5樸素貝葉斯分類
11.6決策樹用於分類和回歸
11.6.1決策樹用於分類
11.6.2決策樹用於回歸
習題11
第12章集成學習
12.1投票法集成
12.1.1投票分類器
12.1.2投票回歸器
12.2bagging/pasting法集成
12.2.1bagging/pasting分類器
12.2.2bagging/pasting回歸器
12.2.3隨機森林
12.2.4極端隨機樹集成
12.3提升法集成
12.3.1AdaBoost
12.3.2梯度提升
12.3.3XGBoost
12.3.4基於直方圖的梯度提升
12.4堆疊法集成
12.4.1StackingClassifer集成分類
12.4.2StackingRegressor集成回歸
習題12
第13章無監督學習之聚類與降維
13.1用k均值算法基於相似性聚類
13.2層次聚類
13.3基於密度的聚類
13.4聚類性能的評估
13.4.1數據帶真實標簽的聚類評估
13.4.2數據不帶真實標簽的聚類評估
13.5無監督的降維
13.5.1主成分分析
13.5.2核主成分分析
習題13
第14章超參數調優與模型選擇
14.1搜索超參數來選擇模型
14.1.1基於循環語句的網格搜索
14.1.2劃分驗證集避免過擬合
14.1.3帶交叉驗證的網格搜索
14.1.4帶交叉驗證的隨機搜索
14.1.5搜索多個不同特徵的空間
14.2對軌道中的超參數進行搜索
14.3搜索算法和超參數
習題14
參考文獻