Python數據分析入門

商品描述

本書系統性地總結了Python 在數據分析中的應用方法,圍繞數據分析所需的編程技能進行了詳細的講解與實踐指導。本書從基本編程出發,逐步深入到面向對象編程、使用模塊、數組操作、數據處理以及可視化數據等關鍵領域,幵通過豐富的示例展示了如何將Python 的核心工具高效地應用於覆雜的數據分析場景。本書註重實踐與理論結合,幫助讀者建立對數據分析任務的系統性理解。 本書面向具有一定Python 基礎的讀者,包括數據分析、機器學習及相關領域的研究人員、工程師以及高等院校的高年級本科生和研究生。此外,本書也適合希望通過掌握數據分析工具提升項目實踐能力的讀者閱讀。無論是希望夯實編程基礎的讀者,還是希望在數據分析領域深入探索的技術人員,都可以通過本書獲得清晰的思路和實用的工具支持。

作者簡介

本書作者José Unpingco:於1997年從加州大學聖地亞哥分校獲得博士學位,此後一直在工業界擔任工程師、顧問和講師,研究各種 數據科學主題,在機器學習方面擁有豐富的經驗.他還率先在 範圍內采用科學 Python。他還是 UCSD 本科和研究生學位課程的數據科學講師,以及Python for Signal Processing和Python for Probability、Statistics和Machine Learning的作者。 本書譯者安翔:北京大學博士,北京大學信息科學技術學院博士後,人工智能研究院助理教授。主要研究領域為:語音識別與合成、自然語言處理、機器學習與深度學習等。博士後階段進行了語音合成相關的研究工作, 近五年在公司積累了大量的深度學習相關實踐經驗。參與 自然科學基金2項,863課題1項。在 外高水平的學術會議期刊上發表了十多篇學術論文,其中SCI/EI收錄5篇。

目錄大綱

譯者序
前言
致謝
章 基本編程 1
1.1 基礎語言 1
1.1.1 入門 2
1.1.2 保留關鍵字 3
1.1.3 數字 3
1.1.4 覆數 4
1.1.5 字符串 5
1.1.6 基本數據結構 9
1.1.7 循環和條件 16
1.1.8 函數 20
1.1.9 文件輸入/ 輸出 32
1.1.10 處理錯誤 34
1.1.11 掌握Python 的強大功能 37
1.1.12 生成器 40
1.1.13 裝飾器 45
1.1.14 疊代 49
1.1.15 使用Python 斷言進行預調試 57
1.1.16 使用sys.settrace 進行堆棧追蹤 58
1.1.17 使用IPython 進行調試 59
1.1.18 從Python 中進行日誌記錄 59
第2 章 面向對象編程 62
2.1 屬性 62
2.2 方法 64
2.3 繼承 65
2.4 類變量 67
2.5 類函數 68
2.6 靜態方法 70
2.7 哈希對子變量隱藏父變量 70
2.8 委托函數 71
2.9 使用super 進行委托 71
2.10 元編程:猴子補丁 73
2.11 抽象基類 74
2.12 描述符 76
2.13 具名元組和數據類 79
2.14 泛型函數 82
2.15 設計模式 84
2.15.1 模板 85
2.15.2 單列模式 85
2.15.3 觀察者 86
2.15.4 適配器 87
參考文獻 87
第3 章 使用模塊 88
3.1 標準庫 88
3.2 編寫和使用自己的模塊 90
3.2.1 將目錄用作模塊 91
3.3 動態導入 91
3.4 從Web 中獲取模塊 92
3.5 Conda 包管理 92
參考文獻 94
第4 章 Numpy 95
4.1 Dtypes 95
4.2 多維數組 96
4.3 重塑和堆疊Numpy 數組 97
4.4 覆制Numpy 數組 98
4.5 切片、邏輯數組操作 99
4.6 Numpy 數組和內存 100
4.7 Numpy 內存數據結構 103
4.8 數組元素操作 105
4.9 通用函數 106
4.10 Numpy 數據輸入/ 輸出 107
4.11 線性代數 107
4.12 廣播 108
4.13 掩碼數組 112
4.14 浮點數 113
4.15  Numpy dtypes 116
參考文獻 117
第5 章 Pandas 118
5.1 使用Series 118
5.2 使用數據幀 121
5.3 重新索引 125
5.4 刪除項目 127
5.5  索引 127
5.6 廣播和數據對齊 128
5.7 分類和合並 131
5.8 內存使用和數據類型dtypes 133
5.9 常見的操作 136
5.10 顯示DataFrame 137
5.11 分層索引 139
5.12 Pipes 142
5.13 數據文件和數據庫 142
5.14 自定義Pandas 143
5.15 滾動和填充操作 144
第6 章 可視化數據 146
6.1 Matplotlib 147
6.1.1 設置默認值 149
6.1.2 圖例 149
6.1.3 子圖 149
6.1.4 Spines 150
6.1.5 共享軸 151
6.1.6 三維曲面 152
6.1.7 使用patch 153
6.1.8 3d 中的patches 153
6.1.9 使用transformation 155
6.1.10 使用文本註釋 158
6.1.11 使用箭頭註釋 158
6.1.12 嵌入可縮放/ 不可縮放的子圖 161
6.1.13 動畫 163
6.1.14 直接使用路徑 164
6.1.15 使用滑塊與繪圖交互 167
6.1.16 色彩圖 168
6.1.17 使用setp 和getp 169
6.1.18 與Matplotlib 圖形交互 170
6.1.19 鍵盤事件 170
6.1.20 鼠標事件 172
6.2 Seaborn 173
6.2.1 自動聚合 176
6.2.2 多個繪圖 180
6.2.3 分布圖 181
6.3 Bokeh 190
6.3.1 使用Bokeh 基元 190
6.3.2 Bokeh 布局 192
6.3.3 Bokeh 組件 194
6.4 Altair 199
6.4.1 Altair 細節化 201
6.4.2 聚合和轉換 203
6.4.3 Altair 交互 207
6.5 Holoviews 210
6.5.1 數據集 214
6.5.2 圖像數據 216
6.5.3 表格數據 217
6.5.4 自定義交互 219
6.5.5 流 220
6.5.6 Pandas 與hvplot 集成 221
6.5.7 網絡圖 226
6.5.8 Holoviz Panel 231
6.6 Plotly 234
參考文獻 242
本書系統性地總結了Python 在數據分析中的應用方法,圍繞數據分析所需的編程技能進行了詳細的講解與實踐指導。本書從基本編程出發,逐步深入到面向對象編程、使用模塊、數組操作、數據處理以及可視化數據等關鍵領域,幵通過豐富的示例展示了如何將Python 的核心工具高效地應用於覆雜的數據分析場景。本書註重實踐與理論結合,幫助讀者建立對數據分析任務的系統性理解。