數據分析與數據思維——Python編程要點、分析方法與實踐技能
朝樂門
- 出版商: 電子工業
- 出版日期: 2021-07-01
- 定價: $359
- 售價: 8.5 折 $305
- 語言: 簡體中文
- 頁數: 276
- 裝訂: 平裝
- ISBN: 7121415925
- ISBN-13: 9787121415920
-
相關分類:
Data Science
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書面向零基礎的Python學習者和數據分析師,較為詳盡的文字敘述與足夠的圖片解釋相結合,篇幅內容合適,沒有包含對初學者學習難度過高的知識,提供了豐富的教學資源(包括系統、學習指南、疑難解答等),同時專業解讀數據分析師應掌握的編程要點、分析方法和實踐技能,實用性強,學習效果好。本書主要內容包括6個模塊:Python語言與數據分析、Python語言基礎語法、Python語言高級語法、數據準備與加工、數據分析算法與模型、自然語言處理與圖像處理。本書可以作為高等院校數據科學與大數據、電腦科學與技術、軟件工程等工科類各專業學生的相關課程的教材,也可以作為新文科特色的大數據管理、統計學、金融學、信息管理、電子商務、商務智能、金融科技等相關專業相關課程的教材。
作者簡介
朝樂門,男,1979年生,中國人民大學信息資源管理學院、數據工程與知識工程教育部重點實驗室副教授,博士生導師。
中國計算機學會信息系統專委員會委員、ACM高級會員、國際知識管理協會正式委員、全國高校大數據教育聯盟大數據教材專家指導委員會委員、清華大學博士後校友會IT分會副秘書長;主持完成國家自然科學基金、國家社會科學基金等重要科學研究項目10餘項;參與完成核高基、973、863、國家自然科學基金重點項目、國家社會科學基金重大項目等國家重大科研項目10餘項;發表SCI/SSCI/EI/CSCI論文30餘篇,軟件著作權5個、發明專利3項、出版學術專著3部;獲得北京市中青年骨干教師稱號、國際知識管理與智力資本傑出成就獎、IBM全球卓越教師獎、Emerald/EFMD國際傑出博士論文獎、國家自然科學基金項目優秀項目、中國大數據學術創新獎、中國大數據創新百人榜單、全國大數據教育行業傑出貢獻獎等多種獎勵30餘項。
目錄大綱
第1章 Python語言與數據分析 學習指南 ........1
1.1 Python語言及其特徵 .................................................................................................. 2
1.1.1 Python語言的特點 .......................................................................................... 2
1.1.2 Python語言的版本 .......................................................................................... 3
1.2 數據分析與Python語言 ............................................................................................. 4
1.2.1 Python語言在數據分析領域的重要地位 ....................................................... 6
1.2.2 Python語言程序代碼的編寫質量 ................................................................... 7
1.3 面向數據分析的Python編程 ...................................................................................... 7
1.3.1 Python語言的基礎語法 .................................................................................. 7
1.3.2 Python的第三方工具包 .................................................................................. 8
1.3.3 Python學習或編程中常見誤區 ....................................................................... 8
1.4 Python數據分析的集成開發環境 ............................................................................... 9
1.5 Python代碼的編寫與運行實例 ................................................................................... 10
小結 ....... 12
習題1.................................................................................................................. 13
第2章 Python語言基礎語法 學習指南............................................................................................................... 15
2.1 變量及其定義方法 .............................................................................................. 16
2.1.1 變量的定義方法 .............................................................................................. 17
2.1.2 Python是動態類型語言 .................................................................................. 17
2.1.3 Python是強類型語言 ....................................................................... ............... 18
2.1.4 Python中的變量是引用類變量 ....................................................................... 19
2.1.5 Python中區分大小寫 ...................................................................................... 19
2.1.6 變量命名規範 .................................................................................................. 19
2.1.7 iPython的特殊變量 ......................................................................................... 21
2.1.8 查看Python關鍵字的方法 ............................................................................. 21
2.1.9 查看已定義的所有變量 ................................................................................... 22
2.1.10 刪除變量 ........................................................................................................ 23
2.2 運算符、表達式、語句 ............................................................................................... 23
2.2.1 運算符 ........................................................................................ .......... 23
2.2.2 語句書寫規範 .................................................................................................. 30
2.2.3 賦值語句 .......................................................................................................... 33
2.2.4 註釋語句 .......................................................................................................... 35
2.2.5 if語句 ..................................................................................................... 36
2.2.6 for語句 .................................................................................................... 39
2.2.7 while語句 ........................................................................................................ 42
2.2.8 pass語句 .......................................................................................................... 44
2.3 數據類型與數據結構 ........................................................................................ 45
2.3.1 數據類型 .......................... ................................................................................ 45
2.3.2 列表.......................................................................................................... 51
2.3.3 元組.................................................................................................... 61
2.3.4 字符串................................................................................................... 67
2.3.5 序列.................................................................................................... 72
2.3.6 集合.................................................................................................... 76
2.3.7 字典.................................................................................................... 80
2.4 包與模塊 ......................................................................................................... 82
2.4.1 包 .......................................................................................................... 82
2.4.2 模塊 ..................................................................................................... 86
2.5 內置函數、模塊函數和自定義函數 ........................................................................... 88
2.5.1 函數 ................................................................................................. 88
2.5.2 內置函數 .......................................................................................................... 90
2.5.3 模塊函數 .......................................................................................................... 93
2.5.4 自定義函數 ..................................................................................... 95
小結 .................................................................................................................. 104
習題2 .............................................................................................................. 104
第3章 Python語言不錯語法 學習指南 .......................................................... .............................................. 109
3.1 迭代器與可迭代對象 ................................................................................................... 109
3.1.1 可迭代對象 ................................................................................. 111
3.1.2 迭代器 .................................................................................................. 111
3.2 生成器與裝飾器 .......................................................................................................... 112
3.2.1 生成器 .............................................................................................................. 112
3.2.2 裝飾器 .............................................................................................................. 113
3.3 查閱幫助 ...................................................................................................................... 115
3.3.1 help函數 .............................................................................................. ............ 116
3.3.2 docString .......................................................................................................... 116
3.3.3 查看源代碼 ........................................................................................... 117
3.3.4 doc屬性 ........................................................................................................... 118
3.3.5 dir()函數 .......................................................................................................... 118
3.3.6 其他方法 .......................................................................................................... 119
3.4 異常處理、斷言與程序調試 ....................................................................................... 119
3.4.1 try/except/finally .............................................................................................. 121
3.4.2 異常/錯誤信息的顯示模式 ............................................................................. 122
3.4.3 斷言與檢查點的設置 .................. ..................................................................... 123
3.4.4 調試程序的基本方法 ....................................................................................... 124
3.5 數據文件的讀寫 .......................................................................................................... 127
3.5.1 搜索路徑 .......................................................................................................... 128
3.5.2 當前工作目錄 .................................................................................................. 130
3.5.3 文件讀寫方法 .................................................................................................. 131
3.6 面向對象編程 .............................................................................................................. 131
3.6.1 類的定義方法 .................................................................................................. 132
3.6.2 類中的特殊方法 ............................................................................. ................. 133
3.6.3 類之間的繼承關係........................................................................................... 135
3.6.4 私有屬性及@property裝飾器 ........................................................................ 136
3.6.5 self和cls ......................................................................................................... 136
3.6.6 new與init的區別和聯繫 ................................................................................ 137
小結 ....................................................................................................................................... 138
習題3 ................................................................................................................... 139
第4章 數據準備與加工 學習指南 ............................................................................................................................... 141
4.1 隨機數 .......................................................................................................................... 141
4.1.1 一次生成一個隨機數 ....................................................................................... 142
4.1.2 一次生成一個隨機數組 ................................................................................... 143
4.2 多維數組 ...................................................................................................................... 144
4.2.1 創建方法 .......................................................................................................... 147
4.2.2 主要特徵 .......................................................................................................... 148
4.2.3 切片讀取 .......................................................................................................... 149
4.2.4 淺拷貝和深拷貝 .............................................................................................. 153
4.2.5 形狀與重構 ...................................................................................................... 153
4.2.6 屬性計算 ................... ....................................................................................... 154
4.2.7 ndarray的計算 ................................................................................................. 157
4.2.8 ndarray的元素類型 ......................................................................................... 158
4.2.9 插入與刪除 ...................................................................................................... 159
4.2.10 缺失值處理 .................................................................................................... 160
4.2.11 ndarray的廣播規則 ....................................................................................... 160
4.2.12 ndarray的排序 ............................................................................................... 162
4.3 數據框 .......................................................................................................................... 162
4.3.1 創建方法 .......................................................... ................................................ 1
4.3.2 查看行或列 ...................................................................................................... 165
4.3.3 切片方法 .......................................................................................................... 164
4.3.4 索引操作 .......................................................................................................... 168
4.3.5 刪除或過濾行/列 ........................................................................................... 169
4.3.6 算術運算 .......................................................................................................... 172
4.3.7 描述性統計 ...................................................................................................... 174
4.3.8 數據排序 .......................................................................................................... 174
4.3.9 導入/導出 .................................................................................................. ..... 177
4.3.10 缺失數據處理 ................................................................................................ 178
4.3.11 分組統計 ........................................................................................................ 182
4.4 Key-Value型數據 ........................................................................................................ 183
4.4.1 Series的主要特點 ............................................................................................ 184
4.4.2 Series的定義方法 ............................................................................................ 185
4.4.3 Series的操作方法 ............................................................................................ 187
4.5 時間與日期類型數據 ................................................................................................... 189
4.5.1 定義方法 .......................................................................................................... 190
4.5.2 轉換方法 ....................... ................................................................................... 192
4.5.3 顯示系統當前時間........................................................................................... 193
4.5.4 計算時差 .......................................................................................................... 194
4.5.5 時間索引 .......................................................................................................... 194
4.5.6 period_range()函數 ......................................................................................... 194
4.6 數據可視化 ........................................................................... 194
4.6.1 Matplotlib 可視化 ............................................................................................ 197
4.6.2 改變圖的屬性 .................................................................................................. 199
4.6.3 改變圖的類型 .................................................................................................. 201
4.6.4 改變圖的坐標軸的取值範圍 ........................................................................... 202
4.6.5 去掉邊界的空白 .............................................................................................. 203
4.6.6 在同一個坐標上畫圖 ............................................................................... 204
4.6.7 多圖顯示 .......................................................................................................... 205
4.6.8 圖的保存 .......................................................................................................... 205
4.6.9 散點圖的畫法 .................................................................................................. 206
4.6.10 Pandas可視化 ................................................................................................ 206
4.6.11 Seaborn可視化 .............................................................................................. 208
4.6.12 教師工資收入的可視化分析 ......................................................................... 211
小結 ....................................................................................................................................... 212
習題4 ......................................................................................................... 212
第5章 數據分析算法與模型 學習指南 ............................................................................................................................... 215
5.1 基於Python的統計學編程.......................................................................................... 215
5.1.1 女性身高數據的回歸分析 ............................................................................... 217
5.1.2 廣告投放及銷售額分析.................................................................................. 226
5.2 基於Python的機器學習編程 ...................................................................................... 230
5.2.1 威斯康星乳腺癌數據分析及自動診斷 ........................................................... 231
5.2.2 不同國家蛋白質消費結構分析 ........................................... ............................ 238
小結 ....................................................................................................................................... 244
習題5 .................................................................................................................................... 245
第6章 自然語言處理與圖像處理 學習指南 ............................................................................................................................... 247
6.1 自然語言處理 .............................................................................................................. 248
6.1.1 自然語言處理的常用包.................................................................................. 248
6.1.2 自然語言處理的包導入與設置 ....................................................................... 248
6.1.3 數據讀入 .......................................................................................................... 249
6.1.4 分詞處理 ................................................................. ......................................... 249
6.1.5 自定義詞彙 ...................................................................................................... 250
6.1.6 停用詞處理 ...................................................................................................... 253
6.1.7 詞性分佈分析 .................................................................................................. 254
6.1.8 高頻詞分析 ...................................................................................................... 255
6.1.9 詞頻統計 .......................................................................................................... 256
6.1.10 關鍵詞分析 .................................................................................................... 258
6.1.11 生成詞云 ........................................................................................................ 258
6.2 人臉識別與圖像處理 .................................................................................................. . 260
6.2.1 安裝並導入opencv-python包 ......................................................................... 260
6.2.2 讀取圖像文件 .................................................................................................. 261
6.2.3 將RGB圖像轉換為灰度圖 ............................................................................. 261
6.2.4 人臉檢測與繪製長方形 ................................................................................... 262
6.2.5 圖像顯示 .......................................................................................................... 263
6.2.6 圖像保存 .......................................................................................................... 263
小結 ....................................................................................................................................... 263
習題6 .................................................................................................................................... 263