對照Excel,零基礎學Python數據分析

楊開振

  • 出版商: 人民郵電
  • 出版日期: 2023-05-01
  • 定價: $419
  • 售價: 8.5$356
  • 語言: 簡體中文
  • 頁數: 230
  • 裝訂: 平裝
  • ISBN: 7115607885
  • ISBN-13: 9787115607881
  • 相關分類: ExcelData Science
  • 立即出貨

買這商品的人也買了...

相關主題

商品描述

本書主要介紹如何使用Python處理Excel數據。
本書內容分為三大分:
*分主要介紹數據分析的概念和Python基礎;
*分通過蜂蜜電商數據分析案例詳細介紹數據分析的技術要點,括讀寫Excel文件所需的xlwings庫和openpyxl庫、
數據分析的pandas核心庫,以及數據可視化常用的Matplotlib庫和Seaborn庫;
第三分括個人消費貸款數據分析和螺螄粉連鎖店銷售數據分析兩個實踐案例,通過實踐案例幫助讀者回顧理論知識並提高實踐。
本書適合Python*基礎且需要處理大量Excel數據的辦公人員閱讀,
也可以作為學Python數據分析的入門教程。

目錄大綱

第一分數據分析的概念和Python基礎

第1章數據分析基礎知識2
1.1 為什麼要做數據分析2
1.1.1 分析現狀3
1.1.2 分析具體問題3
1.1.3 預測未來3
1.2 為什麼要使用Python做數據分析4
1.2.1 數據分析的4
1.2.2 為什麼Python+Excel會成為數據分析的主流工具5
1.2.3 使用Python做數據分析的勢6
1.3 數據分析的對象7
1.3.1 總體指標分析7
1.3.2 對比分析7
1.3.3 按時間維度分析7
1.3.4 概率學分析7
1.3.5 按維度分析7
1.4 數據分析的流程8
1.4.1 數據獲取8
1.4.2 數據處理8
1.4.3 數據篩選9
1.4.4 數據分析9
1.4.5 結果存9
1.4.6 數據可視化9
1.4.7 數據追踪和驗證9
第2章Python基礎知識10
2.1 安裝Python和PyCharm 10
2.1.1 安裝Python 10
2.1.2 安裝和使用PyCharm 12
2.2 變量13
2.2.1 變量的使用13
2.2.2 變量的命名14
2.3 簡單的數據類型17
2.3.1 數字17
2.3.2 字符串22
2.4 控制語句28
2.4.1 條件語句28
2.4.2 循環語句35
第3章Python中的*概念41
3.1 複雜的數據類型41
3.1.1 列表41
3.1.2 字典44
3.1.3 元組和集合46
3.2 函數47
3.2.1 函數的定義48
3.2.2 函數參數的關鍵字和默認值49
3.2.3 函數內外變量的可見性50
3.2.4 傳遞可更改對象與不可更改對象51
3.2.5 把函數放在不同的模塊中52
3.3 類53
3.4 異常54
3.5 文件作57
3.5.1 讀取CSV文件57
3.5.2 寫入文件59
   

*分蜂蜜電商數據分析

第4章讀取和清洗數據62
4.1 業務分析62
4.1.1 銷售明細表分析62
4.1.2 產品信息表分析63
4.1.3 用戶信息表分析63
4.1.4 銷售員信息表分析64
4.1.5 數據關聯64
4.2 讀取Excel數據64
4.2.1 安裝對應的庫65
4.2.2 讀取簡單的Excel數據67
4.2.3 pandas DataFrame 68
4.2.4 pandas Series 70
4.2.5 讀取殊格式的Excel數據70
4.2.6 使用xlwings讀取Excel數據73
4.3 清洗數據76
4.3.1 去除空記錄76
4.3.2 去除非法數據78
4.3.3 去除重複數據80
4.3.4 設置默認值82
4.4 編寫讀寫文件的代碼83
第5章篩選數據85
5.1 通過條件篩選數據86
5.1.1 篩選多個用戶的銷售明細數據87
5.1.2 通過商品數量和實際交易金額篩選數據88
5.1.3 對用戶名稱進行模糊查詢89
5.1.4 多條件查詢銷售明細數據89
5.2 通過交易日期篩選數據91
5.2.1 根據年、月、季篩選數據93
5.2.2 篩選當前日期的數據94
5.2.3 篩選某個時間區間內的數據95
第6章數據的基礎運算96
6.1 算術運算96
6.1.1 通過加減運算驗證數據的合法性96
6.1.2 通過乘除運算驗證數據的合法性97
6.2 比較運算98
6.3 通過函數運算數據99
6.3.1 常用函數100
6.3.2 不常用函數101
6.3.3 按行統計102
第7章把數據連接起來105
7.1 3種關聯關係107
7.1.1 銷售員信息表和工卡信息表的關聯(一對一關聯) 107
7.1.2 關聯字段108
7.1.3 處理重複列109
7.1.4 連接方式110
7.2 合併多個Excel文件的數據113
7.2.1 合併數據113
7.2.2 重置索引和去重114
第8章分組統計、數據表和排序115
8.1 分組統計數據115
8.1.1 按訂單狀態匯總數據116
8.1.2 使用agg()方法116
8.1.3 實踐118
8.1.4 按蜂蜜類型進行統計——統計關聯數據118
8.1.5 按多列進行分組統計119
8.2 數據表119
8.2.1 轉換視角120
8.2.2 數據分組統計和分析121
8.2.3 合計行列123
8.3 排序125
8.3.1 按實際交易金額排序(單列排序) 126
8.3.2 按實際交易金額和交易日期排序(多列排序) 126
8.3.3 按惠金額排序(含空值行的排序) 127
8.3.4 對交易日期降序排名128
第9章數據可視化132
9.1 柱形圖和圖表基礎133
9.1.1 柱形圖的繪製和坐標軸的概念133
9.1.2 設置坐標軸136
9.1.3 給圖表添加文本標籤和註釋138
9.1.4 設置網格140
9.1.5 同比柱形圖和圖例的使用141
9.1.6 溫度計圖146
9.1.7 數據表147
9.2 繪製常見的圖表149
9.2.1 折線圖149
9.2.2 條形圖151
9.2.3 餅圖153
9.2.4 雷達圖156
9.3 其他常用的圖表技術159
9.3.1 多種圖表組合——雙軸圖160
9.3.2 在同一畫布中繪製多個圖表163
9.3.3 設置圖表樣式165
9.3.4 初探Seaborn 167
9.3.5 圖表的存169
第10章存數據和圖表到Excel文件中171
10.1 簡單存數據到Excel文件中171
10.1.1 不存行索引並存數據到工作表中172
10.1.2 選擇要存的列172
10.2 使用xlwings存數據到Excel文件中173
10.2.1 將不同的數據存到同一個Excel文件的不同工作表中173
10.2.2 將結果寫入多個Excel文件174
10.2.3 格式化175
10.2.4 存圖表178

第三分實踐案例

第11章個人消費貸款數據分析182
11.1 業務和數據點分析182
11.1.1 貸款台賬表業務分析182
11.1.2 客戶經理信息表業務分析184
11.1.3 數據關聯184
11.2 數據處理185
11.2.1 驗證和修復數據185
11.2.2 讀取數據186
11.3 數據篩選187
11.3.1 簡單地篩選數據187
11.3.2 模糊查詢188
11.3.3 按多個條件篩選數據189
11.3.4 查找十大存量貸款記錄191
11.4 統計分析192
11.4.1 使用分組方法groupby()按風險狀態分組進行統計192
11.4.2 使用數據表按季度統計分析數據195
11.4.3 使用數據表按月份統計貸款筆數和發生額198
11.5 通過數據關聯查詢和統計分析數據200
11.5.1 通過關聯查詢數據200
11.5.2 關聯客戶經理信息表並統計分析數據201
11.6 數據可視化202
11.6.1 繪製折線圖展示兩年各月份的貸款數據202
11.6.2 繪製柱形圖對比兩年各季度的貸款發生額205
11.6.3 繪製餅圖展示各業務品種貸款餘額207
11.7 存結果209
第12章螺螄粉連鎖店銷售數據分析211
12.1 業務分析211
12.1.1 店鋪銷售月報數據211
12.1.2 商品信息表212

12.2 讀取數據214
12.2.1 遍歷文件214
12.2.2 讀取商品信息表數據215
12.2.3 讀取銷售月報數據216
12.2.4 讀取工作表的數據217
12.2.5 合併數據220
12.2.6 測試讀取文件與合併數據220
12.3 整理和分析數據221
12.3.1 整理數據221
12.3.2 分析數據223
12.4 數據可視化224
12.4.1 繪製店鋪月交易金額條形圖224
12.4.2 繪製按店鋪統計和金額雙軸圖225
12.5 存結果227