Python快樂編程——數據分析與實戰

千鋒教育高教產品研發部

  • 出版商: 清華大學
  • 出版日期: 2021-04-01
  • 定價: $419
  • 售價: 8.5$356
  • 語言: 簡體中文
  • 頁數: 320
  • 裝訂: 平裝
  • ISBN: 7302563780
  • ISBN-13: 9787302563785
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

  • Python快樂編程——數據分析與實戰-preview-1
  • Python快樂編程——數據分析與實戰-preview-2
  • Python快樂編程——數據分析與實戰-preview-3
Python快樂編程——數據分析與實戰-preview-1

相關主題

商品描述

本書從數據挖掘的應用出發,以電力、航空、醫療、互聯網、生產製造以及公共服務等行業真實案例為主線,深入淺出介紹Python數據挖掘建模過程,實踐性極強。本書以數據挖掘建模工具Python語言來展開,先介紹案例背景提出挖掘目標,再闡述分析方法與過程,最後完成模型構建,在介紹建模過程中穿插操作訓練,把相關的知識點嵌入相應的操作過程中,使讀者輕松理解並掌握相關的理論和知識點。本書適用於對數據分析有濃厚興趣但不知從何下手的初學者,也可以作為本科生、研究生以及科研人員學習Python的基礎教材。

作者簡介

胡耀文,2014年--2016年連續三年獲得微軟全球MVP最有價值專家,清華大學出版社技術編審委員會委員,2009年參與國慶60週年官兵電子紀念冊項目,CSDN著名技術專家,博客瀏覽量超過1460350次,2012年7月出版Windows CE 7開發實戰詳解,2013年5月出版Windows8開發權威指南。

目錄大綱

第1章數據分析概述
1.1初步認識數據分析
1.2數據分析的基本流程
1.3 Python數據分析的工具
1.4 Jupyter Notebook的基本使用
1.4.1下載與安裝
1.4.2功能界面
1.4.3工作原理
1.4.4基本使用
1.4 .5不錯操作
小結
習題

第2章IPython的使用
2.1 IPython基礎
2.1.1 IPython簡介
2.1.2 IPython使用技巧
2.1.3 IPython魔術命令
2.2 IPython中的開發工具
2.2.1調試器
2.2.2性能分析
小結
習題

第3章NumPy的使用
3.1數組的使用
3.1.1數組的創建
3.1.2數組的屬性
3.1.3數組的運算
3.1.4數組的索引
3.1.5數組的變換
3.2矩陣的使用
3.2.1矩陣的創建
3.2.2矩陣的合併
3.2.3矩陣的運算
3.2.4矩陣的屬性
3.3 NumPy實用技巧
3.3.1通用函數的使用
3.3.2數據的保存和讀取
3.3.3隨機數生成
3.3.4 NumPy與數據統計
小結
習題

第4章Pandas的使用
4.1 Pandas的數據結構
4.1.1 Series對象的創建
4.1.2 Series對象的屬性
4.1.3 DataFrame對象的創建
4.1.4 DataFrame對象的屬性
4.2 Pandas的索引對象
4.2.1 Series索引的基本使用
4.2.2重建索引
4.2.3索引的基本選取和過濾
4.3 Pandas的基本計算
4.3.1算術運算和數據對齊
4.3.2自定義函數
4.3.3排序
4.3. 4重複索引的基本使用
4.4 Pandas的統計功能
4.4.1統計使用的基本函數
4.4.2常用統計方法
4.5 Pandas的數據缺陷處理
4.5.1 dropna處理Series數據缺陷
4.5.2 dropna處理DataFrame數據缺陷
4.5.3 fill進行數據添加
4.6 Pandas的層次化索引
4.6.1基本創建
4.6.2重排分級
4.6.3根據級別進行匯報
4. DataFrame數據列的使用
4.7 Pandas的文件讀取
4.7.1讀取/存儲Excel文件
4.7.2讀取/存儲CSV文件
4.7.3讀寫數據庫
4.7.4讀取HDF5文件
小結
習題

第5章Matplotlib的使用
5.1 Matplotlib繪圖流程
5.2 Matplotlib基本使用
5.2.1創建畫布
5.2.2添加子圖
5.2.3規定刻度與標籤
5.2.4添加圖例
5.2.5顯示
5.3 Matplotlib常用技巧
5.3.1配置文件
5.3.2 rc參數的基本配置
5.3.3中文顯示配置
5.4 Matplotlib基本圖形
5.4.1 Matplotlib繪製散點圖
5.4.2 Matplotlib繪製直方圖
5.4.3 Matplotlib繪製餅狀圖
5.4.4 Matplotlib繪製折線圖
5.4. 5 Matplotlib繪製箱型圖
小結
習題

第6章時間序列分析
6.1時間對象——Timestamp
6.1.1創建時間戳
6.1.2指定與轉換時區
6.1.3小時間/大時間
6.1.4常用屬性
6.2時間對象— —Period
6.2.1 Period對象的創建
6.2.2 Period對象的屬性
6.2.3 Period對象的方法
6.3時間對象——Timedelta
6.3.1 Timedelta對象的創建
6.3.2 Timedelta對象的屬性
6.3.3 Timedelta對象的方法
6.3.4時間間隔的基本運算
DateTimeIndex對象
.1 DateTimeIndex對象的創建
.2 DateTimeIndex對象的屬性
.3 DateTimeIndex對象的方法
6.5 PeriodIndex對象
6.5.1 PeriodIndex對象的創建
6.5.2 PeriodIndex對象的屬性
6.5.3 PeriodIndex對象的方法
6.6 TimedeltaIndex對象
6.6.1 TimedeltaIndex對象的創建
6.6.2 TimedeltaIndex對象的屬性
6.6.3 TimedeltaIndex對象的方法
6.7採樣
6.7.1採樣的基本方法
6.7.2降採樣
6.7.3升採樣
小結
習題

第7章數據處理的基本手段
7.1合併數據集
7.1 .1主鍵合併數據
7.1.2軸向數據合併
7.1.3重疊數據的合併
7.1.4索引鍵的合併
7.2數據清洗
7.2.1重複值的處理
7.2.2異常值的處理
7.2.3缺失值的處理
7.3數據標準化
7.3.1小-大標準化
7.3.2 Z-score標準化
7.3.3按小數定標標準化
7.4數據類型的轉換
7.4.1離散化連續數據
7.4.2啞變量處理類型數據
小結
習題

第8章基於文本的自然語言分析
8.1基於文本的自然語言處理概述
8.2 Jieba基本介紹和使用
8.2.1基本介紹
8.2.2安裝
8.2.3基本使用
8.3 NLTK的基本介紹和使用
8.3. 1 NLTK的基本介紹
8.3.2 NLTK的安裝
8.3.3 NLTK基本使用
8.4文本相似度
8.4.1相似度分析
8.4.2基於NLTK的文本相似度分析
8.4.3基於Gensim的文本相似度