Python數據分析實戰——數據採集、分析及可視化(微課視頻版)

沈桂蘭 主編;李玉霞 薛雲 陳默 副主編

  • 出版商: 清華大學
  • 出版日期: 2024-08-01
  • 定價: $299
  • 售價: 8.5$254
  • 語言: 簡體中文
  • ISBN: 7302661707
  • ISBN-13: 9787302661702
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

  • Python數據分析實戰——數據採集、分析及可視化(微課視頻版)-preview-1
  • Python數據分析實戰——數據採集、分析及可視化(微課視頻版)-preview-2
  • Python數據分析實戰——數據採集、分析及可視化(微課視頻版)-preview-3
Python數據分析實戰——數據採集、分析及可視化(微課視頻版)-preview-1

相關主題

商品描述

"本書全面介紹使用Python進行數據獲取、數據處理和分析、數據可視化以及文本分析的相關內容,旨在幫助讀者理解與掌握數據分析全流程的相關知識和技能。全書按照“理論+方法+示例+實戰”的設計思路,既註重知識系統性,又註重應用實戰性。 全書共分為8章,包括Python數據分析概述、Python爬蟲基礎、Python爬蟲實戰、pandas和numpy基礎、Python數據表分析、可視化分析、數據分析實戰和文本數據分析。 本書可作為高等院校各專業數據分析相關課程的教材,也可作為企業電子商務、市場營銷、數據分析人員的參考資料。 "

目錄大綱

 

 

目錄

 

 

 

第1章Python數據分析概述

 

1.1什麽是數據分析

 

1.1.1數據分析的重要性

 

1.1.2數據分析的內容

 

1.2數據分析的基本流程

 

1.3數據分析的常用工具

 

1.4數據分析的常用類庫

 

1.5數據分析的開發環境

 

1.5.1Anaconda的下載和安裝

 

1.5.2Jupyter Notebook的使用

 

1.5.3Spyder的使用

 

本章小結

 

習題1

 

第2章Python爬蟲基礎

 

2.1認識爬蟲

 

2.1.1爬蟲的概念

 

2.1.2爬蟲的原理與類型

 

2.1.3爬蟲的合法性和robots協議

 

2.2爬蟲的組成及反爬蟲措施

 

2.2.1網絡爬蟲的組成

 

2.2.2網站反爬蟲策略

 

2.2.3爬取策略的制定

 

2.3模擬請求爬取數據 

 

2.3.1Chrome開發者工具

 

2.3.2認識HTTP

 

2.3.3認識requests庫

 

2.4解析數據

 

2.4.1網頁的組成

 

2.4.2BeautifulSoup庫

 

2.4.3文檔樹的遍歷

 

2.4.4文檔樹的搜索

 

2.4.5CSS選擇器查找

 

本章小結

 

習題2

 

第3章Python爬蟲實戰

 

3.1實戰: 中國A股上市公司相關數據的獲取

 

3.1.1目標網站分析

 

3.1.2表格數據的爬取和解析

 

3.1.3模塊化程序的編寫

 

3.2解析數據的存取

 

3.2.1文本文件的存取

 

3.2.2CSV文件的存取

 

3.2.3JSON文件的存取

 

3.3實戰: 豆瓣讀書Top250的數據的獲取

 

3.3.1目標網站分析

 

3.3.2半結構化數據的爬取、解析和存儲

 

3.3.3模塊化程序的編寫

 

3.4正則表達式

 

3.4.1正則表達式基礎

 

3.4.2正則表達式的用法

 

3.4.3用正則表達式提取豆瓣讀書排行榜網頁數據的實戰案例

 

3.5實戰: 人民網科技類新聞的獲取

 

3.5.1目標網站分析

 

3.5.2科技新聞列表的獲取與存儲

 

3.5.3新聞的獲取與存儲

 

本章小結

 

習題3

 

第4章pandas和numpy基礎

 

4.1pandas及其數據結構

 

4.1.1Series數據結構及其創建

 

4.1.2DataFrame數據結構及其創建

 

4.2使用pandas導入和導出數據

 

4.2.1導入外部數據

 

4.2.2導出外部數據

 

4.3numpy及其數據結構

 

4.3.1使用numpy創建數組對象

 

4.3.2ndarray類的常用屬性及基本操作

 

本章小結

 

習題4

 

第5章Python數據表分析

 

5.1數據概覽及預處理

 

5.1.1數據概覽分析

 

5.1.2數據清洗

 

5.1.3數據的抽取與合並

 

5.1.4數據的增、刪、改

 

5.1.5數據轉換

 

5.2數據的描述性統計分析

 

5.2.1數據排序和排名

 

5.2.2常見的數據計算方法

 

5.3分組統計

 

5.3.1數據分組

 

5.3.2分組聚合

 

5.4實戰: 豆瓣讀書Top250的數據表分析

 

5.4.1數據預處理

 

5.4.2數據分析

 

本章小結

 

習題5

 

第6章可視化分析

 

6.1可視化分析概述

 

6.1.1圖表類型及選擇

 

6.1.2圖表的基本組成

 

6.2圖表的常用設置

 

6.2.1基本plot繪圖函數

 

6.2.2圖的屬性設置

 

6.2.3圖的類型設置

 

6.2.4其他設置

 

6.3圖表的繪制

 

6.3.1折線圖的繪制

 

6.3.2柱形圖的繪制

 

6.3.3直方圖的繪制

 

6.3.4餅形圖的繪制

 

6.3.5散點圖的繪制

 

6.3.6雷達圖的繪制

 

6.4實戰: 豆瓣讀書Top250的可視化分析

 

6.4.1豆瓣讀書排行榜的評分值分析

 

6.4.2評分值Top5排行榜分析

 

6.4.3出版社Top10占比分析

 

6.4.4Top100圖書的價格分佈

 

本章小結

 

習題6

 

第7章數據分析實戰

 

7.1對比分析及實戰案例

 

7.1.1對比分析

 

7.1.2對比分析實戰案例

 

7.2趨勢分析及實戰案例

 

7.2.1趨勢分析概述

 

7.2.2同比分析實戰案例

 

7.2.3定比分析實戰案例

 

7.2.4環比分析實戰案例

 

7.3差異化分析及實戰案例

 

7.3.1差異化分析概述

 

7.3.2差異化分析實戰案例

 

7.4相關性分析及實戰案例

 

7.4.1相關性分析概述

 

7.4.2相關性分析實戰案例

 

本章小結

 

習題7

 

第8章文本數據分析

 

8.1文本數據預處理

 

8.1.1去噪聲

 

8.1.2中文分詞和添加用戶詞典

 

8.1.3去停用詞

 

8.1.4構建詞向量

 

8.2文本數據分析方法

 

8.2.1高頻詞分析

 

8.2.2關鍵詞分析

 

8.2.3詞性分佈分析

 

8.3生成詞雲圖

 

8.4實戰: 攜程網酒店評論文本數據分析

 

本章小結

 

習題8