Python數據挖掘

洪金珠,徐藹婷,陳宜治,張子天,蔣獻,汪盈,諸葛斌

  • 出版商: 清華大學
  • 出版日期: 2025-06-01
  • 語言: 簡體中文
  • ISBN: 7302691908
  • ISBN-13: 9787302691907
  • 相關分類: Data-mining
  • 下單後立即進貨 (約4週~6週)

  • Python數據挖掘-preview-1
  • Python數據挖掘-preview-2
  • Python數據挖掘-preview-3
  • Python數據挖掘-preview-4
  • Python數據挖掘-preview-5
  • Python數據挖掘-preview-6
  • Python數據挖掘-preview-7
Python數據挖掘-preview-1

相關主題

商品描述

"本書力求為讀者呈現一部兼具理論深度和實踐指導性的數據挖掘教材,在內容安排上既註重基礎知識的講解,又強調實際應用能力的培養。每章都包括理論闡述、算法原理、實踐案例和基於Python的代碼實現等諸多內容,旨在幫助讀者全面理解和掌握相關知識和技能。此外,本書還關註數據挖掘領域的**發展和前沿技術,將AI代碼自動生成融入其中,使讀者能夠緊跟時代步伐,掌握最前沿的知識和技能。 本書內容豐富、結構清晰、實踐性強,既適合作為高等院校相關專業的教材使用,也適合廣大數據挖掘愛好者自學參考。無論是初學者還是有一定基礎的讀者,都能從本書中獲得寶貴的知識和經驗。 "

作者簡介

主編了浙江省本科院校十三五新形態教材:洪金珠,諸葛斌,袁非牛,統計決策方法與應用,ISBN:9787302572770,清華大學出版社,2021年12月,已銷售600冊。作為核心成員參與了3項省級在線精品課程的建設,主持校在線精品課程《統計決策方法與應用》,曾獲2020浙江省本科院校“互聯網+ 教學”優秀案例(線上線下混合課程)特等獎,2019浙江省本科院校“互聯網+ 教學”優秀案例(線上線下混合課程)二等獎:《統計學》,發表多篇與線上教育相關的教改文章,獲發明專利授權3項。指導學生獲得了互聯網加大賽省級二等獎1項,國家級創新項目3項,市場調查大賽國家級一等獎1項、浙江省新苗杯課題立項2項, 10余項校級創新課題立項。

目錄大綱

目錄

下載源碼

第1章緒論

1.1數據挖掘基礎

1.1.1數據挖掘概述

1.1.2數據挖掘演進脈絡

1.1.3數據挖掘應用領域

1.2基於Python的數據挖掘

1.2.1本地環境安裝

1.2.2簡單案例實踐

1.2.3本書常用方法

1.3天池平臺操作概述

1.3.1天池AI實訓平臺介紹

1.3.2課程配套環境操作

1.3.3天池數據集介紹

習題1

第2章數據可視化

2.1數據可視化概述

2.1.1數據可視化的概念

2.1.2數據可視化的作用

2.1.3Python數據可視化實戰準備

2.2matplotlib繪制簡單圖表

2.2.1matplotlib簡介

2.2.2繪圖屬性設置

2.2.3簡單圖形的繪制

2.3高級圖表繪制

2.3.1subplot子區

2.3.2Seaborn

2.3.3詞雲圖

2.3.4mplot3d模塊

習題2

第3章數據預處理

3.1數據預處理概述

3.1.1數據預處理的概念

3.1.2數據預處理在數據挖掘中的作用

3.1.3數據預處理的主要任務

3.2數據清洗

3.2.1缺失值處理

3.2.2噪聲數據處理

3.2.3異常值處理

3.3數據集成

3.3.1數據源識別與整合

3.3.2數據格式統一化

3.3.3數據冗余與相關性分析

3.4數據變換

3.4.1數據變換概述

3.4.2數據編碼應用示例

3.4.3規範化應用示例

3.5數據預處理應用案例

習題3

第4章回歸分析

4.1回歸分析基本問題

4.1.1回歸分析介紹

4.1.2回歸分析的種類

4.1.3回歸分析的發展史

4.2線性回歸模型

4.2.1模型的相關概念

4.2.2一元線性回歸分析

4.2.3多元線性回歸分析

4.2.4實戰準備

4.2.5模型案例分析

4.3其他回歸模型

4.3.1Lasso回歸模型

4.3.2嶺回歸模型

4.3.3邏輯回歸模型

4.3.4實戰準備

4.3.5模型案例分析

習題4

第5章關聯規則分析

5.1關聯規則分析概述

5.1.1概念

5.1.2原理步驟

5.1.3應用領域

5.2Apriori算法

5.2.1基本原理

5.2.2算法流程

5.2.3實戰準備

5.2.4Apriori算法案例

5.3FPgrowth算法

5.3.1基本原理

5.3.2算法流程

5.3.3實戰準備

5.3.4FPgrowth算法案例

5.4關聯規則分析案例

習題5

第6章聚類分析

6.1聚類分析概述

6.1.1聚類分析的基本概念

6.1.2聚類分析的原理和步驟

6.2基於劃分的聚類

6.2.1kmeans算法

6.2.2kmeans++算法

6.2.3實戰準備

6.2.4劃分聚類案例

6.3基於層次的聚類

6.3.1層次聚類的基本概念

6.3.2凝聚層次算法: AGNES算法

6.3.3分裂層次算法: DIANA算法

6.3.4實戰準備

6.3.5層次聚類案例

6.4基於密度的聚類

6.4.1密度聚類的基本概念

6.4.2DBSCAN 算法

6.4.3實戰準備

6.4.4密度聚類案例

習題6

第7章隨機森林

7.1隨機森林概述

7.1.1決策樹概論

7.1.2隨機森林概論

7.1.3決策樹與隨機森林

7.2決策樹

7.2.1sklearn中的決策樹模型

7.2.2分類決策樹

7.2.3回歸決策樹

7.3隨機森林實踐

7.3.1隨機森林實踐準備

7.3.2隨機森林案例分析

7.3.3隨機森林的應用案例

習題7

第8章神經網絡

8.1神經網絡概述

8.1.1概念

8.1.2發展歷程

8.1.3應用領域

8.2長短期記憶網絡算法

8.2.1基本原理

8.2.2算法流程

8.2.3LSTM算法案例

8.3BP反向傳播算法

8.3.1基本原理

8.3.2算法流程

8.3.3BP算法案例

習題8

第9章貝葉斯分類

9.1貝葉斯分類概述

9.1.1貝葉斯定理

9.1.2貝葉斯分類步驟及優點

9.1.3應用領域

9.2樸素貝葉斯算法

9.2.1基本原理

9.2.2算法分類

9.2.3實戰準備

9.2.4樸素貝葉斯算法案例

9.3貝葉斯網絡

9.3.1基本原理

9.3.2算法流程及實戰準備

9.3.3貝葉斯網絡算法案例

習題9

第10章文本挖掘

10.1文本挖掘概述

10.1.1基本介紹

10.1.2應用領域

10.1.3基本流程

10.2文本預處理

10.2.1文本清洗

10.2.2分詞和詞性標註

10.2.3特征選取

10.2.4詞向量表示方法

10.3文本挖掘方法實現

10.3.1文本分類

10.3.2文本聚類

10.4文本挖掘結果可視化

10.4.1知識圖譜

10.4.2詞雲圖

10.5文本挖掘算法案例

習題10

第11章綜合案例實戰

11.1代碼自動生成

11.2租房案例概述

11.2.1案例背景

11.2.2案例研究目的

11.3數據采集及預處理

11.3.1選取及提取網頁

11.3.2使用Scrapy解析頁面內容

11.3.3數據清理及存儲

11.4數據分析與可視化

11.4.1房源租金可視化分析

11.4.2區域租金均價分布可視化

11.5代碼自動生成的租房決策實現

11.5.1找準區域

11.5.2找準商圈

11.5.3找準戶型

11.5.4找準朝向

11.5.5找準設施

11.5.6得出結果

11.6數據挖掘應用發布和實踐

11.6.1基於Web服務器的應用發布

11.6.2基於釘釘低代碼的應用發布