基於 RapidMiner 的商業智能實踐

杜劍峰

  • 出版商: 科學出版
  • 出版日期: 2020-10-01
  • 定價: $708
  • 售價: 8.5$602
  • 語言: 簡體中文
  • 頁數: 273
  • 裝訂: 平裝
  • ISBN: 7030662768
  • ISBN-13: 9787030662767
  • 相關分類: Data Science
  • 已絕版

  • 基於 RapidMiner 的商業智能實踐-preview-1
  • 基於 RapidMiner 的商業智能實踐-preview-2
  • 基於 RapidMiner 的商業智能實踐-preview-3
  • 基於 RapidMiner 的商業智能實踐-preview-4
  • 基於 RapidMiner 的商業智能實踐-preview-5
基於 RapidMiner 的商業智能實踐-preview-1

買這商品的人也買了...

相關主題

商品描述

本書從文本挖掘技術和數據分析技術出發,詳細描述如何利用可視化開源數據挖掘平臺RapidMiner完成商業智能的一些實踐案例,
包括網頁信息採集、文本分類、文本聚類、文本摘要、關聯分析、關聯推薦、特徵分析和熱點分析等。
依賴本書提供的知識和資源,讀者不需要敲代碼就可以實現上述商業智能的應用場景,掌握相關的文本挖掘和數據分析技術。

目錄大綱

目錄
前言
第1章 概述 1
1.1 數據挖掘 1
1.1.1 發展史 1
1.1.2 意義 2
1.1.3 常用方法 4
1.1.4 常用工具 10
1.2 文本挖掘 13
1.2.1 常用方法 13
1.2.2 常用工具 17
1.3 商業智能 20
1.3.1 方法論 21
1.3.2 常用工具 24
1.4 本章小結 27
參考文獻 27
第2章 網頁信息採集 28
2.1 信息採集原理 28
2.2 信息採集實現方法 30
2.2.1 爬取頁面內容 31
2.2.2 抽取網頁信息 32
2.2.3 正則表達式 34
2.3 搭建新聞信息採集系統 40
2.4 擴展知識 46
2.4.1 網絡爬蟲 46
2.4.2 網絡數據抽取 51
2.5 本章小結 55
參考文獻 56
第3章 文本分類 59
3.1 分類概念 59
3.1.1 相關術語 59
3.1.2 相關概念 61
3.2 傳統分類方法 63
3.2.1 決策樹 63
3.2.2 規則分類器 64
3.2.3 最近鄰分類器 66
3.2.4 貝葉斯分類器 67
3.2.5 人工神經網絡 69
3.2.6 支持向量機 71
3.3 分類評估 72
3.3.1 評估指標 73
3.3.2 評估方法 74
3.4 文本預處理方法 75
3.4.1 英文文本預處理 75
3.4.2 中文文本預處理 77
3.5 文本分類實踐 78
3.5.1 英文文本分類實踐 78
3.5.2 中文文本分類實踐 82
3.6 擴展知識 85
3.7 本章小結 91
參考文獻 91
第4章 文本聚類 95
4.1 聚類概念 95
4.1.1 自然簇的概念 96
4.1.2 簇的類型 97
4.1.3 聚類的類型 98
4.2 傳統聚類方法 99
4.2.1 K均值聚類 99
4.2.2 層次聚類 103
4.2.3 DBSCAN 108
4.3 聚類評估 109
4.4 文本聚類實踐 110
4.4.1 網頁預處理 110
4.4.2 網頁聚類 111
4.4.3 聚類評估 112
4.5 擴展知識 115
4.6 本章小結 120
參考文獻 120
第5章 文本摘要 123
5.1 文本摘要原理 123
5.2 文本摘要方法 125
5.2.1 PageRank算法的原理與流程 125
5.2.2 PageRank算法在摘要中的應用 128
5.3 文本摘要質量評估 128
5.3.1 Edmundson評估 128
5.3.2 ROUGE評估 129
5.4 搭建新聞摘要系統 132
5.5 擴展知識 138
5.6 本章小結 147
參考文獻 147
第6章 關聯分析與推薦 152
6.1 關聯分析概念 152
6.2 關聯分析方法 153
6.2.1 直觀方法 153
6.2.2 實用方法 154
6.2.3 頻繁項集的產生 156
6.2.4 關聯規則的產生 157
6.3 關聯規則評估 160
6.4 購物籃分析與商品推薦實踐 161
6.4.1 購物籃分析 162
6.4.2 商品推薦實踐 165
6.5 擴展知識 169
6.6 本章小結 173
參考文獻 173
第7章 網站日誌分析 176
7.1 案例概述 176
7.2 商業理解 176
7.3 數據理解 178
7.4 數據整理 181
7.4.1 抽取訪問事件和訪問者信息 181
7.4.2 抽取用戶訪問行為信息 189
7.4.3 整合不同數據集 199
7.5 建模評估 202
7.5.1 導致購買行為的訪問特徵分析 203
7.5.2 影響購買產品風格的特徵分析 206
7.5.3 基於訪問事件群體購買偏好的推薦建模 211
7.6 模型應用 216
7.7 本章小結 220
參考文獻 221
第8章 眾籌項目分析 222
8.1 案例概述 222
8.2 商業理解 223
8.3 數據理解 224
8.4 數據整理 225
8.4.1 集成三個月的項目數據 226
8.4.2 從標簽集中分離出省份和城市 241
8.4.3 構造項目成敗分析表 245
8.4.4 構造籌款進度趨勢分析表 247
8.5 建模評估 252
8.5.1 分析成功或失敗的項目特徵 253
8.5.2 分析籌款進度快慢的項目特徵 260
8.5.3 基於詞雲圖的項目熱點分析 267
8.6 本章小結 272
參考文獻 273