數據分析與挖掘 — R語言
蔡銀英,韋鵬程
- 出版商: 電子工業
- 出版日期: 2021-07-01
- 定價: $312
- 售價: 7.5 折 $234
- 語言: 簡體中文
- 頁數: 200
- 裝訂: 平裝
- ISBN: 7121415380
- ISBN-13: 9787121415388
-
相關分類:
R 語言、Data Science
立即出貨 (庫存 < 3)
相關主題
商品描述
本書以R語言簡介、數據挖掘基礎為開篇,旨在讓讀者對所用工具及數據挖掘方法有所瞭解。隨後的章節借助實際案例(數據挖掘網站用戶行為分析及網頁智能推薦、生活服務點評網站客戶分群、水冷中央空調系統的優化控制策略、電商評價文本的主題特徵詞分析、均線投資策略等),從數據預處理、模型選擇、算法介紹、R語言實現、結論分析及評價等方面進行詳盡的論述,希望讀者既可以瞭解數據分析與挖掘的一般流程及方法,又能對常用的算法及模型有所瞭解。每個案例分析都是一篇完整的論文,初學者通過它們可以瞭解數據分析與挖掘的一般流程及方法,有一定基礎的讀者可以思考算法的優劣與選擇。不管是對數據分析與挖掘感興趣的入門者,還是希望獲得實踐經驗的初學者,都可以從本書中獲得支持。
作者簡介
蔡銀英,女,副教授,就職於重慶第二師範學院,主持市級重點項目一項,主研市級項目四項,主要負責數據分析,模型構建相關的工作。
目錄大綱
第1章 R語言簡介 1
1.1 獲取R 1
1.2 R使用入門 4
1.2.1 R操作界面 4
1.2.2 RStudio窗口介紹 5
1.2.3 R的常用操作 6
1.3 R的簡單操作 8
1.3.1 基本數學運算 8
1.3.2 變量 8
1.3.3 數據結構 9
1.4 R數據分析包 12
1.5 小結 12
參考文獻 13
第2章 數據挖掘基礎 14
2.1 數據挖掘的定義 14
2.2 數據探索及預處理 15
2.2.1 臟數據分析 15
2.2.2 數據特徵分析 19
2.2.3 數據預處理 23
2.3 模型簡介 27
2.3.1 聚類模型 27
2.3.2 回歸模型 31
2.3.3 決策樹 34
2.3.4 人工神經網絡 35
2.3.5 關聯規則分析模型 38
2.4 小結 42
參考文獻 42
第3章 數據挖掘網站用戶行為分析及網頁智能推薦 44
3.1 背景與挖掘目標 44
3.2 用戶分群 47
3.2.1 用戶分群的分析方法 47
3.2.2 數據的抽取 48
3.2.3 數據的預處理與探索分析 49
3.2.4 用戶分群結果 57
3.2.5 用戶分群的應用 66
3.3 網頁智能推薦 66
3.3.1 網頁智能推薦的分析方法 66
3.3.2 數據的預處理 67
3.3.3 組合推薦模型 68
3.3.4 組合推薦結果 78
3.4 總結 78
3.4.1 相關結論及應用 78
3.4.2 相關的問題思考 78
參考文獻 79
第4章 生活服務點評網站客戶分群 80
4.1 背景與挖掘目標 80
4.2 分析方法與過程 81
4.2.1 數據抽取 82
4.2.2 數據探索 82
4.2.3 數據預處理 94
4.2.4 模型構建 102
4.3 小結 113
第5章 水冷中央空調系統的優化控制策略 114
5.1 背景及挖掘目標 114
5.2 分析的方法及流程 115
5.3 數據預處理 118
5.3.1 變量選取 118
5.3.2 數據探索 120
5.3.3 數據變換 130
5.4 優化控制模型 131
5.4.1 總耗電量與可控變量 132
5.4.2 冷卻負載與可控變量 140
5.5 模型求解 144
5.5.1 工作日模型求解 144
5.5.2 確定狀態值 148
5.6 總結 155
參考文獻 156
第6章 電商評價文本的主題特徵詞分析 157
6.1 背景與挖掘目標 157
6.2 分析的方法及過程 158
6.2.1 評論數據採集 159
6.2.2 文本數據預處理 161
6.2.3 基於LDA主題模型的特徵詞分析 167
6.3 小結 169
參考文獻 169
第7章 均線投資策略 171
7.1 背景及投資策略介紹 171
7.1.1 移動平均線相關理論介紹 172
7.1.2 名詞及概念介紹 175
7.2 基於移動平均線的投資策略 176
7.2.1 單均線投資策略 177
7.2.2 雙均線投資策略 177
7.3 雙均線投資策略實際應用 178
7.3.1 雙均線投資策略總體流程 178
7.3.2 數據獲取 178
7.3.3 簡單的K線圖實現 179
7.3.4 均線模型 180
7.3.5 其他雙均線策略的收益 188
7.4 主要結論及展望 189
7.4.1 結論 189
7.4.2 後續策略的展望 190
參考文獻 191
致謝 192