數據挖掘與數據分析

王陽

  • 出版商: 機械工業
  • 出版日期: 2024-01-01
  • 定價: $330
  • 售價: 8.5$281
  • 語言: 簡體中文
  • 頁數: 268
  • 裝訂: 平裝
  • ISBN: 7111741323
  • ISBN-13: 9787111741329
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書首先介紹了R語言的相關知識,包括R語言基礎、R語言視覺化技術(ggplot2繪圖套件)等。
接著書中詳細介紹了資料探勘與資料分析中重要的理論方法與基礎知識,包括線性迴歸、
邏輯迴歸、決策樹與迴歸樹、隨機森林、貝葉斯分類器、層次聚類、K均值聚類、關聯規則分析。
本書也透過兩個具體的案例展示如何將R語言用到這些方法的具體場景中。
本書透過結合資料探勘技術的理論知識與R語言的實戰應用,幫助讀者更能運用R語言解決資料探勘中的實際問題。

目錄大綱

前言
第1章 R語言基礎
[學習目標]
[應用背景介紹]
1.1 R語言中的資料讀取和資料導出
1.1.1 第一個R會話
1.1.2 變量賦值
1.1.3 從文件中讀取數據
1.1.4 從R語言的套件中取得數據
1.1.5 導出數據
1.2 R語言中的資料型態和對象
1.2.1 資料類型
1.2.2 R語言中的向量
1.2.3 R語言中的矩陣
1.2.4 R語言中的資料框
1.2.5 R語言中的列表
1.2.6 R語言中的因子
1.3 R語言中的控制語句及函數
1.3.1 if分支
1.3.2 for循環
1.3.3 while循環
1.3.4 switch語句
1.3.5 自訂函數
1.3.6 R語言中的內建函數
1.4 R語言中的資料處理
1.4.1 從資料集中提取訊息
1.4.2 缺失資訊處理
1.4.3 運算符
1.4.4 取代現有字段中的數據
1.4.5 變量的重命名
1.4.6 數字的四捨五入
1.4.7 子集數據
1.4.8 隨機抽樣
1.4.9 apply()函數集合
1.4.10 資料型別轉換
1.4.11 資料聚合
1.4.12 文字資料排序
1.4.13 數據合併
1.4.14 table()函數
1.5 R包
1.5.1 dplyr包
1.5.2 tidyr包
本章小結
課後習題
第2章 R語言視覺化技術
[學習目標]
[應用背景介紹]
2.1 ggplot2的圖層語法
……
第3章 線性迴歸
第4章 邏輯回歸
第5章 決策樹與回歸樹
第6章 隨機森林
第7章 貝葉斯分類器
第8章 層次聚類
第9章 K均值聚類
第10章 關聯規則分析
第11章 案例分析之隨機森林
第12章 案例分析之K均值聚類
參考文獻