資料探勘原理與技術

張云濤、龔玲

  • 出版商: 五南
  • 出版日期: 2007-03-31
  • 定價: $390
  • 售價: 9.5$371
  • 貴賓價: 9.0$351
  • 語言: 繁體中文
  • 頁數: 304
  • ISBN: 9571146765
  • ISBN-13: 9789571146768
  • 相關分類: Data-mining
  • 已過版

買這商品的人也買了...

相關主題

商品描述

本書特色

「資料探勘」是將資料轉化為知識的過程,是資料管理、資訊處理領域研究、開發和應用的最活躍的分支之一。本書全面地論述了資料探勘領域的基本概念、基本原理和基本方法,內容包括資料探勘領域的經典理論和趨勢發展。全書共分14章,全面系統性地介紹了資料探勘的概念和過程、資料預先處理技術;深入地敍述了各種資料探勘技術,包括關聯規則、決策樹、群聚分析、基於樣例的學習、貝葉斯學習、粗糙集、神經網路、遺傳演算法、統計分析;並討論了資料探勘的典型應用,例如:分類、文件和Web探勘,以及資料探勘的應用和發展趨勢;並在第14章中提供一個具體的商業智慧解決方案實例。
  

透過本書的學習,讀者可以對資料探勘的整體結構、概念、原理、技術和發展有深入的瞭解和認識。本書既可作為相關專業的教材,也是資料探勘領域的研究者和開發者必備的參考書。

 

本書內容

第1章 緒 論
  1.1 什麼是資料探勘
  1.2 為何進行資料探勘
  1.3 資料探勘和統計分析的關係
  1.4 資料探勘與資料倉儲的關係
  1.5 資料探勘系統和其他系統的比較
    1.5.1 資料探勘系統與專家系統的比較
    1.5.2 資料探勘和OLAP的比較
  1.6 資料探勘系統的分類
第2章 資料探勘過程
  2.1 問題的定義與主題分析
  2.2 準備資料
    2.2.1 資料清理
    2.2.2 資料合併
    2.2.3 資料選擇
    2.2.4 資料變換
    2.2.5 資料濃縮
    2.2.6 資料品質分析
  2.3 建立模型
    2.3.1 模型是什麼
    2.3.2 模型的精確度
    2.3.3 模型的驗證
  2.4 模式評估
    2.4.1 模式是什麼
    2.4.2 探勘結果的評價和驗證
  2.5 資料視覺化和知識管理
    2.5.1 視覺化表示
    2.5.2 知識管理
第3章 關聯規則
  3.1 概述
    3.1.1 啤酒和尿布問題
    3.1.2 基本概念
  3.2 關聯規則
    3.2.1 概念分層
    3.2.2 興趣度
    3.2.3 資料庫中關聯規則的發現
  3.3 關聯規則學習的Apriori演算法
    3.3.1 使用候選項集找頻繁項集
    3.3.2 由頻繁項集產生關聯規則
  3.4 探勘關聯規則的多策略方法
    3.4.1 多層關聯規則
    3.4.2 多維關聯規則
第4章 決策樹
  4.1 什麼是決策樹
  4.2 決策樹的原理
    4.2.1 歸納學習
    4.2.2 決策樹的表示
    4.2.3 決策樹學習
    4.2.4 ID3演算法
    4.2.5 修剪決策樹
  4.3 決策樹的應用
    4.3.1 規則提取
    4.3.2 分類
  4.4 決策樹的優缺點
第5章 群聚分析
  5.1 概述
    5.1.1 什麼是群聚分析
    5.1.2 群聚分析的基本知識
    5.1.3 群聚方法的分類
  5.2 基於劃分的群聚演算法
    5.2.1 基於劃分的評價函數
    5.2.2 k-平均方法
    5.2.3 k-中心點方法
  5.3 層次群聚
    5.3.1 凝聚方法
    5.3.2 分裂方法
  5.4 孤立點分析
    5.4.1 基於統計的孤立點檢測
    5.4.2 基於距離的孤立點檢測
    5.4.3 基於偏離的孤立點檢測
第6章 基於樣例的學習
  6.1 概述
  6.2 k-最近鄰演算法
    6.2.1 基本理念
    6.2.2 k-最近鄰演算法
    6.2.3 距離加權最近鄰演算法
  6.3 基於樣例的推理
    6.3.1 CBR過程
    6.3.2 樣例的表示
    6.3.3 相似性關係
  6.3.4 樣例的修正和調整
第7章 貝式學習
  7.1 貝式理論
    7.1.1 貝式理論的基本理念
    7.1.2 貝式定理
    7.1.3 極大相似和最小誤差平方假設
  7.2 樸素貝式分類
  7.3 貝式信念網路
    7.3.1 貝式信念網路的結構
    7.3.2 貝式信念網路的訓練
  7.4 貝式分類的應用
第8章 粗糙集
  8.1 關於知識的觀點
  8.2 粗糙集理論的知識發現
  8.3 決策表的定義
  8.4 資料離散化
  8.5 決策規則的獲取
  8.6 粗糙集的化簡
    8.6.1 屬性的化簡
    8.6.2 一致決策表的化簡
    8.6.3 屬性重要性度量
第9章 神經網路
  9.1 什麼是神經網路
  9.2 神經網路的表示和學習
    9.2.1 基本神經元模型
    9.2.2 基本的神經網路模型
    9.2.3 感知器
    9.2.4 神經網路的學習
  9.3 多層前饋神經網路
    9.3.1 前饋神經網路模型和表徵能力
    9.3.2 後向傳播演算法
    9.3.3 後向傳播法則的推導
  9.4 反饋式神經網路
    9.4.1 離散型神經網路
    9.4.2 連續型神經網路
  9.5 神經網路的應用之一──群聚
第10章 遺傳演算法
  10.1 遺傳演算法概述
    10.1.1 基本理念和術語
    10.1.2 遺傳演算法的基礎
    10.1.3 遺傳演算法的特點
  10.2 基本遺傳演算法
  10.3 遺傳演算法的實現技術
    10.3.1 編碼方法
    10.3.2 適應性度量
    10.3.3 選擇策略
    10.3.4 交叉和變異遺傳運算元
  10.4 遺傳演算法的理論分析
    10.4.1 模式定理
    10.4.2 積木塊假設與欺騙問題
    10.4.3 隱並行性
    10.4.4 遺傳演算法的收斂性分析
  10.5 遺傳演算法的應用實例
第11章 統計分析
  11.1 樣本和統計推理
    11.1.1 透過機率分布和密度來描述資料
    11.1.2 信賴區間的推導
  11.2 迴歸分析
    11.2.1 具有線性結構的迴歸模型
    11.2.2 最小平方法擬合
    11.2.3 多元線性迴歸
    11.2.4 非線性迴歸資料分析
  11.3 主成分分析
    11.3.1 高維度資料整合簡化的概念與原則
    11.3.2 主成分分析的演算法推導
第12章 文件和Web探勘
  12.1 概論
    12.1.1 文件探勘的任務
    12.1.2 Web探勘的特點
    12.1.3 Web探勘的任務
  12.2 文件探勘技術
    12.2.1 文件的向量空間表示
    12.2.2 文件特徵的提取
    12.2.3 文件資訊探勘系統
  12.3 Web資料探勘技術
    12.3.1 Web結構探勘
    12.3.2 Web使用記錄的探勘
    12.3.3 Web內容探勘
    12.3.4 個人偏好建立模型
  12.4 文件和Web探勘的應用
    12.4.1 文件分類
    12.4.2 自動推薦系統
第13章 資料探勘的應用和發展趨勢
  13.1 空間資料探勘
    13.1.1 空間資料庫
    13.1.2 空間資料探勘發現的知識類型
    13.1.3 空間資料探勘方法
  13.2 圖像檢索和探勘
    13.2.1 根據內容來檢索
    13.2.2 圖像資料庫探勘
  13.3 時間序列和序列檢索
    13.3.1 序列模式分析
    13.3.2 時間序列資料
    13.3.3 趨勢分析
    13.3.4 時序分析
  13.4 隱私面臨的挑戰
第14章 商業智慧解決方案實例分析
  14.1 商業智慧概述
    14.1.1 傳統資訊系統的不足
    14.1.2 什麼是商業智慧
  14.2 商業智慧系統的處理流程和框架
    14.2.1 商業智慧系統的處理流程
    14.2.2 商業智慧系統的框架
  14.3 商業智慧解決方案
    14.3.1 概述
    14.3.2 資料倉儲
    14.3.3 資料倉儲管理
    14.3.4 資料清洗和轉換
    14.3.5 線上分析
    14.3.6 前端工具
    14.3.7 資料探勘
附錄A IBM DB2 Intelligent Miner簡介
  A.1 DB2 Intelligent Miner功能簡介
  A.2  DB2 Intelligent Miner for Data使用簡介
    A.2.1 範例說明
    A.2.2 定義資料物件
  A.3 建立模型
  A.4 模型應用
  A.5 建立統計函數
  A.6 解釋探勘結果