資料流程分類 数据流分类

胡學鋼, 李培培, 張玉紅, 吳信東

  • 出版商: 清華大學
  • 出版日期: 2015-12-01
  • 定價: $294
  • 售價: 8.5$250
  • 語言: 簡體中文
  • 頁數: 286
  • 裝訂: 平裝
  • ISBN: 7302405999
  • ISBN-13: 9787302405993
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

 

<內容簡介>

《數據流分類》闡述了數據流分類問題的基礎理論、技術方法以及應用實踐,為面向實際數據流開展分類數據挖掘任務提供了理論與實踐基礎。全書共分四篇12章。第壹篇是引言篇,本篇首先簡介數據挖掘的相關概念,然後介紹數據流挖掘的相關定義、應用背景及理論基礎與技術,最後重點總結數據流分類挖掘的主要研究進展並歸納了存在的關鍵問題;第二篇是基礎篇,本篇主要闡述了分類挖掘任務中常用的模型與技術,為後續數據流分類方法提供技術基礎;第三篇是專題篇:本篇首先總結分析適宜於數據流環境的幾種集成模型,並通過兩個示例講解了基於加權集成模型的數據流分類算法的應用。然後詳細介紹若乾數據流的概念漂移檢測與分類方法、不完全標記數據流分類方法以及面向實際應用數據的特徵選擇方法,並通過在模擬與實際數據上的大量實驗考察了這些方法的分類性能;第四篇是實驗資源篇,本篇首先介紹數據流分類算法實驗工具ETDSv1.0的功能與用戶使用說明,然後歸納總結目前流行的面向數據流環境的實驗平臺以及在數據流分類任務中常用的數據集。《數據流分類》在數據流中概念漂移檢測問題、不完全標記問題、特徵選擇等方面有許多獨到見解,總結歸納了近年來在數據流分類任務上的研究成果,並歸納提煉了數據流分類研究任務中存在的重要開放性問題。

 

<章節目錄>

引言篇
第1章數據挖掘
1.1KDD定義和過程
1.2數據挖掘的概念和任務
1.3數據挖掘中的十大算法
1.3.1C4.5算法
1.3.2k—Means算法
1.3.3SVM算法
1.3.4Apriori算法
1.3.5EM算法
1.3.6PageRank算法
1.3.7AdaBoost算法
1.3.8kNN算法
1.3.9NaiveBayes算法
1.3.10CART算法
1.4數據挖掘中的應用熱點
1.5小結
參考文獻
第2章數據流挖掘
2.1背景
2.2數據流的應用領域及定義
2.3數據流處理的理論基礎與挖掘技術
2.3.1基於數據的方法
2.3.2基於任務的方法
2.4數據流挖掘的挑戰與任務
2.4.1傳統數據挖掘面臨的挑戰
2.4.2數據流挖掘的挑戰
2.4.3數據流的挖掘任務
2.5小結
參考文獻
第3章數據流分類的關鍵研究問題
3.1引言
3.2概念描述模型與大綱數據提取問題
3.2.1概念描述模型
3.2.2數據流大綱的提取方法與策略
3.3數據流的概念漂移檢測問題
3.3.1概念漂移的基礎知識
3.3.2概念漂移的處理方法
3.3.3研究進展
3.3.4技術方案
3.4噪音數據流問題
3.4.1問題描述
3.4.2研究進展與技術方案
3.5數據分佈不平衡問題
3.5.1問題描述
3.5.2不平衡數據分佈的處理方法
3.5.3研究進展
3.5.4技術方案
3.6不完全標記數據流分類問題
3.6.1問題描述
3.6.2不完全標記數據的處理方法
3.6.3研究進展
3.6.4技術方案
3.7數據流的特徵高維稀疏問題
3.7.1問題描述
3.7.2研究進展與技術方案
3.8數據流分類的評價體系
3.8.1問題描述
3.8.2概念漂移檢測方法的評估指標
3.8.3數據流分類評估方法
3.8.4設計方案
3.9本章小結
參考文獻
基礎篇
第4章分類模型與方法
4.1分類的基本知識
4.2分類模型的評估方法
4.3決策樹模型
4.3 .1傳統的決策樹模型
4.3.2隨機決策樹模型
4.4Bayes模型
4.4.1貝葉斯分類的一般原理
4.4.2常見的貝葉斯分類模型
4.5其他分類模型
4.5.1神經網絡
4.5.2概念格
4.5.3粗糙集合
4.6集成方法
4.6.1集成分類的基本知識
4.6.2經典的集成分類方法
參考文獻
第5章特徵選擇
5.1研究背景及意義
5.2特徵選擇概述
5.2.1特徵選擇的相關概念
5.2 .2特徵選擇的過程
5.2.3特徵選擇的分類
5.3經典特徵選擇方法概述
5.3.1Relief方法
5.3.2信息熵方法
5.3.3粗糙集合方法
5.3.4遺傳算法
5.3.5One—R方法
5.3.6LARS算法
5.4特徵選擇面臨的挑戰
參考文獻
專題篇
第6章數據流的集成分類方法研究
6.1引言
6.2數據流分類的集成策略
6.2.1WE集成方法
6.2.2AP集成方法
6.2.3WE與AP混合集成方法
6.2.4基於WE的混合集成方法
6.3基於決策樹模型的集成分類方法
6.3.1基於UFFT的集成分類方法
6.3.2基於隨機決策樹的集成分類方法
6.4本章小結
參考文獻
第7章數據流中概念漂移檢測與分類問題研究
7.1引言
7.2基於增量式決策樹的數據流概念漂移檢測與分類方法
7.2.1CVFDT系列數據流概念漂移檢測與分類方法
7.2.2RDT系列數據流概念漂移檢測與分類方法
7.3面向不同漂移特徵的概念漂移數據流分類算法
7.3.1基於C4.5和NaiveBayes混合模型的概念漂移數據流分類算法
7.3.2基於變體RDT模型的概念漂移數據流檢測與分類方法
7.3.3CDRDT算法:一種快速的數據流概念漂移檢測與分類算法
7.3.4基於雙層窗口的概念漂移數據流分類算法
7.4本章小結
參考文獻
第8章不完全標記數據流分類問題研究
8.1引言
8.2不完全標記數據流的處理技術
8.2.1基於k—Means與增量式決策樹的模型
8.2.2基於k—Modes與增量式決策樹的模型
8.3不完全標記數據流中的概念漂移檢測
8.3.1研究現狀
8.3.2基於聚類概念簇差異的概念漂移檢測機制
8.3.3實驗結果與分析
8.4不完全標記數據流中的重現概念漂移檢測
8.4.1研究現狀
8.4.2基於聚類概念簇差異的重複再現概念檢測機制
8.4.3實驗結果與分析
8.5算法框架與實驗分析
8.5.1SUN算法框架
8.5.2SUN算法的實驗結果與分析
8.5.3REDLLA算法框架
8.5.4REDLLA算法的實驗結果與分析
8.6不完全標記數據流分類任務中的開放性問題
8.7本章小結
參考文獻
第9章面向應用數據的特徵降維方法研究
9.1引言
9.2文本分類中的特徵降維
9.2.1經典文本特徵降維算法
9.2.2基於語義信息的特徵降維方法
9.3基於本體的特徵降維算法
9.3.1相關定義
9.3.2算法框架
9.3.3算法技術細節
9.3.4實驗結果與分析
9.4 ​​基於迭代Lasso的腫瘤分類信息基因選擇方法
9.4.1引言
9.4.2方法GSIL系統框架
9.4.3實驗結果與分析
9.4.4小結
9.5流環境下實時的特徵降維方法
9.5.1引言
9.5.2IV指標定義
9.5.3基於IV指標的特徵選擇方法FS—IV
9.5.4FS —IV的實驗結果及分析
9.5.5FS—IV在入侵檢測數據流中的應用
9.5.6FS—IV在網絡交易數據流中的應用
9.6本章小結
參考文獻
……
實驗資源篇