數據科學
朝樂門
- 出版商: 清華大學
- 出版日期: 2016-08-01
- 定價: $294
- 售價: 8.5 折 $250
- 語言: 簡體中文
- ISBN: 7302436991
- ISBN-13: 9787302436997
-
相關分類:
Data Science
下單後立即進貨 (約4週~6週)
相關主題
商品描述
目錄大綱
目錄
第1章基礎理論
1.1數據
1.1.1數據模型
1.1.2數據維度
1.2大數據
1.2.1內涵與特徵
1.2.2大數據時代的新理念
1.2.3大數據時代的新術語
1.3數據科學概述
1.3.1研究目的
1.3.2理論基礎
1.3.3研究內容
1.3.4基本流程
1.3.5主要原則
1.3.6典型應用
1.4數據科學家
1.4.1主要任務
1.4.2能力要求
1.4.3常用工具
1.4.4團隊工作
1.5數據科學項目
1.5.1角色定義
1.5.2基本流程
1.6應用案例
小結
習題
參考文獻及擴展閱讀資料
第2章數據預處理
2.1數據質量
2.1.1統計學規律
2.1.2語言學規律
2.1.3數據連續性理論
2.1.4數據鑒別技術
2.1.5探索性數據分析
2.2數據審計
2.2.1預定義審計
2.2.2自定義審計
2.2.3可視化審計
2.3數據清洗
2.3.1缺失數據處理
2.3.2冗餘數據處理
2.3.3噪聲數據處理
2.4數據變換
2.4.1大小變換
2.4.2類型變換
2.5數據集成
2.5.1基本類型
2.5.2主要問題
2.6其他預處理方法
2.6.1數據脫敏
2.6.2數據歸約
2.6.3數據標註
2.7應用案例
小結
習題
參考文獻及擴展閱讀資料
第3章數據統計
3.1概率分佈
3.1.1正態分佈
3.1.2卡方分佈
3.1.3t分佈
3.1.4F分佈
3.2參數估計
3.2.1點估計
3.2.2區間估計
3.3假設檢驗
3.3.1參數檢驗
3.3.2非參數檢驗
3.4基本分析方法
3.4.1相關分析
3.4.2回歸分析
3.4.3方差分析
3.4.4分類分析
3.4.5聚類分析
3.4.6時間序列分析
3.4.7其他方法
3.5元分析方法
3.5.1加權平均法
3.5.2優化方法
3.6應用案例
小結
習題
參考文獻及擴展閱讀資料
第4章機器學習
4.1基本概念
4.1.1定義
4.1.2應用
4.2機器學習活動
4.2.1訓練經驗的選擇
4.2.2目標函數的選擇
4.2.3目標函數的表示
4.2.4函數逼近算法的選擇
4.3機器學習系統
4.3.1執行器
4.3.2評價器
4.3.3泛化器
4.3.4實驗生成器
4.4主要類型
4.4.1基於實例學習
4.4.2概念學習
4.4.3決策樹學習
4.4.4人工神經網絡學習
4.4.5貝葉斯學習
4.4.6遺傳算法
4.4.7分析學習
4.4.8增強學習
4.5典型算法
4.5.1KMeans算法
4.5.2KNN算法
4.5.3ID3算法
4.6應用案例
小結
習題
參考文獻及擴展閱讀資料
第5章數據可視化
5.1主要類型
5.1.1科學可視化
5.1.2信息可視化
5.1.3可視分析學
5.2基本模型
5.2.1順序模型
5.2.2循環模型
5.2.3分析模型
5.3常用方法
5.3.1視覺編碼
5.3.2統計圖表
5.3.3圖論方法
5.3.4視覺隱喻
5.3.5圖形符號學
5.3.6面向領域的方法
5.4視覺編碼
5.4.1視覺感知
5.4.2數據類型
5.4.3視覺通道
5.4.4視覺假象
5.5評價與改進
5.5.1測評原則
5.5.2測評流程
5.5.3測評方法
5.6應用案例
小結
習題
參考文獻及擴展閱讀資料
第6章數據計算
6.1計算模式的演變
6.1.1集中式計算
6.1.2分佈式計算
6.1.3網格計算
6.1.4雲計算
6.2主流計算框架——MapReduce
6.2.1基本思想
6.2.2實現過程
6.2.3主要特徵
6.2.4關鍵技術
6.5.5下一代MapReduce
6.3主流計算平臺——Hadoop MapReduce
6.3.1數據流
6.3.2任務處理
6.3.3技術實現
6.3.4YARN
6.4其他相關計算系統——Hadoop生態系統
6.4.1HDFS
6.4.2Hive
6.4.3Pig
6.4.4Mahout
6.4.5HBase
6.4.6ZooKeeper
6.4.7Flume
6.4.8Sqoop
6.5應用案例
小結
習題
參考文獻及擴展閱讀資料
第7章數據管理
7.1基本類型
7.1.1關系數據庫
7.1.2NoSQL
7.1.3關系雲
7.2體系結構
7.2.1MasterSlave結構
7.2.2P2P結構
7.3關鍵技術
7.3.1數據模型
7.3.2數據分佈
7.3.3數據一致性
7.3.4CAP理論與BASE原則
7.3.5視圖與物化視圖
7.3.6事務與版本戳
7.4典型系統
7.4.1Memcached
7.4.2MongoDB
7.4.3Cassandra
7.4.4HBase
7.5應用案例
小結
習題
參考文獻及擴展閱讀資料
附錄AR語言與R軟件
附錄B術語索引