多元數據分析原理與實踐

楊壽淵

  • 出版商: 清華大學
  • 出版日期: 2023-11-01
  • 定價: $479
  • 售價: 8.5$407
  • 語言: 簡體中文
  • ISBN: 730264862X
  • ISBN-13: 9787302648628
  • 相關分類: Data Science
  • 下單後立即進貨 (約2週~3週)

  • 多元數據分析原理與實踐-preview-1
  • 多元數據分析原理與實踐-preview-2
  • 多元數據分析原理與實踐-preview-3
多元數據分析原理與實踐-preview-1

相關主題

商品描述

本書是多元數據分析的基礎教材,內容涵蓋方差分析、總體分佈和獨立性檢驗、矩陣的奇異值分解、 多元線性回歸分析、主成分分析、因子分析、聚類分析、多維標度分析、判別分析、邏輯回歸分析、典 型相關分析等多元數據分析的核心內容。寫作上力求深入淺出、循序漸進,既照顧學生的理解能力與學 習興趣,又考慮內容的全面性與深度。本書在內容取捨、習題選擇等方面依據作者的教學經驗做了仔細 考慮,同時參考國內外的經典教材與文獻,力求做到與時俱進,能夠與前置和後續課程很好地銜接。 書 中除了方法原理講解外,還有大量計算和應用實例,並附有完整的 MATLAB 代碼和數據集,以及詳細 的使用說明和代碼註釋,讀者能夠很容易地實現所學方法。每章末尾均有拓展閱讀建議,供學有餘力或 有興趣的學生參考。此外,本書還配有用 LaTeX 精心製作的 PDF 課件,方便授課教師使用。 本書可作為基礎數學、概率統計、應用數學、大數據、管理科學與工程、金融工程等專業的本科教 材,也可作為相關專業研究生基礎課程的教材或參考書。

目錄大綱

目錄

第1章  導論與預備知識  1

1.1  數據分析的研究對象  1

1.2  向量空間  3

1.3  範數  7

1.4  內積空間  9

1.5  線性變換  12

1.6  特徵值與特徵向量  16

1.7  正交補空間和保範變換  23

1.8  多維隨機變量  26

1.8.1  隨機向量的分佈和獨立性  26

1.8.2  隨機向量的數字特徵  28

1.8.3  多維正態分佈  29

1.9  多元統計量及抽樣分佈  36

1.9.1  總體、樣本和統計量  36

1.9.2  估計量的評價標準  38

1.9.3  常用的多元抽樣分佈  41

拓展閱讀建議  44

第1章習題  44

第2章  方差分析  46

2.1  單變量的均值檢驗  46

2.2  單變量的方差分析  49

2.3  多元均值檢驗  54

2.4  多元方差分析  59

2.5  協方差矩陣相等的檢驗  62

2.6  MATLAB方差分析工具  64

拓展閱讀建議  67

第2章習題  68

第3章  關於總體分佈的檢驗和獨立性檢驗  69

3.1  擬合優度檢驗  69

3.1.1  多項分佈的中心極限定理  69

3.1.2  擬合優度檢驗  71

3.1.3  理論分佈中含有未知參數的擬合優度檢驗  75

3.2  正態性檢驗  78

3.2.1  圖示法  79

3.2.2  擬合優度檢驗  85

3.2.3  Kolmogorov-Smirnov檢驗  87

3.2.4  偏度和峰度  89

3.2.5  Jarque-Bera檢驗  91

3.3  獨立性檢驗  92

3.3.1  引例  92

3.3.2  列聯表分析  94

拓展閱讀建議  96

第3章習題  96

第4章  奇異值分解  99

4.1  奇異值分解定理  99

4.2  幾何解釋  104

4.3  應用  106

4.3.1  矩陣的低秩逼近和數據壓縮  106

4.3.2  超定線性方程組和矩陣的偽逆  112

拓展閱讀建議  114

第4章習題  114

第5章  多元線性回歸分析  116

5.1  線性回歸模型  116

5.2  最小二乘估計  117

5.3  幾何解釋  123

5.4  偏相關系數  126

5.5  線性回歸模型的推斷及評價  134

5.6  實例  137

拓展閱讀建議  140

第5章習題  140

第6章  主成分分析  142

6.1  概述  142

6.2  數學模型  143

6.3  主成分模型的解  144

6.4  主成分的性質  147

6.5  主成分分析的計算實現  150

6.6  實踐中需要考慮的問題  154

6.6.1  適合用主成分法降維的數據  154

6.6.2  是否先對數據進行標準化處理  156

6.6.3  應該保留多少個主成分  156

6.7  實例  161

拓展閱讀建議  164

第6章習題  164

第7章  因子分析  165

7.1  概述  165

7.2  數學模型  167

7.3  因子模型的參數估計  168

7.3.1  主成分法  169

7.3.2  主因子法  171

7.3.3  極大似然估計  173

7.3.4  三種參數估計法的比較  176

7.4  因子旋轉  179

7.4.1  基本思想  179

7.4.2  因子旋轉方法  180

7.4.3  應用實例  182

7.5  因子得分的估計  186

7.5.1  最小二乘法  186

7.5.2  加權最小二乘估計  187

7.5.3  回歸法  188

7.5.4  因子正交旋轉對因子得分的影響  189

7.5.5  應用實例  189

拓展閱讀建議  193

第7章習題  193

第8章  聚類分析  195

8.1  概述  195

8.2  相似性度量  196

8.2.1  距離  196

8.2.2  相似系數  198

8.2.3  用MATLAB計算距離矩陣和不相似度矩陣  199

8.3  系統聚類法  201

8.3.1  常用的系統聚類法  201

8.3.2  系統聚類法的步驟  205

8.3.3  系統聚類的實現  208

8.3.4  系統聚類法的性質  212

8.4  K-均值聚類  213

8.4.1  基本思想與算法  213

8.4.2  MATLAB實現  214

8.5  聚類分析實踐中常遇到的問題  216

8.5.1  變量的選取  216

8.5.2  確定類的個數  216

8.5.3  聚類結果的解釋  218

拓展閱讀建議  220

第8章習題  220

第9章  多維標度分析  221

9.1  概述  221

9.2  多維標度分析的古典解  222

9.2.1  基本概念  222

9.2.2  歐氏距離結構的充要條件  223

9.2.3  多維標度分析的古典解  227

9.2.4  計算實例  228

9.3  多維標度分析的古典解與主成分的聯系  233

9.4  非度量多維標度分析  235

9.4.1  概念及原理  235

9.4.2  實現  238

拓展閱讀建議  241

第9章習題  241

第10章  判別分析和邏輯回歸分析  243

10.1  概述  243

10.2  兩個總體的判別分析  244

10.2.1  判別模型  244

10.2.2  正態總體的平均錯判成本最小判別法  245

10.2.3  應用實例  247

10.3  多個總體的判別分析  253

10.3.1  後驗概率和Bayes公式  253

10.3.2  Bayes判別法  254

10.3.3  平均錯判成本最小判別法  255

10.3.4  計算實例  257

10.4  Fisher線性判別分析  262

10.4.1  基本思想  262

10.4.2  Fisher線性判別函數  263

10.4.3  計算實例  266

10.4.4  MATLAB的判別分析函數  270

10.5  邏輯回歸模型  271

10.5.1  基本思想及數學模型  271

10.5.2  模型參數估計  272

10.5.3  利用邏輯回歸模型分類  273

10.5.4  假設檢驗  274

10.5.5  應用實例  275

10.6  多分類的softmax回歸模型  278

10.6.1  模型與參數估計方法  278

10.6.2  應用實例  279

拓展閱讀建議  281

第10章習題  281

第11章  典型相關分析  284

11.1  概述  284

11.2  數學模型及求解  285

11.2.1  數學模型  285

11.2.2  模型求解  286

11.2.3  典型相關系數的顯著性檢驗  289

11.3  MATLAB實現及應用實例  289

11.3.1  MATLAB實現  289

11.3.2  應用實例  293

拓展閱讀建議  295

第11章習題  296

附錄A  2分佈、t分佈和F分佈  298

附錄B  多元正態總體參數的極大似然估計  305

附錄C  順序統計量和經驗分佈函數  309

C.1  順序統計量  309

C.2  經驗分佈函數  311

附錄D  矩陣函數的求導公式  317

部分習題答案  321 

參考文獻  336