復雜系統影響因素研究的數據驅動分析方法
李海林、林春培
相關主題
商品描述
目錄大綱
目錄
第1章 導論 1
1.1 背景意義 1
1.1.1 實際背景 2
1.1.2 重要意義 4
1.2 數據挖掘的典型應用 5
1.2.1 自然科學領域的應用 6
1.2.2 社會科學領域的應用 7
1.3 基本框架與流程 9
1.3.1 基本框架 10
1.3.2 基本流程 11
1.4 相關軟件及工具準備 14
1.4.1 Python軟件 14
1.4.2 PyCharm軟件 19
1.4.3 Graphviz軟件 25
1.4.4 Netica軟件 31
1.5 機器學習方法 34
1.5.1 雲模型 34
1.5.2 聚類算法 35
1.5.3 決策樹算法 36
1.5.4 隨機森林 37
1.5.5 貝葉斯網絡 37
1.5.6 爬山算法 38
1.6 案例分析任務與思路 39
1.6.1 案例分析任務 39
1.6.2 案例分析思路 40
參考文獻 44
第2章 指標構建與量化 54
2.1 指標選取依據 54
2.1.1 指標選取原則 55
2.1.2 指標篩選 57
2.2 不同數據類型的指標量化方法 58
2.2.1 調查問捲數據 58
2.2.2 實驗模擬數據 60
2.2.3 文本類型數據 62
2.2.4 網絡類型數據 63
2.2.5 復合類型數據 65
2.3 案例研究 67
2.3.1 案例背景 68
2.3.2 指標選擇 69
2.3.3 指標量化 71
參考文獻 73
第3章 數據採集與預處理 76
3.1 問題描述 76
3.2 數據來源與採集 78
3.3 特徵選擇 79
3.3.1 描述性統計 79
3.3.2 相關性分析 80
3.4 數據校準 82
3.4.1 正態雲模型 83
3.4.2 數據校準過程 85
3.5 數據預處理前後結果對比 91
3.5.1 描述性統計結果對比 91
3.5.2 相關系數結果對比 94
3.6 實現代碼 96
參考文獻 98
第4章 研究對象聚類與異質性群體特徵分析 99
4.1 問題描述 99
4.2 聚類算法選擇及依據 100
4.2.1 聚類算法 101
4.2.2 選擇依據 107
4.2.3 相關設置 108
4.2.4 聚類結果 110
4.3 異質性群體特徵分析 114
4.3.1 基本內容 114
4.3.2 群體描述性統計分析 116
4.3.3 異質性群體命名 118
4.4 實現代碼 119
4.4.1 K-Means聚類算法示例 120
4.4.2 AP聚類算法示例 120
4.4.3 肘部算法 121
4.4.4 波士頓房價聚類特徵雷達圖 122
參考文獻 124
第5章 異質性群體對象的影響因素分析 126
5.1 問題描述 126
5.2 研究設計 127
5.3 決策樹模型基礎 128
5.3.1 基本概念 129
5.3.2 建模步驟 137
5.3.3 剪枝策略 138
5.3.4 決策規則 138
5.4 決策樹建模分析 139
5.4.1 決策樹生成與剪枝 139
5.4.2 決策規則生成與分析 144
5.4.3 影響因素分析 145
5.4.4 規則比較 149
參考文獻 150
第6章 異質性群體對象的因素影響路徑分析 152
6.1 問題描述 152
6.2 研究設計 153
6.3 貝葉斯網絡 154
6.3.1 基本概念 154
6.3.2 結構學習與參數學習 157
6.3.3 爬山算法 157
6.3.4 敏感度分析 158
6.4 復雜因素的影響路徑案例分析 159
6.4.1 貝葉斯網絡結構學習 160
6.4.2 貝葉斯網絡參數學習 163
6.4.3 靈敏度分析 170
6.4.4 結果分析 184
6.5 實現代碼 189
參考文獻 190
第7章 基於DAC的復雜因素影響機制案例分析 192
7.1 網絡位置、知識基礎與後發企業創新績效 192
7.1.1 研究背景 193
7.1.2 理論基礎 195
7.1.3 研究設計 197
7.1.4 研究過程與決策分析 200
7.1.5 結論與啟示 208
7.2 後發企業如何走出創新困境?——基於知識能力視角 209
7.2.1 研究背景 209
7.2.2 文獻梳理 211
7.2.3 研究設計 213
7.2.4 研究過程與分析 216
7.2.5 結語 223
參考文獻 225