深入理解軟件性能——一種動態視角 Understanding Software Dynamics

[美]理乍得· L. 賽茨(Richard L.Sites)

  • 深入理解軟件性能——一種動態視角-preview-1
  • 深入理解軟件性能——一種動態視角-preview-2
深入理解軟件性能——一種動態視角-preview-1

買這商品的人也買了...

相關主題

商品描述

 

本書不僅介紹瞭如何測量CPU、內存、磁盤/SSD、網絡的性能,如何觀察、記錄、跟蹤、匯總性能指標,還討論瞭如何設計和創建性能測試工具KUtrace,以及如何對觀察結果進行推理。

本書不僅適合軟件開發人員閱讀,還適合電腦相關專業的師生參考。

作者簡介

理查德·L. 賽茨(Richard L. Sites),美國國家工程院院士。在職業生涯的大部分時間中,他負責硬體與軟體的交接,特別關注CPU/軟體性能交互。他擔任了DEC Alpha處理器的架構師,發明了處理器的性能計數器。他還在DEC、Adobe、Google和Tesla公司編寫過低開銷的微代碼,負責過軟體跟蹤。

目錄大綱

 

目  錄

 

第 一部分 測量

 

第 1章 我的程序太慢了 3

1.1 數據中心環境 3

1.2 數據中心的硬件 5

1.3 數據中心的軟件 6

1.4 長尾時延 7

1.5 思維框架 9

1.6 數量級估測 9

1.7 為什麽事務很慢 10

1.8 5種基本資源 11

1.9 小結 12

第 2章 測量CPU時間 13

2.1 發展歷史 14

2.2 現狀 17

2.3 測量add指令的時延 18

2.4 直線代碼失敗 19

2.5 簡單循環、循環開銷失敗、優化編譯器失敗 19

2.6 死變量失敗 22

2.7 更好的循環 23

2.8 依賴變量 24

2.9 實際執行時延 25

2.10 更多細微差別 25

2.11 小結 26

習題 26

第3章 測量內存層次 28

3.1 內存計時 28

3.2 關於內存 29

3.3 緩存組織 30

3.4 數據對齊 32

3.5 頁表緩存組織 33

3.6 測量內存的步驟 34

3.7 測量緩存行的大小 34

3.8 問題:預取第N+1行 36

3.9 依賴加載 37

3.10 非隨機的DRAM 38

3.11 測量每個緩存級別的總大小 39

3.12 測量每個級別的緩存相聯度 41

3.13 頁表緩存時間 42

3.14 緩存利用不足 42

3.15 小結 42

習題 43

第4章 CPU與內存的交互 45

4.1 緩存交互 45

4.2 簡單矩陣乘法的動態 47

4.3 估測 47

4.4 初始化、反復核對和觀察 48

4.5 初始結果 49

4.6 更快的矩陣乘法,轉置方法 51

4.7 更快的矩陣乘法,子塊方法 53

4.8 感知緩存的計算 54

4.9 小結 55

習題 55

第5章 測量磁盤/SSD的傳輸時間 56

5.1 關於硬盤 56

5.2 關於SSD 58

5.3 軟件磁盤訪問和磁盤緩沖 60

5.4 磁盤讀取有多快 62

5.5 一次粗略估算 65

5.6 磁盤寫入有多快 66

5.7 結果 66

5.8 從磁盤讀取 67

5.9 寫入磁盤 71

5.10 從SSD讀取 74

5.11 寫入SSD 75

5.12 多次傳輸 76

5.13 小結 77

習題 77

第6章 測量網絡流量 79

6.1 關於以太網 81

6.2 關於集線器、交換機和路由器 82

6.3 關於TCP/IP 83

6.4 關於數據包 84

6.5 關於RPC 85

6.6 空程差 87

6.7 觀察網絡流量 88

6.8 示例RPC消息的定義 90

6.9 示例日誌設計 92

6.10 使用RPC的示例客戶-服務器系統 93

6.11 示例服務器程序 94

6.12 自旋鎖 95

6.13 示例客戶端程序 96

6.14 測量一個示例客戶-服務器RPC 98

6.15 後處理RPC日誌 99

6.16 觀察 100

6.17 小結 101

習題 102

第7章 磁盤和網絡數據庫的交互 103

7.1 時間對齊 103

7.2 多個客戶端 109

7.3 自旋鎖的應用 109

7.4 實驗1 110

7.5 磁盤數據庫 113

7.6 實驗2 113

7.7 實驗3 117

7.8 日誌 119

7.9 理解事務時延的變化 120

7.10 小結 120

習題 121

 

第二部分 觀察

 

第8章 日誌 125

8.1 觀察工具 125

8.2 日誌 125

8.3 基本日誌 126

8.4 擴展日誌 127

8.5 時間戳 127

8.6 RPC ID 128

8.7 日誌文件的格式 129

8.8 管理日誌文件 130

8.9 小結 131

第9章 聚合措施測量 132

9.1 均勻的事件率與陣發的事件率 133

9.2 測量間隔 133

9.3 時間線 134

9.4 進一步匯總時間線 136

9.5 直方圖的時間尺度 138

9.6 聚合每個事件的測量結果 140

9.7 一段時間的值的模式 142

9.8 更新間隔 143

9.9 事務採樣 144

9.10 小結 145

第 10章 儀表板 147

10.1 示例服務 147

10.2 示例儀表板 149

10.3 主儀表板 149

10.4 實例儀表板 153

10.5 服務器儀表板 154

10.6 健全檢查 154

10.7 小結 155

習題 155

第 11章 其他現有工具 156

11.1 觀察工具的分類 156

11.2 要觀察的數據 158

11.3 top命令 159

11.4 /proc和/sys偽文件 160

11.5 time命令 160

11.6 perf命令 161

11.7 oprofile 162

11.8 strace 165

11.9 ltrace 168

11.10 ftrace 169

11.11 mtrace 172

11.12 blktrace 174

11.13 tcpdump和Wireshark 177

11.14 locktrace 179

11.15 輸入負載、出站調用 179

11.16 小結 180

習題 181

第 12章 跟蹤工具 182

12.1 跟蹤工具的優勢 182

12.2 跟蹤工具的缺點 183

12.3 3個起始問題 183

12.4 示例1:早期的程序計數器跟蹤 186

12.5 示例2:每個函數的計數和時間 188

12.6 案例分析:Gmail的按函數跟蹤 191

12.7 小結 196

第 13章 優秀觀察工具的設計原則 197

13.1 需要觀察什麽 197

13.2 有多頻繁?要多久 198

13.3 開銷有多大 199

13.4 設計的後果 200

13.5 案例分析:直方圖桶 200

13.6 設計數據顯示 202

13.7 小結 203

 

第三部分 內核-用戶跟蹤

 

第 14章 KUtrace的目標、設計、

實現 207

14.1 概述 207

14.2 目標 208

14.3 設計 209

14.4 實現 211

14.5 內核補丁和Linux內核可加載模塊 211

14.6 控製程序 212

14.7 後處理 213

14.8 關於安全問題的一點說明 213

14.9 小結 213

第 15章 KUtrace中的Linux內核補丁 214

15.1 跟蹤緩沖區數據結構 215

15.2 原始跟蹤塊的格式 216

15.3 跟蹤條目 217

15.4 IPC跟蹤條目 218

15.5 時間戳 219

15.6 事件編號 219

15.7 嵌套的跟蹤條目 219

15.8 代碼 220

15.9 數據包跟蹤 221

15.10 AMD/Intel x86-64補丁 222

15.11 小結 224

習題 224

第 16章 KUtrace的Linux內核可加載模塊 225

16.1 內核接口數據結構 225

16.2 模塊加載/卸載 226

16.3 初始化和控制跟蹤 226

16.4 實現跟蹤調用 227

16.5 Insert1 227

16.6 InsertN 229

16.7 切換到一個新的跟蹤塊 230

16.8 小結 230

第 17章 KUtrace的用戶態的運行時控制 231

17.1 控制跟蹤 232

17.2 獨立的kutrace_control程序 232

17.3 底層的kutrace_lib庫 233

17.4 可加載模塊的控制接口 233

17.5 小結 234

第 18章 KUtrace的後處理 235

18.1 後處理的細節 235

18.2 rawtoevent程序 236

18.3 eventtospan程序 237

18.4 spantotrim程序 239

18.5 spantospan程序 239

18.6 samptoname_k和samptoname_u程序 240

18.7 makeself程序 240

18.8 KUtrace的JSON格式 240

18.9 小結 242

第 19章 KUtrace中軟件動態的顯示 243

19.1 概述 243

19.2 區域①—控件 244

19.3 區域②—y軸 246

19.4 區域③—主時間線 246

19.5 區域④—IPC圖例 251

19.6 區域⑤—x軸 252

19.7 區域⑥—保存/還原 252

19.8 輔助控件 252

19.9 小結 253

 

第四部分 推理

 

第 20章 尋找什麽 257

20.1 概述 257

20.2 尋找原因 258

第 21章 執行太多 259

21.1 概述 259

21.2 程序 259

21.3 謎團 260

21.4 探索和分析 261

21.5 理解謎團 265

21.6 小結 265

第 22章 執行緩慢 267

22.1 概述 267

22.2 程序 268

22.3 謎團 268

22.4 浮點運算對立程序 270

22.5 內存對立程序 273

22.6 理解謎團 274

22.7 小結 274

第 23章 等待CPU 276

23.1 程序 276

23.2 謎團1 276

23.3 探索和分析 277

23.4 謎團2 279

23.5 理解謎團2 280

23.6 附加謎團 282

23.7 小結 284

習題 284

第 24章 等待內存 285

24.1 程序 285

24.2 謎團1 286

24.3 探索和分析 286

24.4 謎團2:訪問頁表 290

24.5 理解謎團2 290

24.6 小結 292

習題 292

第 25章 等待磁盤 293

25.1 程序 293

25.2 謎團 294

25.3 探索和分析 294

25.4 讀取40 MB 296

25.5 順序讀取4 KB的塊 297

25.6 隨機讀取4 KB的塊 299

25.7 在SSD上寫入和同步

40 MB 301

25.8 在SSD上讀取40 MB 301

25.9 兩個程序同時訪問兩個文件 302

25.10 理解謎團 303

25.11 小結 304

習題 304

第 26章 等待網絡 305

26.1 概述 305

26.2 程序 306

26.3 實驗1 307

26.4 實驗1中的謎團 308

26.5 實驗1的探索與分析 309

26.6 實驗1中RPC之間的時間 313

26.7 實驗2 315

26.8 實驗3 315

26.9 實驗4 316

26.10 理解謎團 319

26.11 附加異常 320

26.12 小結 322

第 27章 等待鎖 323

27.1 概述 323

27.2 程序 327

27.3 實驗1:長時間持有鎖 330

27.4 實驗1中的謎團 331

27.5 探索和分析實驗1 332

27.6 實驗2:修復鎖捕獲 334

27.7 實驗3:通過多個鎖修復鎖爭用 335

27.8 實驗4:通過鎖住更少的工作來修復鎖爭用 337

27.9 實驗5:通過為儀表板使用RCU來修復鎖爭用 338

27.10 小結 340

第 28章 等待時間 341

28.1 定期工作 341

28.2 超時 342

28.3 時間分片 342

28.4 內在的執行延遲 343

28.5 小結 343

第 29章 等待隊列 344

29.1 概述 344

29.2 請求的分佈 346

29.3 隊列的結構 347

29.4 工作任務 348

29.5 主任務 348

29.6 Dequeue操作 348

29.7 Enqueue操作 349

29.8 PlainSpinLock類 349

29.9 “工作”例程 350

29.10 簡單的示例 350

29.11 哪些地方可能發生了問題 351

29.12 CPU頻率 352

29.13 復雜的示例 353

29.14 等待CPU:RPC日誌 353

29.15 等待CPU:KUtrace 354

29.16 PlainSpinLock存在的缺陷 357

29.17 根本原因 358

29.18 修復PlainSpinLock:可觀察性 359

29.19 負載均衡 360

29.20 隊列深度:可觀察性 361

29.21 結尾處的自旋 361

29.22 剩下的最後一個缺陷 362

29.23 交叉檢查 362

29.24 小結 363

習題 363

第30章 全書回顧 365

30.1 你學到了什麽 365

30.2 我們沒有講什麽 367

30.3 接下來的工作 367

30.4 全書小結 368

附錄A 示例服務器 369

附錄B 跟蹤條目 372

術語表 377

參考文獻 383

KUtrace HTML圖例 384