電腦視覺之PyTorch數字圖像處理
侯偉
- 出版商: 清華大學
- 出版日期: 2024-09-01
- 售價: $479
- 貴賓價: 9.5 折 $455
- 語言: 簡體中文
- ISBN: 7302671982
- ISBN-13: 9787302671985
-
相關分類:
DeepLearning、Computer Vision
立即出貨
相關主題
商品描述
目錄大綱
第1篇 圖像處理基礎知識
第1章 電腦視覺與數字圖像概述 2
1.1 電腦視覺簡介 3
1.1.1 人類視覺簡介 3
1.1.2 電腦視覺簡介 5
1.2 數字圖像簡介 7
1.2.1 圖像的概念 7
1.2.2 數字圖像的概念 9
1.2.3 數字圖像的類型 10
1.3 數字圖像的存儲 12
1.4 數字圖像的處理 14
1.4.1 數字圖像處理簡介 15
1.4.2 數字圖像處理的發展 15
1.4.3 數字圖像處理的內容 16
1.5 PyTorch框架與圖像處理 16
1.6 小結 18
1.7 習題 18
第2章 搭建開發環境 19
2.1 Python簡介 19
2.1.1 Python的發展歷程 19
2.1.2 下載Python安裝包 20
2.1.3 安裝Python 21
2.1.4 執行Python程序 23
2.2 CUDA簡介 24
2.2.1 CUDA的發展歷程 24
2.2.2 安裝CUDA 24
2.3 Python第三方庫簡介 25
2.3.1 檢索Python第三方庫 25
2.3.2 安裝Python第三方庫 27
2.3.3 與圖像處理相關的第三方庫 28
2.4 安裝PyTorch 29
2.5 安裝可視化工具Visdom 30
2.6 安裝集成開發環境Spyder 31
2.7 小結 32
2.8 習題 32
第3章 Python編程基礎 33
3.1 Python語法基礎知識 33
3.1.1 數據類型與類 33
3.1.2 流程控制 38
3.1.3 函數 39
3.1.4 類與對象 40
3.1.5 標準庫 41
3.1.6 第三方庫 43
3.2 PyTorch基礎知識 46
3.2.1 張量的創建 46
3.2.2 張量的運算 52
3.2.3 捲積及局部鄰域的運算 56
3.2.4 張量的變換 60
3.3 Visdom基礎知識 64
3.3.1 圖像的繪制 65
3.3.2 圖表的繪制 67
3.4 小結 72
3.5 習題 72
第2篇 基於經典方法的圖像處理
第4章 圖像處理基礎知識 74
4.1 圖像與張量的互操作 74
4.2 圖像的點運算 76
4.2.1 圖像增強 77
4.2.2 圖像顏色空間變換 80
4.2.3 灰度圖像的亮度變換 84
4.2.4 簡單圖像二值化 86
4.2.5 圖像蒙版處理 88
4.2.6 圖像的混合 90
4.3 圖像的鄰域運算 92
4.3.1 圖像鄰域的生成 92
4.3.2 圖像的濾波去噪 95
4.3.3 圖像的形態學運算 97
4.3.4 局部二值模式 102
4.3.5 局部最大值指數 104
4.4 圖像的全局運算 106
4.4.1 圖像的簡單旋轉與翻轉 106
4.4.2 圖像的縮放 108
4.4.3 圖像的裁切 108
4.4.4 圖像直方圖均衡化 110
4.5 小結 112
4.6 習題 112
第5章 圖像的基礎特徵 113
5.1 圖像的特徵點 113
5.1.1 特徵點簡介 113
5.1.2 Harris角點 115
5.1.3 提取Harris角點 117
5.2 圖像的線特徵 120
5.2.1 Roberts算子 121
5.2.2 Prewitt算子 122
5.2.3 Sobel算子 124
5.2.4 Scharr算子 125
5.2.5 Laplacian算子 127
5.3 圖像的面特徵 129
5.3.1 K-均值聚類 129
5.3.2 SLIC算法 132
5.4 小結 134
5.5 習題 135
第6章 自動梯度與神經網絡 136
6.1 自動梯度 136
6.1.1 梯度下降與函數極小值求解 136
6.1.2 自動梯度計算 137
6.1.3 自動梯度擬合多項式函數 139
6.2 模塊 141
6.3 激活函數 145
6.4 損失函數 147
6.5 優化器 148
6.6 全連接神經網絡 150
6.7 小結 154
6.8 習題 155
第7章 數據準備與圖像預處理 156
7.1 Torchvision庫簡介 156
7.2 構建數據集 159
7.3 數據變換與增強 164
7.3.1 PIL圖像和張量的共同變換 165
7.3.2 基於張量的變換 170
7.3.3 自定義數據的變換和增強 171
7.4 小結 174
7.5 習題 174
第3篇 基於深度學習的圖像處理
第8章 圖像分類 176
8.1 圖像分類與捲積神經網絡 176
8.1.1 圖像分類及其進展 176
8.1.2 預訓練模型的使用 178
8.2 經典的捲積神經網絡 183
8.2.1 VGGNet模型 183
8.2.2 ResNet模型 187
8.3 捲積神經網絡的訓練與評估 190
8.4 遷移學習簡介 194
8.5 小結 198
8.6 習題 198
第9章 圖像分割 199
9.1 圖像分割與捲積神經網絡 199
9.2 分割數據集 201
9.3 FCN分割模型 206
9.4 UNet分割模型 209
9.5 分割網絡的訓練與評估 212
9.5.1 損失函數 212
9.5.2 優化器 213
9.5.3 評價指標 215
9.6 分割網絡實踐 217
9.7 小結 222
9.8 習題 222
第10章 目標檢測 223
10.1 目標檢測與捲積神經網絡 223
10.1.1 目標檢測的常用術語 224
10.1.2 目標檢測的類型 225
10.2 預訓練網絡的使用 227
10.2.1 Torchvision的預訓練模型 227
10.2.2 YOLOv5的預訓練模型 232
10.3 FCOS模型及其訓練 235
10.3.1 FCOS模型簡介 235
10.3.2 數據集的構建 237
10.3.3 模型的訓練和預測 239
10.4 YOLOv5模型及其訓練 241
10.4.1 數據集的構建 242
10.4.2 模型的構建 243
10.4.3 模型的訓練和預測 244
10.5 小結 246
10.6 習題 246
第11章 模型部署 247
11.1 模型部署簡介 247
11.2 使用LibTorch進行模型部署 249
11.3 使用ONNX進行模型部署 252
11.4 使用OpenCV進行模型部署 253
11.5 使用OpenVINO進行模型部署 254
11.6 小結 255
11.7 習題 256