PyTorch電腦視覺與深度學習
任毅龍 劉衍琦 陳敬龍 主編 代豐 賈澤豪 謝丹木 王樂寧 高超 董雪 副主編
- 出版商: 清華大學
- 出版日期: 2025-05-01
- 售價: $359
- 語言: 簡體中文
- ISBN: 7302686157
- ISBN-13: 9787302686156
-
相關分類:
DeepLearning、Computer Vision
下單後立即進貨 (約4週~6週)
相關主題
商品描述
"本書將基礎理論和算法實現相結合,循序漸進地介紹了人工智能領域中的常見算法,全面、系統地介紹了使用Python實現人工智能算法,並通過PyTorch框架實現人工智能算法中的深度學習內容。全書分為兩篇,共12章,分別介紹了人工智能基礎、深度學習基礎、捲積神經網絡的基本構建、PyTorch的基本應用、分類識別技術與應用、目標檢測技術與應用、基於視覺大數據檢索的圖搜圖應用、驗證碼AI識別、基於生成式對抗網絡的圖像生成應用、肺炎感染影像智能識別、基於深度學習的人臉二維碼識別、污損遮擋號牌識別與違法行為檢測等內容,並對所涉及的每個知識點都配有相應的實現代碼和實例。 本書主要面向廣大從事數據分析、機器學習、數據挖掘或深度學習的專業人員,從事高等教育的專任教師,全國高等學校的在讀學生及相關領域的廣大科研人員。 "
目錄大綱
目錄
第1部分基礎篇
第1章人工智能基礎
1.1人工智能概述
1.1.1什麽是人工智能
1.1.2人工智能的發展歷程
1.2電腦視覺基礎
1.2.1機器對圖像的感知
1.2.2傳統圖像處理方法的探索
1.2.3特徵表達與提取技術
1.2.4深度學習圖像識別原理
1.3深度學習在實際中的應用
1.3.1圖像分類與識別
1.3.2圖像目標檢測
1.3.3圖像分割與輪廓提取
1.3.4圖像描述生成
1.3.5圖像問答系統
1.3.6圖像生成與創作
1.4本章小結
第2章深度學習的基本原理
2.1神經網絡的實現方法
2.1.1前向傳播
2.1.2反向傳播
2.2梯度與自動微分
2.2.1梯度下降與優化
2.2.2局部最優與鞍點
2.2.3梯度消失與爆炸問題
2.3參數優化與更新策略
2.3.1損失函數與優化目標
2.3.2優化器與激活函數
2.3.3學習率的自適應調整
2.4本章小結
第3章捲積神經網絡的基本構建
3.1捲積層的多種操作
3.1.1捲積運算的基本原理
3.1.2常規捲積操作
3.1.3深度可分離捲積
3.1.4分組捲積與擴展捲積
3.2可變形捲積技術
3.2.1可變形捲積的數學基礎
3.2.2可變形捲積的網絡結構
3.2.3可變形捲積的應用
3.3反捲積與目標分割
3.3.1反捲積的數學原理
3.3.2全捲積網絡
3.3.3反捲積在全捲積網絡中的應用
3.4池化層的多重特性
3.4.1下採樣與池化操作
3.4.2上採樣與特徵擴充
3.5全連接層的作用與影響
3.5.1全連接層的基本原理
3.5.2全連接層之間的關聯性
3.6數據標準化和正則化
3.6.1數據標準化的重要性
3.6.2批標準化與層標準化
3.6.3正則化方法
3.7本章小結
第4章PyTorch的基本應用
4.1PyTorch簡介與環境搭建
4.1.1瞭解PyTorch框架
4.1.2搭建PyTorch開發環境
4.2PyTorch基本語法與操作
4.2.1張量(Tensor) 的基礎概念
4.2.2張量的運算與操作
4.3PyTorch中的自動微分
4.3.1自動微分原理與應用
4.3.2構建可微分變量
4.3.3自動微分的演示示例
4.4模型的保存與加載
4.4.1保存與加載可訓練參數
4.4.2完整模型的保存與加載
4.4.3多模型的管理與加載
4.5跨設備模型加載
4.5.1在CPU和GPU之間切換加載
4.5.2多GPU環境下的模型加載
4.6權重的修改與調整
4.6.1權重可視化與分析
4.6.2在多GPU環境中修改權重
4.7本章小結
第2部分應用篇
第5章分類識別技術與應用
5.1應用背景
5.2捲積神經網絡的設計與構建
5.2.1CRNN神經網絡架構
5.2.2捲積核的作用與選擇
5.2.3特徵圖提取與表示
5.2.4池化操作的降維效果
5.2.5網絡結構的定義與構建
5.3捲積神經網絡的訓練與評測
5.3.1數據集準備與預處理
5.3.2數據集解析與樣本分析
5.3.3網絡模型的訓練過程
5.3.4網絡模型的性能測試與評估
5.4應用集成開發與界面設計
5.5本章小結
第6章目標檢測技術與應用
6.1應用背景
6.2目標檢測的候選框生成策略
6.2.1背景和應用知識
6.2.2滑窗技術
6.2.3區域候選框
6.2.4基於選擇性搜索的檢測框架
6.3神經網絡在目標檢測中的應用
6.3.1殘差連接
6.3.2錨框
6.3.3空間金字塔池化
6.3.4區域生成網絡
6.3.5邊框回歸技術
6.4主乾神經網絡的選擇與應用
6.4.1AlexNet
6.4.2VGGNet
6.4.3ResNet
6.5單階段目標檢測模型
6.5.1SSD模型
6.5.2YOLO模型
6.6雙階段目標檢測模型
6.6.1RCNN模型
6.6.2Faster RCNN模型
6.6.3RFCN模型
6.7本章小結
第7章基於視覺大數據檢索的圖搜圖應用
7.1應用背景
7.2視覺特徵提取
7.2.1CNN模型選擇
7.2.2CNN深度特徵
7.3視覺特徵索引
7.4視覺搜索引擎
7.5集成應用開發
7.6本章小結
第8章驗證碼AI識別
8.1應用背景
8.2驗證碼圖像生成
8.2.1基礎字符模板
8.2.2驗證碼圖模擬
8.2.3驗證碼數據庫
8.3驗證碼識別模型
8.3.1CNN模型訓練
8.3.2CNN模型測試
8.4集成應用開發
8.4.1數據集標註
8.4.2數據集分割
8.4.3CNN模型訓練
8.4.4CNN模型應用
8.5本章小結
第9章基於生成式對抗網絡的圖像生成應用
9.1應用背景
9.2生成式對抗網絡模型
9.2.1卡通頭像大數據
9.2.2GAN網絡設計
9.2.3GAN網絡訓練
9.2.4GAN網絡測試
9.3集成應用開發
9.4本章小結
第10章肺炎感染影像智能識別
10.1應用背景
10.2肺炎感染影像識別
10.2.1肺炎感染影像大數據
10.2.2CNN遷移設計
10.2.3CNN遷移訓練
10.2.4CNN遷移評測
10.2.5CNN融合識別
10.3集成應用開發
10.4本章小結
第11章基於深度學習的人臉二維碼識別
11.1應用背景
11.2QR編解碼
11.2.1QR編碼
11.2.2QR解碼
11.2.3內容加密
11.3人臉壓縮
11.3.1人臉建庫
11.3.2人臉降維
11.3.3人臉重構
11.3.4人臉轉碼
11.4CNN分類識別
11.5集成應用開發
11.6本章小結
第12章污損遮擋號牌識別與違法行為檢測
12.1應用背景
12.2理論基礎
12.2.1算法模型的選擇與解釋
12.2.2污損遮擋號牌定位算法
12.2.3號牌號碼識別算法
12.3功能設計
12.3.1構建車輛號牌數據集
12.3.2權重文件的適配與編輯
12.3.3模型參數的配置與調整
12.3.4閾值分析與結果解讀
12.4功能實現
12.5本章小結
參考文獻