視覺人工智能基礎
郟東耀
- 出版商: 化學工業
- 出版日期: 2026-05-01
- 售價: $768
- 語言: 簡體中文
- 頁數: 318
- ISBN: 7122498727
- ISBN-13: 9787122498724
-
相關分類:
影像辨識 Image-recognition
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書系統介紹了人工智能視覺檢測領域的基礎理論、關鍵技術與典型應用,內容涵蓋圖像采集原理、圖像與視頻處理方法、視覺檢測中的數學工具、圖像預處理技術,以及神經網絡與深度學習模型在視覺檢測中的工程化應用。全書共八章,從底層成像機制到高層智能分類技術,再到實際行業應用,構建了完整的人工智能視覺技術體系。 本書內容由淺入深,循序漸進,重點介紹了計算機視覺在醫學圖像分析、工業產品質量檢測等場景中的落地應用,同時對多模態視覺、邊緣部署、遷移學習、視覺數據標註等前沿方向進行了系統性闡述。具體章節包括視覺檢測中的圖像采集技術、圖像與視頻處理工具、基礎數學方法、圖像預處理與增強、深度學習在視覺中的實現流程、數據標註與處理方法、主流神經網絡模型及其在分類任務中的應用,以及視覺檢測在醫療、工業等多個領域的實踐案例。 本書內容註重理論聯系實際,在保持專業系統性的同時,輔以大量實例、工具 和關鍵技術解析,可作為從事人工智能視覺檢測、圖像分析、工業視覺系統開發等領域工程技術人員的重要參考資料,也適合高等院校計算機、人工智能、自動化、信息工程等專業師生教學使用。本書對相關研究人員、研發工程師以及有誌從事視覺人工智能工作的初學者具有較高的參考價值和實踐指導意義。
作者簡介
郟東耀,北京交通大學教授、博士生導師,大數據與智慧測控研究中心主任。主要科研方向為數據科學與工程、視覺人工智能、深度學習新理論及其應用,發表學術論文100餘篇。曾主持或參與國家863計劃重大項目、國家自然科學基金重大項目、國家科技支撐計劃項目等。
目錄大綱
第1章 視覺檢測中的圖像采集技術
1.1 成像基本原理
1.1.1 人類視覺系統
1.1.2 小孔成像原理
1.1.3 透鏡成像原理
1.1.4 計算機視覺常用參數
1.1.5 影響成像質量的因素
1.1.6 常見儀器的光學成像原理
1.2 圖像及視頻采集方法
1.3 CMOS和CCD技術
1.3.1 CMOS圖像技術
1.3.2 CCD圖像技術
1.4 光譜成像技術在視覺檢測中的應用
1.4.1 高光譜成像
1.4.2 高光譜和多光譜的區別
1.5 其他先進的圖像采集方法
1.5.1 X射線成像
1.5.2 掃描電子顯微鏡
1.5.3 全息投影技術
1.5.4 核磁共振
1.5.5 計算機斷層掃描
1.5.6 超聲成像(Ultrasound Imaging)
1.6 本章小結
第2章 視覺檢測中的圖像與視頻處理技術
2.1 常用的視頻及圖像軟件
2.1.1 ImageMagick:圖像處理領域的強大利器
2.1.2 ImageJ:圖像處理領域的得力助手
2.1.3 OpenCV:計算機視覺領域的開源瑰寶
2.1.4 GIMP:開源圖像編輯領域的璀璨之星
2.1.5 Blender:開源3D創作的全能利器
2.2 專用開發工具及環境
2.2.1 Python:圖像及視頻處理領域的得力編程助手
2.2.2 TensorFlow與PyTorch:深度學習圖像視頻處理的雙雄
2.2.3 FFmpeg:強大的多媒體處理利器
2.3 圖像處理軟件的未來發展趨勢
2.4 本章小結
參考文獻
第3章 視覺檢測中的數學基礎
3.1 線性代數基礎工具與方法
3.1.1 標量
3.1.2 向量
3.1.3 矩陣
3.1.4 張量
3.1.5 張量算法的基本性質
3.1.6 降維
3.1.7 點積(Dot Product)
3.1.8 矩陣-向量積
3.1.9 矩陣-矩陣乘法
3.1.10 範數
3.2 概率與數理統計在視覺檢測中的應用
3.2.1 概率
3.2.2 基本概率論
3.2.3 處理多個隨機變量
3.2.4 期望和方差
3.3 微積分工具及其在視覺檢測中的應用
3.3.1 常見的圖像處理工具
3.3.2 各種工具的優缺點
3.4 離散數學工具在視覺檢測中的作用
3.4.1 常見的離散數學工具包
3.4.2 離散工具包的實際應用
3.5 本章小結
參考文獻
第4章 視覺檢測中的圖像預處理技術
4.1 圖像增強及銳化
4.1.1 直方圖均衡化
4.1.2 小波變換圖像增強算法
4.1.3 偏微分方程圖像增強算法
4.1.4 分數階微分方程增強算法
4.1.5 Retinex圖像增強算法
4.1.6 基於卷積的圖像銳化算法
4.1.7 基於頻域的圖像銳化算法
4.2 直方圖處理方法
4.2.1 直方圖規定化
4.2.2 局部直方圖處理
4.2.3 直方圖拉伸
4.2.4 雙直方圖均衡化
4.3 圖像變換域處理技術
4.3.1 主成分變換
4.3.2 小波變換
4.3.3 最小噪聲分離變換
4.3.4 傅裏葉變換
4.4 圖像分割方法
4.4.1 基於閾值的圖像分割
4.4.2 基於區域的圖像分割
4.4.3 基於邊緣的圖像分割
4.4.4 基於聚類的圖像分割
4.4.5 基於模型的圖像分割
4.5 圖像降噪技術
4.5.1 噪聲的類型
4.5.2 圖像降噪的基本原理
4.5.3 常見的圖像降噪方法
4.5.4 圖像降噪方法的性能評估
4.6 本章小結
參考文獻
第5章 神經網絡與深度學習在視覺檢測中的應用
5.1 神經網絡基礎與視覺檢測關聯
5.1.1 神經網絡的起源與發展
5.1.2 神經網絡的基本結構
5.1.3 神經網絡的工作原理
5.2 機器學習在圖像處理中的作用
5.2.1 機器學習的定義與分類
5.2.2 監督學習
5.2.3 無監督學習
5.2.4 半監督學習
5.2.5 強化學習
5.2.6 機器學習的應用領域
5.3 深度學習在視覺檢測方面的應用
5.3.1 深度學習的特點
5.3.2 卷積神經網絡
5.3.3 循環神經網絡
5.3.4 生成對抗網絡
5.4 大模型及專用模型在視覺檢測中的優化
5.4.1 大模型的架構與設計
5.4.2 大模型的訓練策略
5.4.3 大模型的微調與優化
5.4.4 大模型的評估指標
5.4.5 專用模型的定制化架構
5.4.6 專用模型的領域適應性訓練
5.4.7 專用模型的性能優勢與局限性
5.5 本章小結
參考文獻
第6章 視覺檢測數據標註與處理方法
6.1 樣本數據標註
6.1.1 樣本數據標註概述
6.1.2 樣本數據標註的重要性
6.1.3 樣本數據標註方法與類型
6.1.4 標註質量控制
6.1.5 數據標註的難點與挑戰
6.1.6 數據預處理與增強
6.1.7 應用案例與實際挑戰
6.2 視覺數據標註
6.2.1 視覺數據標註概述
6.2.2 視覺數據標註的重要性
6.2.3 視覺數據標註的特點與標註需求
6.2.4 視覺數據標註的分類與應用場景
6.2.5 視覺數據標註的方法與工具
6.2.6 視覺數據標註應用案
