AI 機器人|從感知到行動的下一步 (AI for Robotics: Toward Embodied and General Intelligence in the Physical World)
Alishba Imran , Keerthana Gopalakrishnan 著 温榮弘 譯
- 出版商: 碁峰資訊
- 出版日期: 2026-04-02
- 定價: $800
- 售價: 7.9 折 $632
- 語言: 繁體中文
- 頁數: 328
- ISBN: 6264252530
- ISBN-13: 9786264252539
-
相關分類:
無人機
- 此書翻譯自: AI for Robotics: Toward Embodied and General Intelligence in the Physical World (Paperback)
尚未上市,歡迎預購
買這商品的人也買了...
-
全民學程式設計:從插畫學 C 語言$380$300 -
機器學習的數學基礎 : AI、深度學習打底必讀$580$458 -
The Pragmatic Programmer 20週年紀念版 (The Pragmatic Programmer, 20th Anniversary Edition)$680$537 -
機器學習的統計基礎 : 深度學習背後的核心技術$680$612 -
OpenCV 影像創意邁向 AI 視覺王者歸來 (全彩印刷)$890$703 -
30天挑戰精通 PowerShell【第四版】:Windows、Linux 和 macOS 適用 (Learn PowerShell in a Month of Lunches: Covers Windows, Linux, and macOS, 4/e)$760$532 -
深度學習 -- 最佳入門邁向 AI 專題實戰, 2/e$1,200$948 -
Python 面向對象編程, 4/e$1,134$1,077 -
讓 AI 好好說話!從頭打造 LLM (大型語言模型) 實戰秘笈$680$537 -
數位影像處理 ─ 使用 Matlab 與 C++ / Python 語言 (推薦:姚賀騰)$680$646 -
LLM 竟然這麼靠近 - 使用 llama 模型建立大模型本機系統$980$774 -
深度學習詳解|台大李宏毅老師機器學習課程精粹$750$592 -
MCP 開發全攻略:打造懂指令、會協作的 AI 系統$550$412 -
Gemini 3 x NotebookLM 領軍:Nano Banana Pro x Veo x Whisk x Flow x Gem - Google 多模態 AI 工作流$650$513 -
Graylog 整合應用實戰:打造視覺化與智慧化的新世代資安監控平台$650$507 -
最強!Google AI 工作術:以 Gemini 3 為核心,串聯 NotebookLM 與滿滿 AI 工具, 搞定資料分析、簡報製作、 教育訓練等日常工作$599$473 -
Vibe Coding 聖經:4 天寫出 4000 行可執行程式碼,不只是「快」,也重新定義「你的能耐」!$750$592 -
不懂程式也能自架專屬 AI:Vibe Coding 教你從零開始本地部署與雲端整合$790$616 -
AI Agent 智能工作流:設計與自動化全實戰$760$600 -
《生成式AI × 穩健提示爬蟲技術 I》數據抓取篇 爬蟲× OCR × 多模態API應用 × Perplexity AI Comet$790$624 -
Canva 實用點子爆米花:全免費版實作,不用 AI 也能做出專業質感$599$473 -
帶你用 Python 看懂數據:行銷與電商決策的 16 堂關鍵實戰指南$780$608 -
NotebookLM 數位生產力:從資料整合到高效產出的知識工作術,打造你的 AI 思考特助$620$483 -
快速精通 iOS 26 程式設計:從零開始活用 Swift 與 SwiftUI 開發技巧$850$663 -
養成你的 AI 龍蝦管家!OpenClaw × NemoClaw × Google Antigravity × Claude Code:打造能查行程、收郵件、遠端控制電腦的 AI 代理人$750$585
商品描述
發布會上的機器人動作越來越細膩,
影片中的自動駕駛可以在複雜環境中流暢穿梭,
但真正的改變,不是硬體升級或炫目的動作展示,
而是當AI打通了感知與行動之間的連結,機器人真正從實驗室走入真實世界!
當機器能看見環境、理解情境,再根據理解做出決策,
它就不再只是執行指令的工具,而是具備行動能力的智慧系統。
本書由Berkeley AI研究室(BAIR)與Google DeepMind專家執筆,
匯集大神Pieter Abbeel實驗室的前瞻技術與來自NVIDIA、Cruise的實戰經驗,
為您拆解這場變革的關鍵技術——
從影像辨識、深度學習,到強化學習與LLM應用,
看懂機器人如何感知、思考與行動。
帶您了解:
.機器人如何透過影像辨識理解周遭環境
.如何透過學習不斷修正動作與決策
.自駕車、人形機器人與工業機器人背後的核心技術
.AI如何讓機器具備跨任務學習與適應能力
從強化學習走到跨體現機器人實戰,本書不僅讓您澈底掌握LLM與VLM在機器人控制與規劃的最新技術,更是理解未來智慧機器的藍圖。
-----------------------------------------------
本書以深度學習的視角切入機器人學,探討人工智慧(AI)如何徹底改變機器人研究與應用的面貌。引導讀者將過去數十年累積的經典機器人問題,轉化為以AI為核心的技術,並在大型基礎模型的時代,運用現代技術方法解決實務問題。
[本書架構]
■ 關鍵技術解說:AI重塑機器人學的核心問題
.從感知與感測出發,解釋卷積神經網路與視覺轉換器在影像分割、分類、偵測任務中的應用。
.探討大型語言模型(LLM)與多模態模型在機器人推理與控制上的調適方法。
.將模擬、定位、勘測與導航視為深度學習問題,並統整最新技術發展成果。
.涵蓋強化學習與控制,闡述機器人以反覆試誤與自我對弈的未知環境自主訓練能力。
■ 實務應用案例:真實世界的AI機器人應用
.深入分析自駕車、工業型機器人與人形機器人的AI體現應用。
.解說系統設計與演算法選擇的取捨,理解性能與可靠性之間的平衡。
.探討數據驅動的營運模式、基礎設施與安全性議題,以及描繪AI機器人的未來展望。
作者簡介
Alishba Imran 是一位專注於機器人操作與感知學習的機器學習開發者。她目前於柏克萊人工智慧研究室(BAIR Lab)與知名學者Pieter Abbeel合作,深耕強化學習與非監督式學習領域。她擁有極為豐富的業界實戰經驗,曾於Cruise等頂尖企業開發先進的感知系統、在NVIDIA投入基於模擬的機器人操作研究,更曾主導一項大幅降低義肢成本的指標性計畫。此外,在打造知名人形機器人Sophia的Hanson Robotics公司中,她也共同領導了神經符號AI(Neuro-symbolic AI)的前瞻研究,並致力於開發低成本的人形硬體系統。
Keerthana Gopalakrishnan現任Google DeepMind資深研究科學家,負責機器人操作與Gemini專案的前沿研究。她擁有卡內基美隆大學(CMU)與印度理工學院(IIT)的頂尖學歷背景。其研究核心聚焦於最新AI技術在實體機器人上的應用,包含:應用於機器人規劃的大型語言模型(LLM)、用於低階控制的視覺語言模型(VLM)擴展,以及跨體現(Cross-embodiment)機器人學習技術。
目錄大綱
第一章:通用機器人導論
機器人系統
常見機器人類型
機器人設計常見概念
機器人深度學習
深度學習框架
機器人學習框架與目標
邁向體現通用智慧
總結
參考文獻
第二章:機器人感知:感測器與影像處理
感測器
感知問題
卷積神經網路概論
感知CNN
ResNet
EfficientNet
單階段偵測器
模型比較
感知的 Transformer
總結
參考文獻
第三章:機器人感知:3D 數據與感測器融合
3D 數據處理
多模態感知與感測器融合
總結
參考文獻
第四章:機器人基礎模型
大型基礎模型
語言作為機器人的連結組織
端到端機器人控制
從影片示範學習
機器人 AI 安全
總結
參考文獻
第五章:模擬
機器人模擬
機器人模擬器組成
Sim2Real 概念
縮小 RL 到 Sim2Real 的差距
從模擬中學習
總結
參考文獻
第六章:勘測、定位與導航
為何使用深度學習?
傳統移動機器人設置
勘測
定位
導航
總結
參考文獻
第七章:強化學習與控制
強化學習基礎
無模型與基於模型的 RL
離線強化學習
應用與挑戰
機器人的 RL 挑戰
機器人的 RL 湧現趨勢
結論
總結
參考文獻
第八章:自駕車
經濟機遇
系統設計
感知
預測
規劃
安全
總結
參考文獻
第九章:工業機器人
常見任務
常見機器人
市場機遇
取放機器人系統設計
安全考量
總結
參考文獻
第十章:人形機器人
人形機器人案例
替代方法
人形機器人市場
人形機器人建構
結論
總結
參考文獻
第十一章:數據驅動機器人實務
機器人營運
數據基礎設施
訓練與部署基礎設施
機器人數據飛輪
大規模機器人數據收集
未來解方
參考文獻








