AI 機器人｜從感知到行動的下一步 (AI for Robotics: Toward Embodied and General Intelligence in the Physical World)

Name: AI 機器人｜從感知到行動的下一步 (AI for Robotics: Toward Embodied and General Intelligence in the Physical World)
Price: 632 TWD
Availability: InStock
Author: Alishba Imran , Keerthana Gopalakrishnan 著
ISBN: 6264252530

Alishba Imran , Keerthana Gopalakrishnan 著温榮弘譯

預覽內頁

出版商: 碁峰資訊
出版日期: 2026-04-02
定價: $800
售價: 7.9 折 $632
語言: 繁體中文
頁數: 328
ISBN: 6264252530
ISBN-13: 9786264252539
相關分類: 無人機
此書翻譯自: AI for Robotics: Toward Embodied and General Intelligence in the Physical World (Paperback)

立即出貨 (庫存 > 10)

AI 機器人｜從感知到行動的下一步 (AI for Robotics: Toward Embodied and General Intelligence in the Physical World)-preview-1

買這商品的人也買了...

~~$380~~ $323

全民學程式設計：從插畫學 C 語言
~~$708~~ $672

軟件調試第2版捲1：硬件基礎
~~$500~~ $395

第一次學 Android 就上手 -- 從新手入門到專題製作, 3/e (適用Android 10.x~4.x)
~~$920~~ $726

統計分析入門與應用｜SPSS 中文版 + SmartPLS 4 (CB-SEM + PLS-SEM), 5/e
$407

構建 Agentic AI 系統：打造能推理、可規劃、自適應的 AI 智能體
~~$620~~ $489

LLM 提示工程技術｜打造兼具藝術與科學的高效應用 (Prompt Engineering for LLMs: The Art and Science of Building Large Language Model-Based Applications)
~~$620~~ $489

LLMOps 打造穩定運行的大型語言模型系統 (LLMOps: Managing Large Language Models in Production)
~~$550~~ $399

MCP 開發全攻略：打造懂指令、會協作的 AI 系統
~~$650~~ $513

Gemini 3 x NotebookLM 領軍：Nano Banana Pro x Veo x Whisk x Flow x Gem - Google 多模態 AI 工作流
~~$650~~ $507

Graylog 整合應用實戰：打造視覺化與智慧化的新世代資安監控平台
~~$599~~ $473

最強！Google AI 工作術：以 Gemini 3 為核心，串聯 NotebookLM 與滿滿 AI 工具, 搞定資料分析、簡報製作、教育訓練等日常工作
~~$750~~ $592

Vibe Coding 聖經：4 天寫出 4000 行可執行程式碼，不只是「快」，也重新定義「你的能耐」！
~~$790~~ $616

不懂程式也能自架專屬 AI：Vibe Coding 教你從零開始本地部署與雲端整合
~~$790~~ $624

讓 LLM 飛起來的工具使用 - AI Agent MCP 協議開發、標準、應用
~~$760~~ $600

AI Agent 智能工作流：設計與自動化全實戰
~~$1,080~~ $853

Sutskever 大神推薦 - 建構 AI 世界最重要的 30篇論文 : 用 PyTorch 完整實作
~~$790~~ $624

《生成式 AI × 穩健提示爬蟲技術 I》數據抓取篇爬蟲× OCR × 多模態API應用 × Perplexity AI Comet
~~$599~~ $473

Canva 實用點子爆米花：全免費版實作，不用 AI 也能做出專業質感
~~$780~~ $608

帶你用 Python 看懂數據：行銷與電商決策的 16 堂關鍵實戰指南
~~$620~~ $483

NotebookLM 數位生產力：從資料整合到高效產出的知識工作術，打造你的 AI 思考特助
~~$850~~ $663

快速精通 iOS 26 程式設計：從零開始活用 Swift 與 SwiftUI 開發技巧
~~$750~~ $585

養成你的 AI 龍蝦管家！OpenClaw × NemoClaw × Google Antigravity × Claude Code：打造能查行程、收郵件、遠端控制電腦的 AI 代理人
~~$980~~ $774

深入 Linux Kernel 程式設計：kernel 內部原理、模組開發與同步機制, 2/e (Linux Kernel Programming : A comprehensive and practical guide to kernel internals, writing modules, and kernel synchronization, 2/e)
~~$980~~ $774

Binary Hacks Rebooted｜探索底層世界的 89個實戰技法 (Binary Hacks Rebooted —低レイヤの世界を探検するテクニック89選)
~~$600~~ $474

建構代理式人工智慧系統｜打造能推理、規劃和適應的智慧自主 AI 代理 (Building Agentic AI Systems: Create intelligent, autonomous AI agents that can reason, plan, and adapt)

商品描述

發布會上的機器人動作越來越細膩，
影片中的自動駕駛可以在複雜環境中流暢穿梭，

但真正的改變，不是硬體升級或炫目的動作展示，
而是當AI打通了感知與行動之間的連結，機器人真正從實驗室走入真實世界！

當機器能看見環境、理解情境，再根據理解做出決策，
它就不再只是執行指令的工具，而是具備行動能力的智慧系統。

本書由Berkeley AI研究室(BAIR)與Google DeepMind專家執筆，
匯集大神Pieter Abbeel實驗室的前瞻技術與來自NVIDIA、Cruise的實戰經驗，
為您拆解這場變革的關鍵技術——
從影像辨識、深度學習，到強化學習與LLM應用，
看懂機器人如何感知、思考與行動。

帶您了解：
．機器人如何透過影像辨識理解周遭環境
．如何透過學習不斷修正動作與決策
．自駕車、人形機器人與工業機器人背後的核心技術
．AI如何讓機器具備跨任務學習與適應能力

從強化學習走到跨體現機器人實戰，本書不僅讓您澈底掌握LLM與VLM在機器人控制與規劃的最新技術，更是理解未來智慧機器的藍圖。

-----------------------------------------------

本書以深度學習的視角切入機器人學，探討人工智慧（AI）如何徹底改變機器人研究與應用的面貌。引導讀者將過去數十年累積的經典機器人問題，轉化為以AI為核心的技術，並在大型基礎模型的時代，運用現代技術方法解決實務問題。

[本書架構]
■ 關鍵技術解說：AI重塑機器人學的核心問題
．從感知與感測出發，解釋卷積神經網路與視覺轉換器在影像分割、分類、偵測任務中的應用。
．探討大型語言模型（LLM）與多模態模型在機器人推理與控制上的調適方法。
．將模擬、定位、勘測與導航視為深度學習問題，並統整最新技術發展成果。
．涵蓋強化學習與控制，闡述機器人以反覆試誤與自我對弈的未知環境自主訓練能力。

■ 實務應用案例：真實世界的AI機器人應用
．深入分析自駕車、工業型機器人與人形機器人的AI體現應用。
．解說系統設計與演算法選擇的取捨，理解性能與可靠性之間的平衡。
．探討數據驅動的營運模式、基礎設施與安全性議題，以及描繪AI機器人的未來展望。

作者簡介

Alishba Imran 是一位專注於機器人操作與感知學習的機器學習開發者。她目前於柏克萊人工智慧研究室（BAIR Lab）與知名學者Pieter Abbeel合作，深耕強化學習與非監督式學習領域。她擁有極為豐富的業界實戰經驗，曾於Cruise等頂尖企業開發先進的感知系統、在NVIDIA投入基於模擬的機器人操作研究，更曾主導一項大幅降低義肢成本的指標性計畫。此外，在打造知名人形機器人Sophia的Hanson Robotics公司中，她也共同領導了神經符號AI（Neuro-symbolic AI）的前瞻研究，並致力於開發低成本的人形硬體系統。

Keerthana Gopalakrishnan現任Google DeepMind資深研究科學家，負責機器人操作與Gemini專案的前沿研究。她擁有卡內基美隆大學（CMU）與印度理工學院（IIT）的頂尖學歷背景。其研究核心聚焦於最新AI技術在實體機器人上的應用，包含：應用於機器人規劃的大型語言模型（LLM）、用於低階控制的視覺語言模型（VLM）擴展，以及跨體現（Cross-embodiment）機器人學習技術。

目錄大綱

第一章：通用機器人導論
機器人系統
常見機器人類型
機器人設計常見概念
機器人深度學習
深度學習框架
機器人學習框架與目標
邁向體現通用智慧
總結
參考文獻

第二章：機器人感知：感測器與影像處理
感測器
感知問題
卷積神經網路概論
感知CNN
ResNet
EfficientNet
單階段偵測器
模型比較
感知的 Transformer
總結
參考文獻

第三章：機器人感知：3D 數據與感測器融合
3D 數據處理
多模態感知與感測器融合
總結
參考文獻

第四章：機器人基礎模型
大型基礎模型
語言作為機器人的連結組織
端到端機器人控制
從影片示範學習
機器人 AI 安全
總結
參考文獻

第五章：模擬
機器人模擬
機器人模擬器組成
Sim2Real 概念
縮小 RL 到 Sim2Real 的差距
從模擬中學習
總結
參考文獻

第六章：勘測、定位與導航
為何使用深度學習？
傳統移動機器人設置
勘測
定位
導航
總結
參考文獻

第七章：強化學習與控制
強化學習基礎
無模型與基於模型的 RL
離線強化學習
應用與挑戰
機器人的 RL 挑戰
機器人的 RL 湧現趨勢
結論
總結
參考文獻

第八章：自駕車
經濟機遇
系統設計
感知
預測
規劃
安全
總結
參考文獻

第九章：工業機器人
常見任務
常見機器人
市場機遇
取放機器人系統設計
安全考量
總結
參考文獻

第十章：人形機器人
人形機器人案例
替代方法
人形機器人市場
人形機器人建構
結論
總結
參考文獻

第十一章：數據驅動機器人實務
機器人營運
數據基礎設施
訓練與部署基礎設施
機器人數據飛輪
大規模機器人數據收集
未來解方
參考文獻