商品描述
本書以開發AI Agent(簡稱Agent,中文譯為智能體)為核心,系統梳理了智能體的理論基礎、技術架構、運行機制與工程實現路徑,圍繞大模型驅動下的Agent系統演化展開。
全書共12章,內容涵蓋Agent的基礎知識,深入剖析智能體在任務解析、狀態管理、工具調用和輸出生成等環節的核心技術原理。通過多組件協同的視角,詳解消息流、件系統與知識流三大支柱對Agent提升的作用,為理解和構建高適應性、可控性強的智能體系統奠定了紮實基礎。本書強調場景驅動的業務知識準備,詳細介紹了Agent輸入解析、意圖識別、工作流設計、件調度與異常處理等關鍵流程,並結合主流智能體平臺的產品形態、服務對象及生態演進趨勢,剖析了平臺化、組件化、模型中立性和多Agent協同的新發展。貫穿全書的多行業落地案例,涵蓋了多種應用場景,系統展示了智能體在實際業務中的創新路徑與變革值。
全書結構緊湊,內容兼顧理論與工程實用性,隨書贈送案例源代碼、授課用PPT等海量學習資源,適合人工智能、數據工程、企業IT、產品管理等領域的技術人員與研究者系統學習。
目錄大綱
前 言
第 1 章 重新認識AI Agent 的值與趨勢
1.1 什麼是AI Agent:概念、結構與功能
1.1.1 AI Agent 的定義與基本構成
1.1.2 智能體與傳統自動化腳本的區別
1.1.3 多組件協同:消息流、件系統與知識流
1.2 從大模型到Agent:為何Agent 更實用
1.2.1 大模型的通用性與邊界
1.2.2 Agent 如何彌補大模型的不足
1.2.3 場景導向與可控輸出
1.3 AI Agent 如何賦能個人與組織
1.3.1 創作者的生產力工具
1.3.2 企業內流程化
1.3.3 不同行業落地場景剖析
1.4 主流智能體平臺的角色與影響
1.4.1 平臺興起的背景
1.4.2 產品形態與服務對象差異
1.4.3 平臺生態的未來趨勢
1.5 本章小結
第 2 章 構建AI Agent 的基礎認知
2.1 Agent 運行機制與核心原理
2.1.1 輸入解析與意圖識別
2.1.2 工作流執行邏輯
2.1.3 輸出生成的策略結構
2.2 場景驅動的業務知識準備
2.2.1 為什麼Agent 開發離不開業務理解
2.2.2 實用的業務流程工具與知識整理方法
2.2.3 案例講解:如何從需求出發構建Agent
2.3 編程技能:從可選到要的梯度
2.3.1 零代碼開發:普通人也能入門
2.3.2 編程賦能:進者的提效通道
2.3.3 編寫提示詞與API 調用的輕代碼實踐
2.4 主要平臺對開發效能的提升路徑
2.4.1 文心智能體平臺:增強理解與決策
2.4.2 Coze 平臺:構建多任務型智能助手的利器
2.4.3 多平臺協同與切換策略
2.5 本章小結
第 3 章 主流Agent 開發平臺與工具生態
3.1 平臺演進路徑與邊界
3.1.1 第一代對話型平臺
3.1.2 第二代多模態平臺
3.1.3 第三代Agent 開發體系的集成化趨勢
3.2 國內主要平臺
3.2.1 文心智能體平臺
3.2.2 智譜清言
3.2.3 Kimi+ 智能體平臺
3.2.4 通義千問
3.2.5 入門者如何選擇合適的平臺
3.3 國內進級智能體平臺
3.3.1 扣子
3.3.2 騰訊元器
3.4 本章小結
第 4 章 從0 開始設計一個AI Agent
4.1 通用開發流程全解析
4.1.1 認知閉環式Agent 開發架構
4.1.2 場景梳理與需求規劃
4.1.3 設計任務流程與角色分工
4.2 成功Agent 背後的設計原則
4.2.1 理解業務比理解技術更重要
4.2.2 善用工具,擴展智能體
4.2.3 以用戶反饋化智能體體驗
4.3 DeepSeek 與扣子在開發流程中的策略協同
4.3.1 多Agent 協作調用示意
4.3.2 在同一任務中混用平臺的邊界
4.3.3 雙平臺配合實現覆雜流程設計
4.4 本章小結
第 5 章 件與工作流:Agent 的“作系統”
5.1 件的使用與定制開發
5.1.1 件機制與平臺擴展模型
5.1.2 Coze 件商店應用配置
5.1.3 件權限、參數、API 的實際應用
5.2 工作流搭建與自動化任務管理
5.2.1 工作流基本組成與邏輯模型
5.2.2 節點配置詳解與執行策略
5.2.3 構建一個多節點工作流的實流程
5.3 本章小結
第 6 章 對話流與多模態集成
6.1 對話流基礎與工具應用
6.1.1 對話流組件與輸入輸出結構
6.1.2 對話流常用工具詳解
6.1.3 對話類件的應用與參數配置
6.2 多模態下的Coze 與外引擎協同增強方案
6.2.1 多模態理解的任務邊界
6.2.2 文本+ 圖像混合輸入的分層處理邏輯
6.2.3 外語音與視覺識別的工作流接入方案
6.3 本章小結
第 7 章 構建Agent 的知識支撐體系
7.1 AI Agent 知識庫詳解
7.1.1 知識庫的定義與結構
7.1.2 如何構建與維護知識庫
7.1.3 Coze 平臺上傳、綁定知識庫的完整流程
7.2 數據庫在Agent 中的作用與設計
7.2.1 數據庫與Agent 的數據流邏輯
7.2.2 數據庫應用場景與管理技巧
7.2.3 使用件調用外數據庫內容
7.3 讓Agent 更“懂內容”的智能提取機制
7.3.1 RAG 機制淺析
7.3.2 多知識來源內容融合策略
7.4 本章小結
第 8 章 開發文檔分析類Agent
8.1 業分析類Agent 的應用值
8.1.1 文件處理需求的多樣性
8.1.2 Agent 在信息提煉、格式解析中的作用
8.1.3 企業級合同、標書、政策類文檔的典型任務
8.2 實踐:AI 投標助手Agent 的開發過程
8.2.1 需求拆解與流程設計
8.2.2 AI 投標助手工作流設計
8.2.3 創建AI 投標助手Agent 與流程演示
8.3 DeepSeek 與Dify 在理解覆雜文檔中的協作作用
8.3.1 多輪問答下的信息追蹤
8.3.2 支持PDF、Word 等格式的解析
8.3.3 深度處理邏輯圖與嵌套段落的勢
8.4 本章小結
第 9 章 打造人格化與角色扮演類Agent
9.1 個性化Agent 的設計原則與需求剖析
9.1.1 “人設”與“行為邊界”的定義
9.1.2 如何用Prompt 控制個性與語氣
9.1.3 多人格並存系統的基礎設計
9.2 實踐:英語口語陪練類Agent 開發全流程
9.2.1 語境設計與語言風格設定
9.2.2 提問方式與反饋語定制
9.2.3 語音設定與聲音匹配
9.2.4 功能測試與疊代化
9.3 進案例:模擬面試官設計要點
9.3.1 多角色切換與情境引導
9.3.2 標準化輸出與評分機制
9.3.3 面試評分結果結構化導出
9.4 DeepSeek 在人設強化與對話穩定性中的作用
9.4.1 長對話的上下文持機制
9.4.2 個性記憶與多輪意圖識別
9.4.3 用內容提升連續表現力
9.5 本章小結
第 10 章 構建知識問答型智能助手
10.1 高質量知識問答的技術核心
10.1.1 問答模式類別:FAQ、多輪問答、RAG 推理
10.1.2 高頻問題與低頻提問的處理策略
10.1.3 控制回答風格與結構的方法
10.2 基礎實踐:公司知識官Agent 構建流程
10.2.1 公司資料整理與結構化輸入
10.2.2 知識塊上傳與測試流程
10.3 綜合實踐:企業級通用問答助手設計
10.3.1 組織內知識結構梳理方法
10.3.2 跨門內容權限管理策略
10.3.3 接入外文檔源提升問答覆蓋度
10.4 各平臺在性與多輪推理中的增強
10.4.1 Coze 對上下文推理的處理模式
10.4.2 DeepSeek 在覆雜問題識別與多輪任務分解方面的勢
10.4.3 混合構建方式的實際對比與選型建議
10.5 本章小結
第 11 章 內容創作與自媒體Agent 開發
11.1 多模態內容創作的Agent 值
11.1.1 圖文、視頻、語音等場景融合
11.1.2 自媒體創作者常見的內容瓶頸
11.1.3 Agent 驅動的自動創作與格式統一
11.2 案例實踐一:每日AI 簡報生成器
11.2.1 數據源選擇與信息抽取方式
11.2.2 圖文混排模板配置
11.2.3 自動摘要與排版輸出實現
11.3 案例實踐二:音頻轉圖文Agent
11.3.1 語音識別與時間戳處理方法
11.3.2 語氣轉換與文本化策略
11.4 DeepSeek 與Dify 平臺對創作效率與內容質量的提升路徑
11.4.1 內容生成速度與語言風格調
11.4.2 圖文聯動、多模態內容一性控制
11.4.3 平臺在創作任務中的智能協作比較
11.5 本章小結
第12 章 構建高效辦公類智能助手
12.1 企業辦公流程智能化的關鍵點
12.1.1 日常任務的場景劃分
12.1.2 高頻重覆任務的識別與分解
12.1.3 Agent 替代人工的落地方向
12.2 案例實踐一:文本校對與潤色助手
12.2.1 語言風格判斷標準設置
12.2.2 不同語體的校對策略
12.2.3 高級功能:風格轉換、改寫
12.3 案例實踐二:多角色會議紀要生成器
12.3.1 文本輸入與音頻角色定制
12.3.2 摘要、要點、行動項結構組織
12.3.3 自動化生成多種格式
12.4 如何用扣子實現辦公Agent
12.4.1 數據理解與結構化任務
12.4.2 扣子在流程搭建與界面輸出上的勢
12.4.3 混合署實現企業辦公AI 助手體系
12.5 本章小結
