Agentic AI智能體應用開發(第2版)

[英] 本·奧法斯(Ben Auffarth)列昂尼德·庫利金(Leonid Kuligin) 著 郭濤 譯

  • Agentic AI智能體應用開發(第2版)-preview-1
  • Agentic AI智能體應用開發(第2版)-preview-2
  • Agentic AI智能體應用開發(第2版)-preview-3
Agentic AI智能體應用開發(第2版)-preview-1

商品描述

"《Agentic AI智能體應用開發》(第2版)深入探討了用於構建Agentic系統的各種設計模式,並結合復雜任務場景給出多智能體架構的實現方案;系統講解了CoT、結構化生成、智能體交接等多種推理技術,並附有完整的異常處理示例。 書中有關測試、評估與部署的擴展章節滿足了現代LLM應用的需求,闡述了如何遵循負責任的開發原則,構建具備內置安全防護機制的高安全性且合規的AI系統。此外,本版在RAG技術方面也做了內容拓展,詳解了混合檢索、重排序、事實核查流程,助力提升模型輸出的準確性。 無論你是想要優化現有工作流,還是從零構建多智能體系統,本書都能為你提供兼具技術深度與實操性的指導,助你成功開發適用於實際生產的LLM應用。 核心亮點 ? 基於LangGraph設計並實現多智能體系統 ? 實施測試策略,在部署前識別潛在問題 ? 為生產環境部署可觀測性與監控體系 ? 構建具備重排序能力的Agentic RAG系統 ? 利用LangGraph和MCP構建可擴展的生產級AI智能體 ? 對接如Google Gemini、Anthropic、Mistral、DeepSeek和OpenAI的o3-mini等主流大模型及相關服務商,適配**LLM技術 ? 設計安全、合規並符合現代倫理規範的AI系統"

作者簡介

"Ben Auffarth博士擁有15年以上AI落地實施經驗,是Chelsea AI Ventures公司的創始人,專註於幫助中小型企業部署企業級AI解決方案,助力實現高投資回報率。Ben兼具深厚的計算神經科學背景,能夠將該領域的理論與AI實際應用深度融合;研發成果覆蓋多個方向,包括超級計算大腦模型,以及融合了前沿技術與商業戰略的生產級AI系統。Leonid Kuligin?是谷歌雲AI工程師,專註生成式AI與經典機器學習解決方案研發,深耕需求預測、優化問題等領域;Leonid是LangChain谷歌雲集成的核心維護者,也是慕尼黑工業大學與慕尼黑大學聯合機構CDTM的客座講師。加入谷歌前,已在科技、金融、零售行業積累20余年從業經驗,主攻基於復雜機器學習與數據處理的B2C、B2B應用開發。"

目錄大綱

目    錄

第1章  生成式AI的崛起:從語言模型到智能體  1

1.1  現代LLM的發展現狀  2

1.1.1  模型對比  3

1.1.2  LLM提供商生態  4

1.1.3  許可授權  5

1.2  從模型到Agentic應用  6

1.2.1  傳統LLM的局限性  6

1.2.2  理解LLM應用  7

1.2.3  理解AI智能體  8

1.3  LangChain框架介紹  10

1.3.1  原始LLM所面臨的挑戰  11

1.3.2  LangChain如何支持智能體開發  12

1.3.3  探索LangChain架構  12

1.4  本章小結  17

1.5  思考題  17

第2章  LangChain的初步實踐  19

2.1  設置依賴環境  19

2.2  探索LangChain構建塊  24

2.2.1  模型接口  24

2.2.2  提示與模板  30

2.2.3  LCEL  31

2.3  運行本地模型  36

2.3.1  Ollama入門  37

2.3.2  在本地使用Hugging Face模型  37

2.3.3  本地模型使用提示  38

2.4  多模態AI應用  40

2.4.1  文本到圖像  41

2.4.2  圖像理解  43

2.5  本章小結  47

2.6  思考題  47

第3章  使用LangGraph構建工作流  49

3.1  LangGraph基礎  49

3.1.1  狀態管理  50

3.1.2  reducer  53

3.1.3  使圖可配置  54

3.1.4  受控輸出生成  55

3.2  提示工程  61

3.2.1  提示模板  62

3.2.2  零樣本提示與少樣本提示  63

3.2.3  CoT  65

3.2.4  自洽性  67

3.3  處理較短的上下文窗口  67

3.4  理解記憶機制  70

3.4.1  裁剪聊天歷史  70

3.4.2  將歷史記錄保存至數據庫  71

3.4.3  LangGraph檢查點  73

3.5  本章小結  75

3.6  思考題  75

第4章  構建智能RAG系統  77

4.1  從索引到智能檢索  77

4.2  RAG系統的組件  79

4.3  從嵌入到搜索  81

4.3.1  嵌入  82

4.3.2  向量存儲  83

4.3.3  向量索引策略  87

4.4  分解RAG管道  92

4.4.1  文檔處理  93

4.4.2  高級RAG技術  101

4.5  開發企業文檔聊天機器人  116

4.5.1  文檔加載  117

4.5.2  語言模型設置  119

4.5.3  文檔檢索  119

4.5.4  設計狀態圖  121

4.5.5  使用Streamlit集成構建用戶界面  125

4.5.6  評估與性能考量  127

4.6  RAG系統故障排除  128

4.7  本章小結  129

4.8  思考題  129

第5章  構建智能智能體  131

5.1  什麼是工具  132

5.1.1  LangChain中的工具  134

5.1.2  ReACT  136

5.2  定義工具  139

5.2.1  內置的LangChain工具  139

5.2.2  自定義工具  145

5.2.3  錯誤處理  150

5.3  高級工具調用功能  152

5.4  將工具整合到工作流中  153

5.4.1  受控生成  153

5.4.2  ToolNode  155

5.4.3  工具調用範式  156

5.5  什麼是智能體  157

5.6  本章小結  161

5.7  思考題  162

第6章  高級應用與多智能體系統  163

6.1  Agentic架構  163

6.2  多智能體架構  166

6.2.1  智能體角色與專業化  166

6.2.2  共識機制  167

6.2.3  通信協議  169

6.2.4  LangGraph流式傳輸  176

6.2.5  交接  178

6.2.6  LangGraph平臺  180

6.3  構建自適應系統  181

6.3.1  動態行為調整  181

6.3.2  人機回環  182

6.4  探索推理路徑  183

6.4.1  思維樹  183

6.4.2  利用MCTS裁剪ToT  190

6.5  智能體記憶  191

6.5.1  緩存機制  192

6.5.2  存儲機制  193

6.6  本章小結  194

6.7  思考題  194

第7章  軟件開發與數據分析智能體  195

7.1  LLM在軟件開發中的應用  195

7.1.1  開發的未來  196

7.1.2  實現考量  197

7.1.3  代碼LLM的演化  198

7.1.4  代碼LLM的基準測試  199

7.1.5  基於LLM的軟件工程方法  200

7.1.6  安全性與風險緩解  203

7.1.7  LLM生成代碼的驗證框架  204

7.1.8  LangChain集成  205

7.2  利用LLM編寫代碼  206

7.2.1  谷歌生成式AI  206

7.2.2  Hugging Face  207

7.2.3  Anthropic  210

7.2.4  Agentic方法  211

7.2.5  文檔RAG  212

7.2.6  代碼庫RAG  214

7.3  將LLM智能體應用於數據科學  216

7.3.1  訓練ML模型  217

7.3.2  分析數據集  220

7.4  本章小結  224

7.5  思考題  224

第8章  評估與測試  225

8.1  評估的重要性  225

8.1.1  安全性與對齊  226

8.1.2  性能與效率  227

8.1.3  用戶與利益相關方的實際價值  228

8.1.4  為LLM評估建立共識  229

8.2  評估內容:智能體的核心能力  230

8.2.1  任務性能評估  230

8.2.2  工具使用評估  230

8.2.3  RAG評估  231

8.2.4  規劃與推理評估  232

8.3  評估的方式:方法論與實現路徑  233

8.3.1  自動化評估方法  233

8.3.2  人機回環評估  233

8.3.3  系統級評估  234

8.4  LLM智能體評估實踐  235

8.4.1  評估結果的正確性  235

8.4.2  評估語氣和簡潔性  238

8.4.3  評估輸出格式  240

8.4.4  評估智能體的軌跡  240

8.4.5  評估CoT推理  243

8.5  離線評估  244

8.5.1  評估RAG系統  245

8.5.2  在LangSmith中評估基準測試  246

8.5.3  使用HF數據集與Evaluate進行基準測試評估  249

8.5.4  評估電子郵件信息提取效果  250

8.6  本章小結  252

8.7  思考題  253

第9章  面向生產的LLM部署與可觀測性  255

9.1  LLM的安全性考量  255

9.2  部署LLM應用  257

9.2.1  基於FastAPI的Web框架部署  259

9.2.2  使用Ray Serve實現可擴展部署  261

9.2.3  LangChain應用的部署註意事項  269

9.2.4  LangGraph平臺  273

9.2.5  無服務器部署選項  276

9.2.6  用戶界面框架  276

9.2.7  MCP  277

9.2.8  基礎設施考量  278

9.3  如何構建可觀測性LLM應用  282

9.3.1  LLM應用的運維指標  282

9.3.2  響應跟蹤  283

9.3.3  幻覺檢測  285

9.3.4  偏見檢測與監控  286

9.3.5  可觀測性策略  287

9.3.6  LLM應用的持續改進  288

9.4  LangChain應用的成本管理  288

9.4.1  LangChain中的模型選擇策略  289

9.4.2  輸出詞元優化  291

9.4.3  其他策略  291

9.4.4  監控與成本分析  292

9.5  本章小結  292

9.6  思考題  293

第10章  生成式模型的未來:超越擴展  295

10.1  生成式AI的現狀  295

10.2  擴展的局限性與新興的替代方案  300

10.2.1  對擴展假設的挑戰  300

10.2.2  科技巨頭與小型企業  301

10.2.3  純規模擴展的新型替代方案  302

10.2.4  訓練數據質量的演化  304

10.2.5  技術進步推動普及化  305

10.2.6  後訓練階段的新縮放法則  306

10.3  經濟與產業變革  306

10.3.1  行業轉型與競爭態勢  308

10.3.2  崗位演化與技能影響  308

10.3.3  經濟分配與公平性問題  309

10.4  社會影響  310

10.4.1  虛假信息與網絡安全  310

10.4.2  版權與署名問題  311

10.4.3  監管與落地挑戰  312

10.5  本章小結  313

附錄A  315