從零開始構建企業級RAG系統

李多多

  • 出版商: 機械工業
  • 出版日期: 2025-05-01
  • 售價: $534
  • 語言: 簡體中文
  • ISBN: 711177342X
  • ISBN-13: 9787111773429
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

這是一本面向企業級AI應用開發者和決策者的RAG技術實戰指南,全面覆蓋了從基礎理論到高級優化的各個環節。本書採用循序漸進的講解方式,配以豐富的圖表和代碼示例,為讀者提供了一條完整的學習路徑,幫助讀者快速掌握RAG技術的精髓。

本書共10章,分為四部分。

第一部分(第1章和第2章) RAG技術基礎

介紹了RAG技術的定義、發展背景、核心組成以及落地面臨的挑戰,同時深入探討了RAG技術背後的原理,包括嵌入技術、數據索引與檢索,以及大語言模型的應用。

第二部分(第3~5章) RAG應用構建流程

詳細講解了RAG應用的各個環節,從數據準備與處理,到檢索環節的優化,再到生成環節的技巧。

第三部分(第6~8章) RAG技術進階

主要介紹了RAG系統的高級優化策略、常見框架實現原理與性能評估方法。針對高級優化策略,介紹了索引構建、預檢索、檢索、生成預處理和生成五個環節;針對常見框架,介紹了自省式RAG、自適應RAG、基於樹結構索引的RAG、糾錯性RAG等;針對評估方法,從評估指標和評估框架兩個方面介紹了檢索環節和生成環節的各種衡量指標的特點。

第四部分(第9章和第10章)  RAG應用實例

首先通過具體的企業級應用案例和行業特定解決方案,展示了RAG技術在文檔生成、知識庫檢索、客戶服務等領域的實際應用,以及在金融、醫療、法律等特定行業的落地實踐。然後展望了RAG技術的未來發展趨勢,如長上下文對RAG的影響、多模態RAG的應用,以及嵌入模型與大模型語義空間融合等前沿話題,最後對RAG落地挑戰進行了總結。

目錄大綱

前言

第一部分 RAG技術基礎

第1章 RAG 技術簡介 2

1.1 為什麽需要 RAG 2

1.2 RAG技術的發展背景  4

1.2.1 早期階段:信息檢索與問答系統 4

1.2.2 過渡階段:自然語言處理與機器學習 5

1.2.3 發展階段:RAG技術的興起與優化 6

1.3 RAG技術的核心組成 8

1.3.1 檢索模塊 8

1.3.2 生成模塊 8

1.3.3 數據增強 9

1.4 與大語言模型集成 9

1.4.1 RAG與LLM的結合 9

1.4.2 LangChain和LlamaIndex 10

1.5 RAG面臨的挑戰 11

1.6 總結 12

第2章 RAG技術背後的原理 13

2.1 Embedding技術 13

2.1.1 為什麽RAG要用 

Embedding 13

2.1.2 Embedding 的工作原理 14

2.1.3 Embedding的發展歷程 15

2.1.4 Embedding 的代碼示例 16

2.2 數據索引與檢索 18

2.2.1 數據索引的基本概念 19

2.2.2 數據檢索的基本原理 23

2.2.3 數據索引與檢索的技術

實現 24

2.2.4 數據索引與檢索的應用

場景 25

2.3 大語言模型 26

2.3.1 大語言模型的特點 26

2.3.2 大語言模型的技術原理 26

2.3.3 大語言模型在RAG中的

應用 29

2.4 總結 30

第二部分 RAG應用構建流程

第3章 數據準備與處理 34

3.1 數據清洗 34

3.1.1 數據收集 34

3.1.2 文本處理 37

3.1.3 文本分詞  39

3.2 文本分割 41

3.2.1 固定大小分塊 42

3.2.2 遞歸分塊 44

3.2.3 基於文檔邏輯的分塊 45

3.2.4 語義分塊 47

3.3 索引構建 48

3.3.1 列表索引 49

3.3.2 關鍵詞表索引  51

3.3.3 向量索引 53

3.3.4 樹索引 55

3.3.5 文檔摘要索引 58

3.4 總結 60

第4章 檢索環節 62

4.1 索引構建與優化 62

4.1.1 索引構建回顧  62

4.1.2 索引更新策略 63

4.1.3 索引壓縮技術 71

4.1.4 多模態索引構建 72

4.2 檢索策略與算法 73

4.2.1 精確匹配檢索 74

4.2.2 相似度檢索 76

4.2.3 語義檢索 77

4.2.4 混合檢索 79

4.2.5 檢索結果排序與過濾 80

4.3 查詢轉化 84

4.3.1 查詢預處理 85

4.3.2 查詢擴展 85

4.3.3 查詢理解與意圖識別 96

4.4 總結 99

第5章 生成環節 100

5.1 LLM重排序 100

5.1.1 重排序的概念 101

5.1.2 LLM重排序的基本原理 102

5.2 提示工程 104

5.2.1 零樣本提示 105

5.2.2 少樣本提示 105

5.2.3 思維鏈提示 106

5.2.4 React 108

5.3 LLM歸納生成 109

5.3.1 數據合成 110

5.3.2 文章摘要生成 111

5.3.3 人物場景創作 112

5.3.4 對話生成 112

5.3.5 JSON結構化輸出 113

5.4 總結 115

第三部分 RAG技術進階

第6章 高級RAG優化技術 118

6.1 索引構建優化 118

6.1.1 長文檔優化 119

6.1.2 大規模文檔系統的優化 125

6.2 預檢索優化 129

6.2.1 查詢轉換 129

6.2.2 查詢擴展 131

6.2.3 結構化查詢 132

6.2.4 查詢路由 136

6.2.5 查詢緩存 139

6.3 檢索階段優化 140

6.3.1 知識圖譜的混合檢索 140

6.3.2 關鍵詞檢索與向量檢索

結合 145

6.3.3 微調嵌入模型 147

6.4 生成預處理 150

6.4.1 重排序 150

6.4.2  壓縮與選擇 152

6.5 生成階段優化 153

6.5.1 提示工程 154

6.5.2 歸因生成 155

6.5.3 事實驗證 156

6.5.4 生成模型微調 157

6.6 總結 159

第7章 常見RAG框架的實現

原理 161

7.1 自省式RAG 161

7.1.1 實現原理 162

7.1.2 構建自省式RAG應用 164

7.2 自適應RAG 167

7.2.1 實現原理 168

7.2.2 構建自適應RAG應用 168

7.3 基於樹結構索引的RAG 171

7.3.1 實現原理 171

7.3.2 樹結構的特點 172

7.3.3 構建RAPTOR-RAG應用 174

7.4 糾錯性RAG 176

7.4.1 實現原理 177

7.4.2 構建糾錯性RAG應用 178

7.5 RAG融合 182

7.5.1 實現原理 182

7.5.2 構建RAG融合系統 185

7.6 基於知識圖譜的RAG 187

7.6.1 實現原理 188

7.6.2 構建基於知識圖譜的RAG

應用 189

7.7 其他 192

7.7.1 RankRAG 192

7.7.2 RichRAG 193

7.7.3 RAG 2.0 194

7.8 總結 194

第8章 RAG系統性能評估 195

8.1 RAG評估指標 195

8.1.1 檢索環節評估 195

8.1.2 生成環節評估 198

8.2 常見的RAG評估框架 205

8.2.1 TruLens框架 205

8.2.2 RAGAs框架 210

8.2.3 ARES框架 213

8.2.4 其他 215

8.3 總結 222

第四部分 RAG應用實例

第9章 企業級RAG應用實踐 224

9.1 通用應用 224

9.1.1 智能文檔問答 224

9.1.2 企業知識庫智能搜索 226

9.1.3 智能客服系統 228

9.2 行業應用 230

9.2.1 RAG在金融行業的應用 230

9.2.2 RAG在醫療行業的應用 232

9.2.3 RAG在法律行業的應用 233

9.2.4 RAG在教育行業的應用 235

9.3 構建企業級RAG系統 236

9.3.1 用戶認證 236

9.3.2 輸入防護 237

9.3.3 RAG組件 238

9.3.4 輸出防護 239

9.3.5 反饋收集 239

9.3.6 數據存儲 240

9.3.7 可觀測性 240

9.4 總結 241

第10章 RAG技術展望 242

10.1 RAG 技術演進 242

10.1.1 大模型主動參與知識

選取 242

10.1.2 嵌入模型與大模型語義

空間融合 243

10.1.3 RAG流程動態編排 243

10.2 多模態RAG 244

10.2.1 三種檢索策略 244

10.2.2 兩種響應方式 244

10.3 RAG落地挑戰 245