GraphRAG實踐:使用知識圖譜提升LLM和RAG應用性能

[美] 托馬茲·布拉塔尼奇(Toma? Bratanic)奧斯卡·哈內(Oskar Hane)著 茹炳晟 殷海英 譯

  • GraphRAG實踐:使用知識圖譜提升LLM和RAG應用性能-preview-1
  • GraphRAG實踐:使用知識圖譜提升LLM和RAG應用性能-preview-2
  • GraphRAG實踐:使用知識圖譜提升LLM和RAG應用性能-preview-3
GraphRAG實踐:使用知識圖譜提升LLM和RAG應用性能-preview-1

相關主題

商品描述

"檢索增強生成 (Retrieval Augmented Generation,RAG) 系統能夠自動選擇領域特定的上下文供大語言模型(Large Language Model,LLM)使用,這大幅提升了LLM生成準確且內容真實的響應的能力。GraphRAG模式采用知識圖譜構建RAG的輸入,巧妙利用數據中的現有關系,生成內容豐富且相關性高的提示詞。 《GraphRAG實踐:使用知識圖譜提升LLM和RAG應用性能》一書詳細介紹了如何構建和部署生產級別的GraphRAG系統,如何從文本中提取結構化知識,以及如何融合基於向量與圖的檢索方法。另外,還涵蓋了構建向量相似性搜索檢索工具、開發Agentic RAG應用及評估性能與準確性等諸多內容的實踐案例。 核心內容: ?嵌入技術、向量相似性搜索與混合搜索 ?將自然語言轉換為Cypher數據庫查詢語句 ?微軟的GraphRAG管道 ?Agentic RAG "

作者簡介

"托馬茲???布拉塔尼奇(Toma? Bratani?)是Manning出版社Graph Algorithms for Data Science(中文譯本《數據科學的圖算法》)一書的作者,也是LangChain和LlamaIndex的貢獻者,他在圖技術、機器學習和生成式AI領域擁有豐富的經驗。奧斯卡???哈內(Oskar Hane)擔任Neo4j生成式AI工程團隊負責人。"

目錄大綱

目    錄

 

第1章  提升LLM的準確性   1

1.1  大語言模型(LLM)介紹   2

1.2  LLM的局限性   6

1.2.1  知識時限問題   6

1.2.2  信息過時   7

1.2.3  純粹幻覺   8

1.2.4  缺乏私有信息   9

1.3  克服LLM的局限性   10

1.3.1  監督微調   10

1.3.2  檢索增強生成(RAG)   12

1.4  知識圖譜:RAG應用的數據存儲方案   16

1.5  本章小結   17

第2章  向量相似性搜索與混合搜索   19

2.1  RAG架構的組件   20

2.1.1  檢索器   20

2.1.2  生成器   22

2.2  使用向量相似性搜索的RAG   23

2.2.1  RAG應用的數據準備階段   24

2.2.2  文本語料庫   24

2.2.3  文本分塊函數   24

2.2.4  嵌入模型   26

2.2.5  具備向量相似性搜索函數的數據庫   27

2.2.6  執行向量搜索   28

2.2.7  使用LLM生成答案   30

2.3  為RAG應用添加全文搜索以啟用混合搜索   31

2.3.1  全文搜索索引   31

2.3.2  執行混合搜索   32

2.4  總結性思考   34

2.5  本章小結   34

第3章  高級向量檢索策略   37

3.1  “後退提示”提示詞   42

3.2  父文檔檢索器   44

3.3  完整的RAG管道   51

3.4  本章小結   53

第4章  從自然語言問題生成Cypher查詢   55

4.1  查詢語言生成的基礎知識   56

4.2  查詢語言生成在RAG管道中的定位   57

4.3  查詢語言生成的實用實踐   58

4.3.1  使用少樣本示例進行上下文學習   58

4.3.2  在提示詞中使用數據庫模式向LLM展示知識圖譜的結構   59

4.3.3  添加術語映射,將用戶問題語義映射到模式   62

4.3.4  格式指令   63

4.4  使用基礎模型實現text2cypher生成器   63

4.5  專門用於text2cypher的(微調)LLM   67

4.6  我們的學習收獲與text2cypher的作用   67

4.7  本章小結   68

第5章  Agentic RAG   69

5.1  什麼是Agentic RAG   70

5.1.1  檢索器智能體   71

5.1.2  檢索器路由器   71

5.1.3  答案評估器   72

5.2  為什麼需要Agentic RAG   72

5.3  如何實現Agentic RAG   73

5.3.1  實現檢索器工具   73

5.3.2  實現檢索器路由器   77

5.3.3  實現答案評估器   82

5.3.4  整合所有組件   84

5.4  本章小結   85

第6章  使用大語言模型構建知識圖譜   87

6.1  從文本中提取結構化數據   88

6.1.1  結構化輸出模型定義   91

6.1.2  結構化輸出提取請求   97

6.1.3  CUAD數據集   98

6.2  構建圖譜   100

6.2.1  數據導入   102

6.2.2  實體解析   104

6.2.3  向圖譜添加非結構化數據   106

6.3  本章小結   107

第7章  微軟的GraphRAG實現   109

7.1  數據集選擇   110

7.2  圖索引   111

7.2.1  分塊   112

7.2.2  實體與關系提取   114

7.2.3  實體和關系總結   120

7.2.4  社區檢測與總結   126

7.3  圖檢索器   132

7.3.1  全局搜索   132

7.3.2  局部搜索   143

7.4  本章小結   152

第8章  RAG應用評估   153

8.1  設計基準數據集   155

8.2  評估   160

8.2.1  上下文召回率   160

8.2.2  忠實度   161

8.2.3  答案正確性   162

8.2.4  加載數據集   163

8.2.5  進行評估   163

8.2.6  觀察結果   165

8.3  下一步計劃   167

8.4  本章小結   167

附錄A  Neo4j環境   169

參考文獻   201