GraphRAG 實踐:使用知識圖譜提升 LLM 和 RAG 應用性能
[美] 托馬茲·布拉塔尼奇(Toma? Bratanic)奧斯卡·哈內(Oskar Hane)著 茹炳晟 殷海英 譯
- 出版商: 清華大學
- 出版日期: 2026-05-01
- 定價: $359
- 售價: $358
- 語言: 簡體中文
- 頁數: 202
- ISBN: 7302712824
- ISBN-13: 9787302712824
-
相關分類:
Large language model
- 此書翻譯自: Essential Graphrag: Knowledge Graph-Enhanced Rag (Paperback)
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
-
圖解機器學習$359$341 -
Power BI 入門 大數據視覺化 + 智慧決策 + 雲端分享 王者歸來 (全彩印刷)$620$490 -
$1,014MATLAB 金融風險管理師 FRM : 金融科技 Fintech 應用 -
Python 資料分析必備套件!Pandas 資料清理、重塑、過濾、視覺化 (Pandas 1.x Cookbook, 2/e)$780$616 -
真槍實彈做專案:PyQt5 極速開發視窗軟體$880$695 -
$453圖深度學習從理論到實踐 -
$426特徵工程的藝術:通用技巧與實用案例 -
商業分析全攻略:用數據分析解決商業問題 (全彩)$888$843 -
精通區塊鏈開發技術, 2/e$894$849 -
AI 神助攻!程式設計新境界 – GitHub Copilot 開發 Python 如虎添翼 : 提示工程、問題分解、測試案例、除錯$560$442 -
全格局使用 PyTorch - 深度學習和圖神經網路 - 基礎篇, 2/e$880$695 -
$418特徵工程訓練營 -
多 Agent 智慧體 - LangChain 大型 ReAct 系統開發$880$695 -
$658基於大模型的 RAG 應用開發與優化 — 構建企業級 LLM 應用 -
LLM 原理完整回顧 - 大型語言模型整體脈絡最詳細剖析$1,080$853 -
Notion X AI 高效管理 300招:筆記×資料庫×團隊協作×自動化,數位生活與工作最佳幫手, 2/e$560$442 -
讓 AI 好好說話!從頭打造 LLM (大型語言模型) 實戰秘笈$680$537 -
$559大模型知識增強:概念、方法與技術 -
OpenAI API 開發手冊 - 用 Responses API、Realtime API、MCP、Agents SDK、Function calling 打造即時語音、RAG、Agent 應用$790$624 -
$459零基礎 AI 編程:Cursor 助力 Vibe Coding 實踐 -
專案管理:專案經理新思維$680$578 -
$538上頭 Obsidian:手把手教你用 AI 做好知識管理 -
Claude Code Vibe Coding 開發手冊$750$592 -
Cursor 2 Vibe Coding 開發手冊$780$616 -
Sutskever 大神推薦 - 建構 AI 世界最重要的 30篇論文 : 用 PyTorch 完整實作$1,080$853
相關主題
商品描述
"檢索增強生成 (Retrieval Augmented Generation,RAG) 系統能夠自動選擇領域特定的上下文供大語言模型(Large Language Model,LLM)使用,這大幅提升了LLM生成準確且內容真實的響應的能力。GraphRAG模式采用知識圖譜構建RAG的輸入,巧妙利用數據中的現有關系,生成內容豐富且相關性高的提示詞。 《GraphRAG實踐:使用知識圖譜提升LLM和RAG應用性能》一書詳細介紹了如何構建和部署生產級別的GraphRAG系統,如何從文本中提取結構化知識,以及如何融合基於向量與圖的檢索方法。另外,還涵蓋了構建向量相似性搜索檢索工具、開發Agentic RAG應用及評估性能與準確性等諸多內容的實踐案例。 核心內容: ?嵌入技術、向量相似性搜索與混合搜索 ?將自然語言轉換為Cypher數據庫查詢語句 ?微軟的GraphRAG管道 ?Agentic RAG "
作者簡介
"托馬茲???布拉塔尼奇(Toma? Bratani?)是Manning出版社Graph Algorithms for Data Science(中文譯本《數據科學的圖算法》)一書的作者,也是LangChain和LlamaIndex的貢獻者,他在圖技術、機器學習和生成式AI領域擁有豐富的經驗。奧斯卡???哈內(Oskar Hane)擔任Neo4j生成式AI工程團隊負責人。"
目錄大綱
目 錄
第1章 提升LLM的準確性 1
1.1 大語言模型(LLM)介紹 2
1.2 LLM的局限性 6
1.2.1 知識時限問題 6
1.2.2 信息過時 7
1.2.3 純粹幻覺 8
1.2.4 缺乏私有信息 9
1.3 克服LLM的局限性 10
1.3.1 監督微調 10
1.3.2 檢索增強生成(RAG) 12
1.4 知識圖譜:RAG應用的數據存儲方案 16
1.5 本章小結 17
第2章 向量相似性搜索與混合搜索 19
2.1 RAG架構的組件 20
2.1.1 檢索器 20
2.1.2 生成器 22
2.2 使用向量相似性搜索的RAG 23
2.2.1 RAG應用的數據準備階段 24
2.2.2 文本語料庫 24
2.2.3 文本分塊函數 24
2.2.4 嵌入模型 26
2.2.5 具備向量相似性搜索函數的數據庫 27
2.2.6 執行向量搜索 28
2.2.7 使用LLM生成答案 30
2.3 為RAG應用添加全文搜索以啟用混合搜索 31
2.3.1 全文搜索索引 31
2.3.2 執行混合搜索 32
2.4 總結性思考 34
2.5 本章小結 34
第3章 高級向量檢索策略 37
3.1 “後退提示”提示詞 42
3.2 父文檔檢索器 44
3.3 完整的RAG管道 51
3.4 本章小結 53
第4章 從自然語言問題生成Cypher查詢 55
4.1 查詢語言生成的基礎知識 56
4.2 查詢語言生成在RAG管道中的定位 57
4.3 查詢語言生成的實用實踐 58
4.3.1 使用少樣本示例進行上下文學習 58
4.3.2 在提示詞中使用數據庫模式向LLM展示知識圖譜的結構 59
4.3.3 添加術語映射,將用戶問題語義映射到模式 62
4.3.4 格式指令 63
4.4 使用基礎模型實現text2cypher生成器 63
4.5 專門用於text2cypher的(微調)LLM 67
4.6 我們的學習收獲與text2cypher的作用 67
4.7 本章小結 68
第5章 Agentic RAG 69
5.1 什麼是Agentic RAG 70
5.1.1 檢索器智能體 71
5.1.2 檢索器路由器 71
5.1.3 答案評估器 72
5.2 為什麼需要Agentic RAG 72
5.3 如何實現Agentic RAG 73
5.3.1 實現檢索器工具 73
5.3.2 實現檢索器路由器 77
5.3.3 實現答案評估器 82
5.3.4 整合所有組件 84
5.4 本章小結 85
第6章 使用大語言模型構建知識圖譜 87
6.1 從文本中提取結構化數據 88
6.1.1 結構化輸出模型定義 91
6.1.2 結構化輸出提取請求 97
6.1.3 CUAD數據集 98
6.2 構建圖譜 100
6.2.1 數據導入 102
6.2.2 實體解析 104
6.2.3 向圖譜添加非結構化數據 106
6.3 本章小結 107
第7章 微軟的GraphRAG實現 109
7.1 數據集選擇 110
7.2 圖索引 111
7.2.1 分塊 112
7.2.2 實體與關系提取 114
7.2.3 實體和關系總結 120
7.2.4 社區檢測與總結 126
7.3 圖檢索器 132
7.3.1 全局搜索 132
7.3.2 局部搜索 143
7.4 本章小結 152
第8章 RAG應用評估 153
8.1 設計基準數據集 155
8.2 評估 160
8.2.1 上下文召回率 160
8.2.2 忠實度 161
8.2.3 答案正確性 162
8.2.4 加載數據集 163
8.2.5 進行評估 163
8.2.6 觀察結果 165
8.3 下一步計劃 167
8.4 本章小結 167
附錄A Neo4j環境 169
參考文獻 201



