大模型知識增強:概念、方法與技術

陳華鈞

  • 出版商: 電子工業
  • 出版日期: 2025-05-01
  • 售價: $708
  • 語言: 簡體中文
  • ISBN: 7121500795
  • ISBN-13: 9787121500794
  • 相關分類: LangChain
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

以ChatGPT和DeepSeek為代表的大模型顯著提高了表示和處理世界知識的技術水平,大模型和傳統知識圖譜的融合正在成為人工智能知識處理的全新技術範式。本書系統地探討大模型與知識圖譜的互補增強方法與技術,內容包括:知識增強預訓練基礎、知識增強提示指令、知識輔助檢索增強、知識增強大模型查詢問答、知識增強大模型推理、知識增強幻覺抑制、大模型知識編輯、知識增強多模態學習、知識智能體與世界模型等。本書由淺入深地介紹每個知識點,先提供背景知識,再深入講解技術方法或學術前沿內容。本書還註重系統性和整體性,以及各章的銜接與前後呼應。對於實用性很強的技術,本書提供來自企業實踐的真實案例或開源工具,方便讀者動手實踐,達到理論與實踐相結合的目的。

作者簡介

陳華鈞浙江大學計算機科學與技術學院教授/博導,中文開放知識圖譜OpenKG發起人,浙江省數智科技研究會副會長,中國中文信息學會語言與知識計算專委會副主任,中國人工智能學會知識工程與分佈智能專委會副主任。入選浙江省有突出貢獻中青年專家、浙江省高層次人才特殊支持計劃科技創新領軍人才, 前2% 科學家終身榜單(人工智能領域)。主要研究方向為人工智能、知識圖譜、自然語言處理、AI for Science,在Nature Machine Intelligence、Nature Communications、NeurIPS、ICLR、ICML、IJCAI、AAAI、ACL、EMNLP、WWW、KDD、VLDB、IEEE TKDE、Proceedings of the IEEE等 會議和期刊以 作者或通訊作者發表多篇論文。主持多項 自然科學基金重點類項目,以及 重點研發計劃、 重大科技專項、重大企業合作項目。曾獲 語義網會議ISWC 論文獎、 知識圖譜聯合會議IJCKG 論文獎、 科技進步二等獎、 技術發明一等獎、錢偉長科技獎一等獎、浙江省科技進步二等獎、浙江大學 教材獎一等獎等多項科技獎勵。張寧豫浙江大學軟件學院副教授、特聘研究員、智能科學與工業軟件所副所長,入選斯坦福 前2% 科學家榜單,主要研究方向為自然語言處理、知識圖譜等。擔任ACM Transactions on Asian and Low-Resource Language Information Processing Associate Editor,ACL、EMMLP、ICLR、KDD領域 ,ARR Action Editor,IJCAI 程序委員,研發了知識獲取系統DeepKE及大模型知識編輯系統EasyEdit。張文浙江大學軟件學院副教授、特聘研究員。研究方向為知識表示與推理、知識圖譜、大語言模型。在NeurIPS、KDD、WWW、IJCAI、AAAI、ICDE、ACM MM、WSDM等 會議上發表多篇論文。主持 自然科學基金青年科學基金項目、浙江省自然科學基金探索青年項目、寧波市自然科學基金探索一般項目。曾獲 知識圖譜聯合會議(IJCKG) 論文獎、 應用論文獎,浙江省科技進步二等獎等獎勵。入選副省級市高層次人才引進計劃、百度2023年度AI華人女性青年學者榜。

目錄大綱

第1章 大模型知識增強概述 1
1.1 大模型時代的通用人工智能 2
1.1.1 人類語言與世界知識 2
1.1.2 大模型是處理世界知識的通用
人工智能系統 2
1.1.3 通用人工智能的特徵 3
1.2 大模型的知識力 8
1.2.1 什麽是知識 8
1.2.2 知識的表示形式 9
1.2.3 大模型中的世界知識 11
1.3 知識圖譜與語言模型 14
1.3.1 知識表示與知識規模 15
1.3.2 為什麽仍然需要符號知識圖譜 16
1.3.3 語言模型與知識圖譜都是表示和處理
知識的手段 16
1.4 大模型知識增強 17
1.4.1 大模型知識增強的分類 17
1.4.2 大模型知識增強的典型方法及核心概念 20
1.5 本章小結 21
第2章 知識增強預訓練基礎 23
2.1 知識增強預訓練概述 24
2.2 預訓練語言模型 25
2.2.1 語言模型 25
2.2.2 詞向量與分佈式語義表示 26
2.2.3 註意力機制:增強詞的交互關系 28
2.2.4 預訓練語言模型 29
2.2.5 ChatGPT 31
2.3 知識增強的預訓練 34
2.3.1 常見知識增強語料 34
2.3.2 知識增強詞向量 36
2.3.3 知識註入 37
2.3.4 結構增強 43
2.4 應用與實踐 47
2.4.1 知識增強電信預訓練模型 47
2.4.2 知識增強電商預訓練模型 53
2.4.3 知識增強蛋白質預訓練模型 56
2.5 本章小結 59
第3章 知識增強提示指令 60
3.1 知識增強提示指令概述 61
3.2 提示學習與指令精調 63
3.2.1 提示學習 63
3.2.2 指令精調 69
3.2.3 思維鏈 73
3.2.4 提示的本質 74
3.3 知識增強提示學習 76
3.3.1 傳統提示學習的局限性 76
3.3.2 知識增強提示模板 76
3.3.3 知識增強標簽詞集構建 79
3.3.4 面向圖數據的提示學習 81
3.4 結構增強思維鏈 83
3.4.1 傳統思維鏈的局限性 83
3.4.2 結構化思維鏈 84
3.4.3 知識圖譜思維鏈 91
3.5 結構增強指令精調 93
3.5.1 傳統指令精調的局限性 93
3.5.2 知識抽取指令 94
3.5.3 圖學習指令 97
3.5.4 知識圖譜指令 99
3.6 本章小結 100
第4章 知識輔助檢索增強 103
4.1 知識輔助檢索增強概述 104
4.2 檢索增強生成 105
4.2.1 什麽是檢索增強生成 105
4.2.2 RAG的典型架構 108
4.2.3 RAG的訓練機制 111
4.2.4 RAG的優化 114
4.2.5 RAG的局限性 114
4.3 知識圖譜與RAG 115
4.3.1 向量RAG與KG-RAG 115
4.3.2 知識圖譜對於RAG的價值 116
4.3.3 知識圖譜增強RAG的不同階段 118
4.4 KG-RAG的幾種典型架構 121
4.4.1 Tree-RAG:構建實體或主題
概念樹增強RAG 121
4.4.2 KE-RAG:利用知識抽取增強RAG 122
4.4.3 利用外部知識圖譜增強的KG-RAG 125
4.4.4 融合思維鏈的多模態KG-RAG 126
4.5 本章小結 127
第5章 知識增強大模型查詢問答 129
5.1 知識增強大模型查詢問答概述 130
5.2 查詢問答背景知識 131
5.2.1 結構化知識表示 131
5.2.2 結構化知識查詢 132
5.2.3 查詢問答方法 135
5.3 大模型查詢問答能力分析 137
5.4 知識增強查詢問答方法 138
5.4.1 基於大模型微調的查詢問答 138
5.4.2 基於檢索生成的查詢問答 139
5.4.3 基於統一表示的查詢問答 142
5.5 本章小結 144
第6章 知識增強大模型推理 146
6.1 知識增強大模型推理概述 147
6.2 知識推理背景介紹 148
6.2.1 什麽是知識推理 148
6.2.2 語言模型推理 153
6.2.3 知識圖譜推理 156
6.2.4 知識增強大模型推理的目標 162
6.3 知識圖譜增強語言模型推理 163
6.3.1 知識圖譜引導多跳推理鏈 163
6.3.2 符號規則引導大模型推理 166
6.3.3 知識圖譜過程監督 170
6.4 語言模型增強知識圖譜推理 172
6.4.1 語言模型增強知識圖譜查詢推理 173
6.4.2 語言模型增強知識圖譜關系推理 175
6.4.3 語言模型增強知識圖譜規則推理 177
6.5 知識圖譜基礎模型 179
6.5.1 知識圖譜預訓練方法 180
6.5.2 知識圖譜基礎模型初探 183
6.6 本章小結 186
第7章 知識增強幻覺抑制 188
7.1 知識增強幻覺抑制概述 189
7.2 大模型幻覺背景 190
7.2.1 大模型幻覺問題定義 190
7.2.2 大模型幻覺成因 192
7.2.3 大模型幻覺檢測與抑制意義 193
7.2.4 知識增強與幻覺抑制 194
7.3 大模型幻覺檢測與抑制 194
7.3.1 幻覺問題檢測方法 195
7.3.2 知識增強幻覺抑制 199
7.4 本章小結 206
第8章 大模型知識編輯 208
8.1 大模型知識編輯概述 209
8.2 大模型知識編輯問題 210
8.2.1 什麽是大模型知識編輯 210
8.2.2 大模型知識分析方法 212
8.2.3 大模型知識存儲機制 214
8.3 模型知識編輯方法 217
8.3.1 基於外部幹預的知識編輯方法 218
8.3.2 基於內部 新的知識編輯方法 222
8.4 模型編輯影響分析 225
8.4.1 知識能力影響 225
8.4.2 通用能力影響 227
8.5 應用與實踐 227
8.5.1 EasyEdit開源知識編輯工具實踐 227
8.5.2 OneEdit知識編輯框架 230
8.5.3 大模型知識編輯應用 230
8.6 本章小結 232
第9章 知識增強多模態學習 233
9.1 知識增強多模態概述 234
9.1.1 人類認知系統 234
9.1.2 融合兩種記憶 234
9.1.3 知識圖譜與多模態學習 235
9.2 多模態與大模型 236
9.2.1 多模態任務簡介 236
9.2.2 多模態生成模型 238
9.2.3 多模態大模型 241
9.3 知識增強視覺問答 242
9.3.1 視覺問答與知識圖譜 243
9.3.2 知識增強視覺問答的基本過程 244
9.3.3 典型案例:知識增強多模態視覺問答 249
9.4 知識增強跨模態檢索 251
9.4.1 跨模態檢索與知識圖譜 251
9.4.2 典型案例:知識增強多模態語義檢索 252
9.5 知識增強低資源多模態學習 254
9.5.1 低資源學習與知識圖譜 254
9.5.2 典型案例:知識增強的零樣本學習 255
9.6 知識增強多模態生成 257
9.6.1 多模態生成任務概述 257
9.6.2 典型案例:知識增強視覺敘事 258
9.7 知識增強多模態幻覺檢測 260
9.7.1 領域知識與大模型幻覺檢測 260
9.7.2 典型案例:知識引導的多模態幻覺檢測 262
9.8 本章小結 264
0章 知識智能體與世界模型 266
10.1 概述 267
10.2 AI智能體與工具調用 268
10.2.1 什麽是AI智能體 268
10.2.2 AI智能體架構 270
10.2.3 AI智能體學習 275
10.2.4 為什麽需要知識增強AI智能體 276
10.3 知識增強的AI智能體 277
10.3.1 知識增強的單智能體規劃 277
10.3.2 知識增強的多智能體協同 281
10.4 總結與展望 282
10.4.1 大模型的知識機制 282
10.4.2 具身智能與世界模型 283
10.4.3 世界知識模型 284
參考文獻 286