大模型+知識圖譜全流程實踐指南:從技術構建到開發實戰
睿思科技
- 出版商: 化學工業
- 出版日期: 2026-06-01
- 售價: $540
- 語言: 簡體中文
- 頁數: 249
- ISBN: 7122502783
- ISBN-13: 9787122502780
-
相關分類:
Large language model
下單後立即進貨 (約4週~6週)
相關主題
商品描述
大模型與知識圖譜融合開發是以結構化知識增強大模型的可信推理能力,同時借助大模型的語義理解實現知識庫的智能構建與自然交互,形成雙向驅動的認知智能系統。
本書系統闡述了大模型與知識圖譜融合開發的完整技術體系。首先講解了知識圖譜的基礎構建流程,為系統開發奠定堅實基礎。然後,重點解析了如何利用大語言模型增強知識圖譜的邏輯推理、路徑推理與生成式補全能力,並結合量化、分布式計算等性能優化技術破解效率瓶頸。同時,通過搜索推薦、金融風控、法律智能和政務數字化等垂直案例,深入剖析了從需求分析、知識抽取到推理集成與系統部署的全流程方法。
本書適合自然語言處理、知識工程、人工智能應用開發等領域的工程師、研究人員及技術管理者閱讀,也可作為高等院校人工智能、計算機科學等相關專業的教學參考用書。
目錄大綱
第1章 大模型與知識圖譜 001
1.1 知識圖譜定義 002
1.1.1 語義網與RDF標準 002
1.1.2 三元組表示與關系建模 005
1.1.3 圖結構與本體約束 007
1.2 大語言模型技術基礎 009
1.2.1 Transformer與自註意力機制 009
1.2.2 預訓練任務與微調 012
1.2.3 向量化語義表示 016
1.3 語義融合驅動 017
1.3.1 知識增強語言模型(KALM) 018
1.3.2 檢索增強生成(RAG) 020
1.3.3 多模態知識集成 022
1.3.4 邊、圖、鏈等基本概念簡介 024
1.4 知識圖譜開發技術棧 026
1.4.1 數據抽取、融合、推理 026
1.4.2 信息存儲與查詢 028
1.4.3 檢索優化的幾種方法 034
1.4.4 應用集成與部署 035
1.5 本章小結 037
第2章 數據采集與預處理 038
2.1 數據源類型 039
2.1.1 結構化數據 039
2.1.2 半結構化數據 040
2.1.3 非結構化數據 041
2.1.4 多模態數據 042
2.2 數據清洗與標準化 044
2.2.1 格式統一與正則化 044
2.2.2 缺失值與異常值處理 046
2.2.3 重覆數據檢測與消解 047
2.3 數據標註與質量評估 049
2.3.1 實體與關系標註規範 049
2.3.2 數據一致性與完整性檢測 050
2.3.3 數據采樣與標註工具實現 052
2.3.4 常見的幾種數據質量評估方案 056
2.4 數據預處理 058
2.4.1 數據標簽 058
2.4.2 噪聲過濾與內容分類 059
2.4.3 數據對齊 061
2.4.4 數據合規性分析 062
2.5 本章小結 065
第3章 知識抽取技術 066
3.1 命名實體識別(NER) 067
3.1.1 基於規則與詞典的方法 067
3.1.2 基於條件隨機場(CRF)與BiLSTM-CRF的方法 069
3.1.3 案例分析:使用BERT與Prompt微調的NER 073
3.2 關系抽取(RE) 075
3.2.1 基於模式匹配的方法 075
3.2.2 基於句法依存的關系識別 077
3.2.3 基於零樣本與少樣本的關系抽取 079
3.2.4 基於上下文的關系抽取 080
3.3 事件抽取(EE) 082
3.3.1 事件觸發詞識別 083
3.3.2 論元抽取 085
3.3.3 跨文檔事件聚合 086
3.4 文本到結構化映射(Text-to-Graph) 086
3.4.1 三元組生成與驗證 087
3.4.2 結構化輸出控制 089
3.4.3 本體映射的基本概念 090
3.5 本章小結 091
第4章 知識融合與消歧 092
4.1 實體對齊 093
4.1.1 基於字符串相似度的方法 093
4.1.2 基於嵌入的跨圖譜對齊 096
4.1.3 聯合訓練與對齊模型 099
4.2 同義詞合並與消歧 101
4.2.1 詞形還原與變體處理 102
4.2.2 上下文語境消歧 104
4.2.3 跨語言消歧 106
4.3 數據沖突檢測與合並策略 108
4.3.1 時間沖突與版本控制 108
4.3.2 屬性值沖突檢測 109
4.3.3 沖突合並優先級規則 111
4.4 知識融合 112
4.4.1 模型生成對齊候選 112
4.4.2 置信度評估與人工覆核 113
4.4.3 基於規則的自動化融合 114
4.5 本章小結 115
第5章 本體知識建模 116
5.1 本體建模原則 117
5.1.1 類與實例的區分 117
5.1.2 關系類型與屬性設計 118
5.1.3 繼承與約束規則 120
5.2 模式定義語言 121
5.2.1 RDFS與OWL 121
5.2.2 SHACL與數據驗證 123
5.2.3 圖模式優化 124
5.3 本體構建工具與流程 126
5.3.1 Protege使用 127
5.3.2 模型導出與導入 128
5.3.3 本體版本管理 130
5.4 本體生成設計 131
5.4.1 領域術語提取 131
5.4.2 有關自動關系模式的建議 136
5.4.3 語義一致性檢測 137
5.5 本章小結 138
第6章 存儲與查詢優化 139
6.1 圖數據庫選型與架構 140
6.1.1 Neo4j與Cypher 140
6.1.2 JanusGraph與Gremlin 142
6.1.3 RDF三元組存儲系統 143
6.2 查詢性能優化 144
6.2.1 索引構建與緩存機制 144
6.2.2 查詢計劃與執行優化 148
6.2.3 分布式查詢與分片策略 151
6.3 向量數據庫與混合檢索 154
6.3.1 向量化實體存儲 154
6.3.2 混合檢索 156
6.3.3 Milvus、Weaviate集成 159
6.4 大模型驅動的智能查詢 162
6.4.1 自然語言到查詢語句生成 162
6.4.2 查詢意圖識別與優化 165
6.4.3 多輪查詢上下文保持 168
6.5 本章小結 171
第7章 知識推理與補全 172
7.1 邏輯推理 173
7.1.1 基於規則的推理引擎 173
7.1.2 前向鏈與反向鏈推理實現 174
7.1.3 一致性檢查與沖突解析 178
7.2 路徑與圖結構推理 181
7.2.1 多跳推理算法 181
7.2.2 最短路徑與語義路徑分析 184
7.2.3 子圖匹配與模式檢測 188
7.3 嵌入與鏈路預測 190
7.3.1 TransE、TransH與RotatE模型 190
7.3.2 基於圖神經網絡(GNN)的預測 193
7.3.3 大模型輔助鏈路推理 195
7.4 知識補全技術 198
7.4.1 數據驅動的補全方法 198
7.4.2 模型生成缺失關系 200
7.4.3 推理、生成結合 202
7.4.4 基於生成對抗網絡(GAN)的知識補全技術 202
7.5 本章小結 206
第8章 性能優化與推理加速 207
8.1 數據索引與存儲優化 208
8.1.1 壓縮編碼與列式存儲 208
8.1.2 緩存層設計 210
8.1.3 冷熱數據分層 212
8.2 模型推理加速 214
8.2.1 模型量化與蒸餾 214
8.2.2 GPU、TPU並行推理 216
8.2.3 向量檢索加速技術 218
8.3 分布式與流式推理 220
8.3.1 Spark GraphX與分布式圖計算 220
8.3.2 流式推理框架 223
8.3.3 在線與離線混合推理 224
8.4 本章小結 226
第9章 基於知識圖譜的搜索與推薦系統 227
9.1 知識圖譜驅動的搜索引擎 228
9.1.1 語義檢索與意圖識別 228
9.1.2 知識引導的結果排序 230
9.1.3 覆雜結構數據的搜索融合 232
9.2 推薦系統增強 234
9.2.1 基於圖的協同過濾 235
9.2.2 語義興趣建模 237
9.2.3 解釋性推薦生成 239
9.3 大模型在搜索與推薦中的應用 241
9.3.1 RAG增強搜索 241
9.3.2 Query Rewrite與擴展 244
9.3.3 個性化推薦生成 245
9.4 本章小結 247
第10章 垂直領域定制與決策支持 248
10.1 垂直領域方案定制流程 249
10.2 金融知識圖譜 249
10.3 法律與政務知識圖譜 249
10.4 系統集成 249
10.5 本章小結 249
