自然語言處理 — 基於深度學習的理論與案例
雷擎
- 出版商: 清華大學
- 出版日期: 2024-03-01
- 定價: $414
- 售價: 8.5 折 $352
- 語言: 簡體中文
- ISBN: 7302657475
- ISBN-13: 9787302657477
-
相關分類:
DeepLearning、Text-mining
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
-
$820$640 -
$539$512 -
$714$678 -
$454矽基物語.AI大爆炸
-
$650$455 -
$454從零開始大模型開發與微調:基於 PyTorch 與 ChatGLM
-
$534$507 -
$750$593 -
$505內容理解:技術、演算法與實踐
-
$356LangChain編程:從入門到實踐
-
$650$507 -
$352大語言模型通識
-
$359$341 -
$354$336 -
$454LangChain 大模型 AI 應用開發實踐
-
$407生成式AI實戰基於Transformer、Stable Diffusion、LangChain和AI Agent
相關主題
商品描述
本書主要介紹神經網絡、深度學習和自然語言處理的基本原理、方法和應用,全書分為3部分,每部分涵蓋了不同的主題: 第1部分(第1~3章)介紹神經網絡和深度學習的基礎知識,包括人工神經網絡的起源和發展,神經網絡的表示方法、數學基礎理論和機器學習基礎,以及表徵學習的概念;第2部分(第4章和第5章)介紹自然語言處理和轉換器網絡;第3部分(第6~10章)介紹自然語言處理的案例分析,包括文本分類任務、實體識別、文本生成和文本摘要的方法和技術、基於評審的問答系統等。 本書是學習並實踐神經網絡、深度學習和自然語言處理的實用指南,每章都給出了代碼示例和實際案例,幫助讀者理解和實踐所學的知識。本書採用漸進式講解,理論與實踐結合,強調自然語言處理,並且關註**技術和趨勢,適合作為高等學校神經網絡、深度學習和自然語言處理相關課程的教材,也是相關專業人員很好的參考用書。
目錄大綱
目錄
第1部分神經網絡與深度學習
第1章人工神經網絡/3
1.1起源和發展3
1.2什麽是深度學習5
1.3神經網絡的表示8
1.4數學基礎理論12
1.4.1數據類型12
1.4.2函數基礎15
1.4.3線性代數20
1.4.4梯度計算28
1.4.5概率分佈30
1.4.6代碼示例36
1.5機器學習基礎38
1.5.1什麽是分類40
1.5.2一個簡單的分類器: 樸素貝葉斯45
1.5.3一個簡單的神經網絡: 邏輯回歸47
1.5.4評估分類結果54
1.6表徵學習57
1.6.1主成分分析58
1.6.2詞袋的表徵66
第2章前饋神經網絡/69
2.1單層感知器69
2.2三層神經網絡75
2.3激活函數80
2.3.1線性函數80
2.3.2邏輯函數81
2.4更新權重87
2.4.1學習規則87
2.4.2反向傳播95
2.4.3梯度下降102
2.5代碼示例105
2.6修改和擴展107
2.6.1預期泛化誤差108
2.6.2正則化的思想113
2.6.3調整超參數119
2.6.4其他的問題123
〖1〗自然語言處理——基於深度學習的理論與案例目錄〖3〗〖3〗第3章深度學習網絡/126
3.1深度的定義127
3.2捲積神經網絡128
3.2.1什麽是捲積計算129
3.2.2感受野與捲積層131
3.2.3特徵圖和池化層136
3.2.4一個捲積網絡138
3.2.5用於文本分類141
3.3循環神經網絡143
3.3.1不等長序列143
3.3.2循環連接的構成145
3.3.3長短期記憶網絡148
3.3.4三種訓練方法152
3.3.5一個簡單的實現155
3.4深度分佈式表徵160
3.4.1自編碼器160
3.4.2神經語言模型167
第2部分自然語言處理與轉換器網絡
第4章自然語言處理/179
4.1歷史發展179
4.2常見任務183
4.2.1字符和語音識別183
4.2.2形態分析183
4.2.3句法分析185
4.2.4詞匯語義186
4.2.5關系語義187
4.2.6話語188
4.2.7高級任務190
4.3未來趨勢192
4.4認識轉換器195
4.4.1編碼器到解碼器框架196
4.4.2註意力機制198
4.4.3遷移學習201
4.4.4Hugging Face生態205
4.4.5面對挑戰211
第5章轉換器網絡/212
5.1轉換器介紹212
5.2理解編碼器215
5.2.1輸入嵌入層217
5.2.2位置編碼218
5.2.3多頭自註意力層221
5.2.4殘值連接與層歸一化230
5.2.5前饋網絡層232
5.3理解解碼器233
5.3.1掩碼多頭註意力層235
5.3.2多頭註意力層239
5.3.3線性層和Softmax層242
5.3.4運行流程243
5.4訓練轉換器244
5.5轉換器家族246
5.5.1編碼器分支246
5.5.2解碼器分支253
5.5.3編碼器到解碼器分支255
5.6概括258
第3部分自然語言處理案例分析
第6章文本分類案例分析/261
6.1數據集261
6.1.1查看數據262
6.1.2轉換到數據框265
6.1.3查看類別分佈266
6.1.4查看推文長度266
6.2從文本到標記267
6.2.1字符標記化267
6.2.2詞標記化269
6.2.3子詞標記化270
6.2.4整個數據集272
6.3訓練分類器274
6.3.1特徵提取器275
6.3.2微調轉換器283
第7章實體識別案例分析/288
7.1數據集288
7.2多語言轉換器292
7.3標記化管道294
7.4模型類剖析297
7.4.1模型體和頭297
7.4.2創建自定義模型297
7.4.3加載自定義模型299
7.5標記文本301
7.6績效衡量303
7.7微調XLMR304
7.8錯誤分析305
第8章文本生成案例分析/310
8.1生成連貫文本310
8.2貪心搜索解碼311
8.3集束搜索解碼313
8.4抽樣方法317
第9章文本摘要案例分析/323
9.1數據集323
9.2文本摘要管道324
9.2.1基線324
9.2.2GPT2325
9.2.3T5325
9.2.4BART326
9.2.5PEGASUS326
9.2.6比較不同327
9.3衡量指標328
9.3.1BLEU 328
9.3.2ROUGE333
第10章問答系統案例分析/336
10.1基於評審的問答系統336
10.1.1數據集337
10.1.2從文本中提取答案340
參考文獻/349