Transformer大模型:原理、實踐及應用

  • 出版商: 清華大學
  • 出版日期: 2025-09-01
  • 售價: $354
  • 語言: 簡體中文
  • ISBN: 7302698813
  • ISBN-13: 9787302698814
  • 相關分類: Large language model
  • 下單後立即進貨 (約4週~6週)

  • Transformer大模型:原理、實踐及應用-preview-1
  • Transformer大模型:原理、實踐及應用-preview-2
  • Transformer大模型:原理、實踐及應用-preview-3
Transformer大模型:原理、實踐及應用-preview-1

商品描述

這本書的目標讀者群體較難界定,介於學校教學和常識性科普之間。而科普內容人們在網上可以即時檢索到**內容。故目前還是更偏重於學校教學使用,可作為前沿選修課和相關專業課的參考書。主要內容為生成式AI,如果屆時ChatGPT仍然具有廣闊前景,再加上ChatGPT的介紹與使用方面的內容。ChatGPT的技術細節,目前OpenAI尚未公布,因此目前來看難以詳細講述ChatGPT。此外,目前在國內還無法註冊使用ChatGPT,這是一個很大的挑戰,不僅對寫書而言,對讀者也是如此。

作者簡介

陳喆,曾編著《物聯網無線通信原理與實踐》(清華大學出版社2021年8月出版)、曾著《機器學習原理與實踐(微課版)》(清華大學出版社2022年6月出版)。即將交稿《深度學習原理與實踐》。

目錄大綱

目錄

 

 

第1章引言1

1.1從機器學習到深度學習1

1.2Transformer架構3

1.3PyTorch框架4

1.3.1PyTorch框架的安裝5

1.3.2PyTorch函數和類5

1.3.3PyTorch實踐9

1.4深度神經網絡14

1.5本書各章之間的聯系18

1.6本章小結18

1.7思考與練習19

 

第2章序列監督學習20

2.1兩種序列監督學習20

2.1.1基於前饋神經網絡的序列監督學習21

2.1.2基於循環神經網絡的序列監督學習23

2.2序列預測27

2.3序列生成30

2.4本章小結33

2.5思考與練習33

 

第3章序列聚合與註意力機制35

3.1基於標量投影的序列聚合35

3.2選擇性序列聚合41

3.3註意力機制與多頭註意力機制47

3.4本章小結51

3.5思考與練習52第4章Transformer架構54

4.1使用樣本組訓練序列預測模型54

4.2Transformer中的層60

4.2.1前饋網絡60

4.2.2殘差連接62

4.2.3層標準化66

4.2.4dropout68

4.3解碼器型Transformer70

4.4編碼器型Transformer71

4.5編解碼器型Transformer74

4.6本章小結81

4.7思考與練習82

 

第5章Transformer架構在自然語言處理領域的應用84

5.1文本分類84

5.2文本生成87

5.3機器翻譯88

5.4語音分類92

5.5語音轉文本94

5.6本章小結95

5.7思考與練習96

 

第6章Transformer架構在計算機視覺領域的應用97

6.1圖像分類97

6.2圖像說明103

6.3視頻分類105

6.4視頻預測106

6.5本章小結107

6.6思考與練習108

 

第7章Transformer架構在其他領域的應用109

7.1Transformer架構在數字信號處理中的應用109

7.2Transformer架構在推薦系統中的應用110

7.3Transformer架構在深度強化學習中的應用112

7.4本章小結114

7.5思考與練習115

 

附錄A實驗參考程序及註釋116

A.1第1章實驗116

A.2第2章實驗121

A.3第3章實驗125

A.4第4章實驗133

A.5第5章實驗147

A.6第6章實驗163

A.7第7章實驗170

 

參考文獻178

 

寫在後面180