GPT 圖解 : 大模型是怎樣構建的

黃佳

預覽內頁

出版商: 人民郵電
出版日期: 2023-12-01
定價: $479
售價: 8.5 折 $407
語言: 簡體中文
頁數: 254
裝訂: 平裝
ISBN: 7115623686
ISBN-13: 9787115623683
相關分類: ChatGPT、LangChain、人工智慧、Text-mining
相關翻譯: NLG 的王者 GPT 圖解 - LLM 的原來是這樣建構出來的 (繁中版)

立即出貨 (庫存 < 4)

買這商品的人也買了...

~~$580~~ $458

機器學習的數學基礎 : AI、深度學習打底必讀
~~$580~~ $458

深度學習的數學地圖 -- 用 Python 實作神經網路的數學模型 (附數學快查學習地圖)
$458

零基礎學機器學習
~~$1,200~~ $948

開發者傳授 PyTorch 秘笈
~~$479~~ $455

GPU 編程實戰 : 基於 Python 和 CUDA (Hands-On GPU Programming with Python and CUDA: Boost your application's performance and productivity with CUDA: Explore high-performance parallel computing with CUDA)
~~$539~~ $512

數據分析咖哥十話從思維到實踐促進運營增長
~~$880~~ $695

Scikit-learn 詳解與企業應用：機器學習最佳入門與實戰
~~$534~~ $507

CPU 眼裡的 C/C++
$454

因特網技術十講
$556

大規模語言模型：從理論到實踐
$505

實戰 AI 大模型
$301

智能邊緣計算
$505

自然語言處理原理與實戰
$505

LangChain 入門指南：構建高可復用、可擴展的 LLM 應用程序
~~$880~~ $695

跟 NVIDIA 學深度學習！從基本神經網路到 ......、GPT、BERT...，紮穩機器視覺與大型語言模型 (LLM) 的建模基礎
~~$774~~ $735

一本書講透 Elasticsearch：原理、進階與工程實務
~~$594~~ $564

硬件設計指南從裝置認知到手機基帶設計
$556

高效能並行運行時系統:設計與實現
~~$474~~ $450

Llama 大模型實踐指南
~~$750~~ $735

生成式人工智慧導論與實作 ─ ChatGPT 與圖像生成實務應用
$602

LangChain 技術解密：構建大模型應用的全景指南
~~$539~~ $512

大模型應用開發 : 動手做 AI Agent
~~$780~~ $616

NLG 的王者 GPT 圖解 - LLM 的原來是這樣建構出來的
~~$474~~ $450

快速部署大模型：LLM 策略與實踐 (基於 ChatGPT 等大語言模型)
~~$534~~ $507

Stable Diffusion - ComfyUI AI 繪畫工作流解析

商品描述

　　人工智能（AI），尤其是生成式語言模型和生成式人工智能（AIGC）模型，正以驚人的速度改變著我們的世界。駕馭這股潮流的關鍵，莫過於探究自然語言處理（NLP）技術的深奧秘境。本書將帶領讀者踏上一段扣人心弦的探索之旅，讓其親身感受，並動手搭建語言模型。本書主要內容包括N-Gram，詞袋模型（BoW），Word2Vec（W2V），神經概率語言模型（NPLM），循環神經網絡（RNN），Seq2Seq（S2S），註意力機制，Transformer，從初代GPT到ChatGPT再到GPT-4等一系列突破性技術的誕生與演進。

　　本書將以生動活潑的筆觸，將枯燥的技術細節化作輕松幽默的故事和繽紛多彩的圖畫，引領讀者穿梭於不同技術的時空，見證自然語言處理技術的傳承、演進與蛻變。在這場不斷攀登技術新峰的奇妙之旅中，讀者不僅能深入理解自然語言處理技術的核心原理，還能自己動手，從零開始搭建起一個又一個語言模型。

　　無論你是在校學生還是人工智能從業者，這本書都將成為一盞明燈，照亮你探索人工智能無限奧秘的道路。

作者簡介

黃佳，筆名咖哥，新加坡科技研究局人工智能研究員。主攻方向為 NLP 大模型的研發與應用、持續學習、AI in FinTech。黃佳深耕人工智能領域多年，積累了豐富的科研項目和政府、銀行、能源、醫療等領域 AI 項目落地實戰經驗，目前正與 PlatoX.AI 展開富有前景的技術合作。曾著有《零基礎學機器學習》《數據分析咖哥十話》等多部熱銷書。同時，在極客時間開設專欄《零基礎實戰機器學習》《LangChain 實戰課》，在深藍學院開設視頻課程“生成式預訓練語言模型：理論與實戰”。

目錄大綱

目　錄

序章　看似尋常最奇崛，成如容易卻艱辛　001

GPT-4：點亮人工通用智能的火花　002

人工智能演進之路：神經網絡兩落三起　004

現代自然語言處理：從規則到統計　007

何為語言？信息又如何傳播？　008

NLP是人類和電腦溝通的橋梁　009

NLP技術的演進史　010

大規模預訓練語言模型：BERT與GPT爭鋒　012

語言模型的誕生和進化　012

統計語言模型的發展歷程　014

基於Transformer架構的預訓練模型　016

“預訓練+微調大模型”的模式　018

以提示/指令模式直接使用大模型　019

從初代GPT到ChatGPT，再到GPT-4　021

GPT作為生成式模型的天然優勢　022

ChatGPT背後的推手——OpenAI　023

從初代GPT到ChatGPT，再到GPT-4的進化史　024

第 1課　高樓萬丈平地起：語言模型的雛形N-Gram和簡單文本表示Bag-of-Words　026

1.1　N-Gram模型　026

1.2　“詞”是什麽，如何“分詞”　030

1.3　創建一個Bigram字符預測模型　032

1.4　詞袋模型　036

1.5　用詞袋模型計算文本相似度　037

小結　042

思考　043

第 2課　問君文本何所似：詞的向量表示Word2Vec和Embedding　044

2.1　詞向量 ≈ 詞嵌入　045

2.2　Word2Vec：CBOW模型和Skip-Gram模型　047

2.3　Skip-Gram模型的代碼實現　050

2.4　CBOW模型的代碼實現　061

2.5　通過nn.Embedding來實現詞嵌入　063

小結　067

思考　068

第3課　山重水復疑無路：神經概率語言模型和循環神經網絡　069

3.1　NPLM的起源　070

3.2　NPLM的實現　072

3.3　循環神經網絡的結構　079

3.4　循環神經網絡實戰　082

小結　086

思考　087

第4課　柳暗花明又一村：Seq2Seq編碼器-解碼器架構　088

4.1　Seq2Seq架構　089

4.2　構建簡單Seq2Seq架構　092

小結　103

思考　103

第5課　見微知著開慧眼：引入註意力機制　104

5.1　點積註意力　105

5.2　縮放點積註意力　114

5.3　編碼器-解碼器註意力　116

5.4　註意力機制中的Q、K、V　122

5.5　自註意力　125

5.6　多頭自註意力　126

5.7　註意力掩碼　129

5.8　其他類型的註意力　131

小結　132

思考　132

第6課　　層巒疊翠上青天：搭建GPT核心組件Transformer　133

6.1　Transformer架構剖析　133

6.1.1　編碼器-解碼器架構　135

6.1.2　各種註意力的應用　135

6.1.3　編碼器的輸入和位置編碼　140

6.1.4　編碼器的內部結構　141

6.1.5　編碼器的輸出和編碼器-解碼器的連接　142

6.1.6　解碼器的輸入和位置編碼　143

6.1.7　解碼器的內部結構　145

6.1.8　解碼器的輸出和Transformer的輸出頭　146

6.2　Transformer代碼實現　148

6.3　完成翻譯任務　176

6.3.1　數據準備　177

6.3.2　訓練Transformer模型　179

6.3.3　測試Transformer模型　179

小結　181

思考　182

第7課　芳林新葉催陳葉：訓練出你的簡版生成式GPT　183

7.1　BERT與GPT爭鋒　184

7.2　GPT：生成式自回歸模型　188

7.3　構建GPT模型並完成文本生成任務　191

7.3.1　搭建GPT模型（解碼器）　　　　192

7.3.2　構建文本生成任務的數據集　　　　195

7.3.3　訓練過程中的自回歸　　　　198

7.3.4　文本生成中的自回歸（貪婪搜索）　　　　200

7.4　使用WikiText2數據集訓練Wiki-GPT模型　201

7.4.1　用WikiText2構建Dataset和DataLoader　　　　202

7.4.2　用DataLoader提供的數據進行訓練　　　　206

7.4.3　用Evaluation Dataset評估訓練過程　　　　207

7.4.4　文本生成中的自回歸（集束搜索）　　　　209

小結　212

思考　213

第8課　流水後波推前波：ChatGPT基於人類反饋的強化學習　214

8.1　從GPT到ChatGPT　215

8.2　在Wiki-GPT基礎上訓練自己的簡版ChatGPT　218

8.3　用Hugging Face預訓練GPT微調ChatGPT　225

8.4　ChatGPT的RLHF實戰　233

8.4.1　強化學習基礎知識　　　　235

8.4.2　簡單RLHF實戰　　　　237

小結　243

思考　244

第9課　生生不息的循環：使用強大的GPT-4 API　245

9.1　強大的OpenAI API　245

9.2　使用GPT-4 API　249

小結　251

思考　252

後　記　莫等閑，白了少年頭　253

GPT 圖解 : 大模型是怎樣構建的

黃佳

買這商品的人也買了...

相關主題

商品描述

作者簡介

目錄大綱

類似商品