生成式 AI 實戰基於 Transformer、Stable Diffusion、LangChain 和 AI Agent

歐陽植昊梁菁菁呂雲翔

預覽內頁

出版商: 人民郵電
出版日期: 2024-11-01
定價: $479
售價: 7.9 折 $378
語言: 簡體中文
頁數: 232
ISBN: 7115650446
ISBN-13: 9787115650443
相關分類: GAN 生成對抗網絡

立即出貨

生成式 AI 實戰基於 Transformer、Stable Diffusion、LangChain 和 AI Agent-preview-1

買這商品的人也買了...

~~$580~~ $493

深度學習的數學地圖 -- 用 Python 實作神經網路的數學模型 (附數學快查學習地圖)
~~$750~~ $637

GAN 對抗式生成網路 (GANs in Action: Deep learning with Generative Adversarial Networks)
~~$1,000~~ $850

核心開發者親授！PyTorch 深度學習攻略 (Deep Learning with Pytorch)
~~$1,200~~ $948

Keras 大神歸位：深度學習全面進化！用 Python 實作 CNN、RNN、GRU、LSTM、GAN、VAE、Transformer
~~$560~~ $442

AI 神助攻！程式設計新境界 – GitHub Copilot 開發 Python 如虎添翼 : 提示工程、問題分解、測試案例、除錯
~~$750~~ $592

新一代 Keras 3.x 重磅回歸：跨 TensorFlow 與 PyTorch 建構 Transformer、CNN、RNN、LSTM 深度學習模型
~~$479~~ $455

機器人作業系統 (ROS2) 入門與實踐
~~$720~~ $568

自己開發 ChatGPT - LLM 從頭開始動手實作
~~$620~~ $465

全面掌握生成式 AI 與 LLM 開發實務：NLP × PyTorch × GPT 輕鬆打造專屬的大型語言模型（iThome鐵人賽系列書）
$453

LangChain 大模型 AI 應用開發實踐
~~$880~~ $695

Raspberry Pi 樹莓派：AI × OpenCV × LLM × AIoT 創客聖經
~~$768~~ $729

演算法訓練營：提高篇 (全彩版)
$652

ROS 2 智能機器人開發實踐
~~$700~~ $525

程式設計原來不只有寫 CODE！銜接學校與職場的五堂軟體開發實習課 = Beyond Just Coding: Five Essential Lessons from Classroom to Career in Software Development
~~$680~~ $578

讓 AI 好好說話！從頭打造 LLM (大型語言模型) 實戰秘笈
~~$580~~ $458

生成式 AI 入門 – 揭開 LLM 潘朵拉的秘密 : 語言建模、訓練微調、隱私風險、合成媒體、認知作戰、社交工程、人機關係、AI Agent、OpenAI、DeepSeek (Introduction to Generative AI)
~~$480~~ $379

AI 超神筆記術：NotebookLM 高效資料整理與分析 250技
~~$980~~ $774

AI 獨家解密－ DALL·E、Midjourney、Stable Diffusion Python 打開圖片生成原理潘朵拉盒子
$504

從零構建大模型：算法、訓練與微調
$564

Transformer 深度解析與 NLP 應用開發
~~$650~~ $487

生成式 AI 專案實踐指南：從模型挑選、上線、RAG 技術到 AI Agent 整合
~~$980~~ $774

深度學習最佳入門與專題實戰：理論基礎與影像篇
~~$880~~ $748

AI Vision × LLM 電腦視覺應用聖經：OpenCV × YOLO × Ollama 解鎖多模態全攻略
~~$750~~ $562

深度學習詳解｜台大李宏毅老師機器學習課程精粹
~~$980~~ $774

生成式 AI x RAG x Hugging Face 提示工程打造數據採樣神技

開始學習 AI Agent & Vibe Coding 啦詳見活動內容 »

78折
~~$680~~ $530

人手一本的 Vibe Coding 資安實作課：不是專家也能自己動手與 AI 協作！從專案生成、攻防演練到資安框架一次學會！（OWASP Top 10 × ISO27001）
79折
$421

Cursor與Vibe Coding AI編成協同指南
79折
~~$880~~ $695

n8n × Vibe Coding 本機 AI Agent 自動化工作流
79折
$469

Vibe Coding氛圍編程實戰：普通人的AI編程入門書
79折
~~$580~~ $458

Vibe Coding 50 道零程式碼開發｜用 AI 打造生活與工作的應用程式 (Vibe Coding for Beginners: How to use AI and LLMs to create apps, websites and amazing technology without writing code)
79折
~~$680~~ $537

Vibe Coding - Python 超級入門 : ChatGPT x Codex
78折
~~$790~~ $616

不懂程式也能自架專屬 AI：Vibe Coding 教你從零開始本地部署與雲端整合
79折
~~$750~~ $592

Vibe Coding 聖經：4 天寫出 4000 行可執行程式碼，不只是「快」，也重新定義「你的能耐」！
79折
~~$780~~ $616

Cursor 2 Vibe Coding 開發手冊
79折
~~$850~~ $671

Claude Code Vibe Coding 開發手冊, 2/e
79折
~~$690~~ $545

Vibe Coding 提示詞全攻略! 從概念到業界實戰：提示工程 / 程式碼維護 / Cursor / ChatGPT Codex / Lovable
79折
$425

Vibe Coding：AI 編程時代的認知重構
79折
~~$1,080~~ $853

Vibe Coding CLI 頂級開發 - Claude Code 前瞻菁英育成手冊
79折
~~$880~~ $695

Vibe Coding - Cursor 教戰手冊
79折
~~$560~~ $442

AI 神助攻！程式設計新境界 – GitHub Copilot 開發 Python 如虎添翼 : 提示工程、問題分解、測試案例、除錯
79折
~~$599~~ $473

AI × SOP 生成式 AI 工作流：第一線 Prompt 驅動，打造企業 SOP
79折
~~$750~~ $592

Ollama 本地 AI 全方位攻略：命令列功能、五大主題測試、RAG、Vibe Coding、MCP，一本搞定所有實戰應用
79折
~~$750~~ $592

最強 AI 投資分析：打造自己的股市顧問機器人，股票趨勢分析 × 年報解讀 × 選股推薦 × 風險管理
79折
~~$980~~ $774

LLM × 網路爬蟲終極實戰：n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent
79折
$426

零基礎 AI 編程：Cursor 助力 Vibe Coding 實踐
79折
~~$750~~ $592

最強 AI 英語家教：TOEIC 高分實戰攻略
78折
~~$890~~ $694

AI Agent 實戰全攻略：Low-Code × 真落地，從地端部署到 RAG 設計，打造不被取代的核心競爭力（全書搭配 10 小時免費線上課程，讓你即戰力 UP！）
$594

教師智能體：巧用 AI Agent 高效工作
VIP 95折
~~$414~~ $393

從零構建 AI Agent：大模型驅動的智能體設計與實戰
79折
~~$760~~ $600

AI Agent 智能工作流：設計與自動化全實戰

商品描述

本書由淺入深地介紹了生成式AI的理論與實踐，內容涉及從基礎原理到前沿應用，為讀者提供了一個系統的認知框架。本書從生成式AI技術的基礎工具入手，逐步深入到Transformer模型與GPT的原理和應用，詳細介紹了圖像生成模型Stable Diffusion，以及LangChain與AI Agent的相關知識。書中結合開源代碼分析，展示了生成式AI在各行各業的實際應用，並探討了其在高速發展過程中所面臨的倫理和隱私風險。

本書適合對生成式AI感興趣的讀者閱讀，無論你是初學者還是有一定編程基礎的人士，都能從中獲得寶貴的知識和經驗。對於零編程基礎的讀者，本書提供了跳過代碼實現的理論學習路徑。

作者簡介

呂雲翔，北京航空航天大學軟件學院副教授。具有多年的軟件開發、項目管理、電腦教學經驗，對IT行業具有較全面的認識，主編暢銷圖書多部。目前研究領域包括軟件工程、人工智能、大數據等。

目錄大綱

前言

第 1章生成式AI基礎 1

1.1 技術框架介紹 1

1.1.1 Python 1

1.1.2 TensorFlow 3

1.1.3 PyTorch 5

1.1.4 Hugging Face 8

1.1.5 擴展閱讀 9

1.2 常見模型介紹 9

1.2.1 判別式模型 10

1.2.2 生成式模型 10

1.3 數據和任務 11

1.3.1 數據類型 12

1.3.2 常見任務 12

1.4 小結 17

第 2章 Transformer和GPT模型 19

2.1 Transformer簡介 19

2.1.1 基本概念 19

2.1.2 關鍵技術 21

2.1.3 變種與擴展 22

2.1.4 資源與工具 23

2.1.5 擴展閱讀 24

2.2 GPT模型基礎 24

2.2.1 GPT模型的歷史背景 24

2.2.2 GPT模型的核心技術 26

2.2.3 擴展閱讀 26

2.3 如何使用ChatGPT 27

2.3.1 註冊ChatGPT賬號 27

2.3.2 ChatGPT操作方法 27

2.3.3 ChatGPT使用技巧 28

2.4 案例一：文本生成 29

2.4.1 初始化 29

2.4.2 加載ELI5數據集 29

2.4.3 預處理 31

2.4.4 訓練 33

2.4.5 推理 34

2.5 案例二：文本總結 36

2.5.1 安裝 36

2.5.2 加載數據集 37

2.5.3 預處理數據 40

2.5.4 微調模型 44

2.5.5 推理 46

2.6 案例三：文本分類 47

2.6.1 transformers庫 48

2.6.2 具體應用 48

2.6.3 實際應用中的挑戰 51

第3章 Stable Diffusion 53

3.1 Stable Diffusion簡介 53

3.1.1 軟件對比 54

3.1.2 電腦配置要求 55

3.1.3 安裝步驟 55

3.1.4 基礎操作 56

3.1.5 高級功能 58

3.2 Stable Diffusion入門 59

3.2.1 前期準備 60

3.2.2 加載Stable Diffusion 60

3.2.3 可視化Stable Diffusion的內部工作機制 64

3.2.4 Stable Diffusion理論的實際應用 66

3.2.5 Stable Diffusion的內部結構 73

3.3 Stable Diffusion的基礎應用 84

3.3.1 從文本生成圖像：用文字描繪視覺世界 84

3.3.2 圖生圖：Stable Diffusion的圖像轉換魔法 86

3.3.3 圖像編輯：用AI技術重塑視覺記憶 87

3.3.4 製作視頻：用AI賦予畫面動態生命 88

3.4 文生圖 88

3.4.1 流行的模型 89

3.4.2 配置pipeline參數 93

3.4.3 控制圖像生成 96

3.4.4 優化操作 97

3.5 圖生圖 97

3.5.1 快速入門 97

3.5.2 流行的模型 98

3.5.3 配置pipeline參數 102

3.5.4 鏈式圖像到圖像pipeline 105

3.5.5 控制圖像生成 109

3.6 圖像修復 113

3.6.1 使用Diffusers進行圖像修復 113

3.6.2 常用的模型 114

3.6.3 非特定修復的checkpoint 117

3.6.4 配置pipeline參數 122

3.6.5 串聯修復pipeline 125

3.6.6 控制圖像生成 128

3.7 小結 130

第4章 LangChain與AI Agent 131

4.1 LangChain與AI Agent簡介 131

4.1.1 LangChain架構 133

4.1.2 使用LangChain構建AI Agent示例 134

4.2 LangChain關鍵組件 136

4.2.1 Module I/O 137

4.2.2 Retrieval 140

4.2.3 Agent 141

4.3 LCEL入門 141

4.4 LCEL的使用示例 144

4.4.1 基礎原理 144

4.4.2 常用方式 148

4.5 RAG基礎應用 150

4.5.1 RAG架構 150

4.5.2 設置 151

4.5.3 詳細分析 153

4.6 Agent基礎應用 158

4.6.1 搭建Agent 158

4.6.2 創建工具 159

4.6.3 創建提示 159

4.6.4 構建Agent 160

4.6.5 調用Agent 160

4.7 高級RAG應用程序 161

4.7.1 高級應用示例—添加聊天記錄 162

4.7.2 構建環境 162

4.7.3 沒有聊天歷史的鏈條 163

4.7.4 情境化問題 164

4.7.5 有聊天歷史的鏈條 165

4.8 小結 167

第5章生成式AI開源應用案例 169

5.1 文本轉博客 169

5.1.1 核心技術 169

5.1.2 應用與部署 173

5.2 智能填表QuickFill 174

5.2.1 頁面介紹 174

5.2.2 用戶使用指南 175

5.2.3 部署項目 176

5.3 使用Transformer處理多模態大語言模型 180

5.3.1 配置教程 181

5.3.2 使用Transformer 181

5.3.3 使用ModelScope 190

5.4 3D生成：Stable Diffusion和Generative Gaussian Splatting方法 192

5.4.1 配置流程 192

5.4.2 運行示例 193

5.4.3 關鍵原理解釋 194

5.5 視頻生成 195

5.5.1 簡介 195

5.5.2 視頻生成的原理 196

5.5.3 視頻生成實踐 197

5.5.4 視頻優化 202

5.5.5 視頻生成工具 203

5.5.6 視頻生成的挑戰 206

第6章生成式AI行業應用 209

6.1 跨媒體內容創作 209

6.1.1 文本與圖像結合 209

6.1.2 文本和視頻結合 210

6.1.3 多媒體內容創作 211

6.2 商業廣告設計 212

6.2.1 創新廣告策略 213

6.2.2 定製化設計方法 213

6.3 金融應用 214

6.3.1 個性化的消費者體驗 214

6.3.2 合規 215

6.3.3 風險管理 216

6.3.4 動態預測和報告 216

6.3.5 挑戰 217

6.4 教育應用 217

6.4.1 學習體驗定製 218

6.4.2 教育內容創新 219

6.4.3 賦能教師端 219

6.4.4 AI在教育中的挑戰與局限性 219

6.5 在健康領域的應用 220

6.5.1 解決醫療資源獲取和成本的問題 220

6.5.2 應用場景 222

6.5.3 新型醫療保健公司的市場 222

第7章生成式AI倫理道德 225

7.1 常見的生成式AI倫理道德

問題 225

7.1.1 質量與性能 225

7.1.2 偏見與公平性 226

7.1.3 隱私 226

7.2 數據模型角度的分析 227

7.2.1 數據泄露 227

7.2.2 內容審查/有害內容 228

7.2.3 提示註入/防禦 229

7.2.4 模型操縱 230

7.2.5 可解釋性和透明度 230

7.3 一般性解決方案 231

7.3.1 Responsible AI在大語言模型應用開發中的應用 231

7.3.2 在大語言模型中建立防護欄 231

7.3.3 構建值得信賴的AI未來 231