大模型覺醒:DeepSeek引領AI新未來
黃正傑
- 出版商: 重慶出版社
- 出版日期: 2025-05-01
- 售價: $420
- 語言: 簡體中文
- 頁數: 200
- ISBN: 7229201373
- ISBN-13: 9787229201371
-
相關分類:
DeepLearning、人工智慧
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書詳盡地介紹了人工智能模型的發展歷程,從 初的神經元模型到小型模型,經歷了智能的誕生和認知的躍遷等關鍵階段。隨著大模型時代的到來,書中探討了計算能力的革命性變革以及架構的演進,例如 Transformer 架構如何重塑了我們的認知模式。 書中特別強調了 DeepSeek 範式的重要性,介紹了其發布的強大模型系列,其中 開源推理大模型 deepseekR1 尤為引人註目。該模型融合了多頭潛在註意力等創新技術,實現了訓練方法的革新、生成能力的提升以及推理過程的重構。此外,DeepSeek 還推動了產業化應用,降低了技術部署的門檻。 開源戰略正在加速人工智能生態系統的重組,成本優勢促進了技術的突破,並推動了產業的變革。展望人工智能的未來,DeepSeek 助力企業實現從“+AI”到“AI+”的轉型路徑,完善了軟硬件生態系統。該企業 了 AI 模型開源應用的免費趨勢,加速了人工智能的產業化進程,為 AI 的發展註入了新的動力和機遇。
作者簡介
黃正傑 工程師, 信息系統 項目管理師,中國生產力促進中心協會專家庫專家、重慶市數字技術人才培育項目簽約講師、重慶市軟件人才“ 工廠”師資庫講師、重慶市中小企業服務專家庫專家。 以負責人身份完成多項成果,獲全國“振興杯”青年職業技能大賽銀獎、首屆 工程師大賽“ 成果轉化獎”。阿裏雲認證專家(ACE)。獲北碚區“縉雲英才”高技能領軍人才稱號。 百度飛槳/文心大模型技術生態認證 講師,百度 PPDE,百度首席AI架構師計劃AICA七期成員。 利用人工智能技術進行數字技能人才培養相關事跡受中國青年報、學習強國等中央媒體報道。
目錄大綱
篇:從神經元到小模型的小而美之路
1 - 智能起源:從神經元到感知機 004
? 生物神經元的啟示:快遞站裏的信息傳遞 005
? 感知機: 臺“人工大腦”的誕生 006
? 激活函數:決策背後的“門檻法則” 006
? 參數:知識保存的關鍵 007
? 預訓練、後訓練與推理:貫穿神經網絡發展的三大概念 008
? 感知機的“能力邊界”與破局關鍵 010
2 - 認知躍遷:多層感知機的破冰之旅 011
? 從單細胞到腦網絡:感知機的進化之路 011
? 隱藏層:打開認知維度的新鑰匙 012
? 從“符號邏輯”到“模式湧現” 012
? 多層感知機:AI發展的基石 014
? 多層感知機中的關鍵技術創新 014
3 - 深度覺醒:反向傳播算法的突破 015
? 反饋優化下的性能提升 016
? 鏈式法則的認知革命 016
? 參數優化的工程奇跡 017
? 覺醒之路的技術啟示 018
4 - 正則化:給學霸裝上“防學習沈迷系統” 019
? 打破 主義的魔咒 019
? 打破魔咒的方法論 020
5 - 視覺革命:CNN如何理解圖像表達的含義 022
? CNN起源:從堆疊濾鏡到深度學習 023
? CNN三大核心技術:卷積、池化與正則化 024
? CNN實戰:圖像識別的工業化革命 025
? 從像素到認知的跨越 026
6 - 語言解密:RNN如何理解文字背後的深意 026
? 從“字面意思”到“深層語義”的跨越 026
? RNN核心原理:帶“記憶”的流水線 027
? RNN關鍵技術細節 027
第二篇:大模型的暴力美學時代
1 - Transformer革命:全局註意力如何重塑AI認知 034
? 文字的蛻變:從文本到序列的音樂之旅 035
? Transformer架構:編碼器與解碼器的協同 037
? 全局註意力機制:AI的“全景信息篩” 037
? 多頭註意力機制:AI的“多聲部合唱” 038
? 並行化革命:從“流水線”到“交響樂團” 039
2 - 架構裂變:編碼器–解碼器的分合之道 040
? 傳統架構:編碼器與解碼器的協作 040
? BERT:純編碼器架構的全局視角觀察家(專註於“看”) 041
? GPT:純解碼器架構的內容生成創作家(專註於“寫”) 042
? 需求驅動的大模型架構演進之路 044
3 - 暴力美學:Scaling Law揭示的效果密碼 044
? 滾雪球的啟示:Scaling Law的奧秘 045
? 雪球效應的三大驅動引擎 045
? 暴力美學的工程實踐 047
? 知識刻入“參數”的過程揭秘 047
4 - 中文突圍:文心大模型的實體掩碼創新 050
? 實體掩碼:AI理解中文的破冰之旅 051
? 實體掩碼技術的設計原理 051
? 像玩樂高一樣玩轉實體掩碼技術 052
? 創新突破:從“填鴨式學習”到“啟發式教學” 053
? 實戰案例:技術概念到落地應用的跨越 054
5 - 底層優化:GPU+CUDA的硬件加速體系構建 055
? GPU:AI時代的“工業引擎” 056
? CUDA:算力世界的“操作系統” 058
? 算力背後的 競賽 059
? 打破壟斷的“安卓式”突圍 060
? 硬件體系技術細節深度解讀 060
第三篇:DeepSeek開啟的效率美學新紀元
1 - DeepSeek的創新之路:重塑AI效率美學 066
2 - 出圈之作:開源的推理大模型R1 069
? R1:開源推理大模型的曙光 069
? R1 的AI技術突破 070
? R1探索的用戶體驗創新 071
? R1帶來的成本全面降低 071
3 - 盤點R1的主要創新技術 072
? 架構優化:多頭潛在註意力(MLA)機制 072
? 訓練革命:多模型多階段聯合訓練的進階之路 076
? 算法進化:混合專家架構MoE的效率躍升 081
? 工程突破:多令牌預測MTP提升性能 085
? 底層切入:PTX級編程為降低算力門檻提供了新思路 088
4 - 開源戰略:加速AI生態的全新洗牌 091
? 開源戰略:技術普惠的催化劑 091
? 開源戰略對AI生態的影響 092
? 開源戰略對 科技發展格局的影響 093
? 開源戰略對產業盈利模式的影響 093
? 開源生態的指數級效應 094
第四篇:DeepSeek提示詞高階實戰新策略
1 - 一個操作,真正用上R1大模型 098
? 使用官網問答 099
? 使用第三方平臺問答 101
2 - 兩類模型,秒懂提示詞策略的進階使用 104
? CoT詳解 105
? CoT成為了兩類大模型的能力邊界 107
? 通用大模型的提示詞工程策略 108
? 推理大模型的提示詞工程策略 118
3 - 三條指令,瞬間提升AI回覆質量 123
? 指令一:哪裏不對改哪裏 124
? 指令二:反問提問 129
? 指令三:給出參考案例 133
4 - 四步流程,打造文案類任務 公式 158
5 - 五種方式,DeepSeek聯用其他工具 160
6 - 六項措施,減輕推理大模型幻覺 161
? “幻覺”問題如何降低? 161
? 高階指南 163
7 - 七大誤區,跳出AI使用的常見陷阱 163
? 誤區一:把AI工具當搜索引擎使用 163
? 誤區二:給通用模型的指令太過簡單 164
? 誤區三:給推理模型加入太多限制條件 164
? 誤區四:過度依賴AI工具,陷入成長陷阱 164
? 誤區五:對嘗試新工具上癮,陷入效率陷阱 164
? 誤區六:簡單問題覆雜化,陷入“必須AI”陷阱 165
? 誤區七:工具應用單一化,陷入局部視野陷阱 165
第五篇:倍速到來的AI產業新未來
1 - 企業落地範式:DeepSeek 推動從“+AI”到“AI+”
的路徑轉換 170
? 從“+AI”到“AI+”:一場認知的顛覆 170
? 是否要進行企業級的“AI+”重構:一場理性的抉擇 171
? 如何進行企業級的“AI+”重構:一場智慧的布局 172
2 - 行業盈利方式:DeepSeek 的 AI 企業模型開源應
用免費整體發展趨勢 173
? DeepSeek給行業帶來的鮎魚效應 174
? 現有的大型軟硬件生態盈利模式分析 174
? DeepSeek生態中的三類企業及其盈利模式分析 175
? 圍繞DeepSeek可能出現的盈利形式分析 176
3 - 產業生態模式:以 DeepSeek 為中心的軟硬件生態加速完善 179
? 第三方雲服務平臺:全面上線DeepSeek大模型 179
? 第三方應用平臺:各類應用全面接入DeepSeek-R1模型 180
? 硬件廠商:國產算力硬件服務商的崛起 180
? 智能化終端:邊緣計算賦能各種穿戴場景 181
? 生態構建模式:參與者自發主動的生態進化 182
4 - 創業可能形式:DeepSeek拉平多元市場主體起跑線182
? 安全標準提升:智能安全與安全智能需求激增 183
? 企業級服務普及:私有化部署服務成為新標準 185
? 消費級應用成為AI創業主戰場 187