AI訓練師手冊2:DeepSeek+模型訓練+商業應用實操

谷建陽,賈一琦

  • 出版商: 北京大學
  • 出版日期: 2025-11-01
  • 售價: $474
  • 語言: 簡體中文
  • 頁數: 192
  • ISBN: 7301367392
  • ISBN-13: 9787301367391
  • 相關分類: DeepLearning
  • 下單後立即進貨 (約4週~6週)

商品描述

本書是一本全面且系統的 AI 訓練師指南,旨在幫助讀者掌握從基礎理論、常用技能到商業應用的各項 AI 技巧。本書內容沿兩條核心主線展開,為讀者搭建紮實的學習與實踐框架。技能線:全面覆蓋 AI 模型訓練的關鍵技能,從基礎的 AI 入門知識、模型部署、數據獲取、數據標註、模型微調,到進階的語言模型訓練、繪畫模型訓練、語音模型訓練,再到 AI 模型的商業應用,層層遞進,確保讀者能夠系統掌握 AI 訓練的核心功能與應用技巧。案例線:精心設計多個領域的商業應用案例,包括政務、教育、交通、智駕、醫療、法律、金融和農業等,將理論知識融入實際業務場景,提升讀者解決實際問題的能力。本書內容深入淺出,實例豐富多元,適合對 AI 技術感興趣、希望成為 AI 訓練師的初學者,以及人工智能與科技、政務、教育、交通、醫療、金融、法律以及農業等各個領域的從業人員。無論是個人學習提升,還是作為培訓機構和高等院校的教學參考,本書都能提供 的知識支持和實踐指導。

作者簡介

谷建陽,人工智能工程師、算法工程師,AI訓練師,湖南大學計算機專業畢業,在AI深度學習、深層算法、機器學習等方面擁有深厚的理論基礎,能夠全面掌握各種算法和模型的特性,擅長使用TensorFlow、PyTorch等主流深度學習框架進行模型訓練,並能夠根據客戶需求靈活選擇合適的工具和庫進行 化開發。在清華社出版《AI人工智能:發展簡史+技術案例+商業應用》加印13次,在我社出版《AI訓練師手冊:算法與模型訓練從入門到精通》一書,目前首印4000冊,加印3000冊。

賈一琦,本科畢業於加拿大特倫特大學計算機信息系統專業,碩士畢業於北京理工大學軟件工程專業。致力於研究職業教育、校園信息化建設、繼續教育、 交流合作等相關課題。《高職院校 交流與合作現狀研究》課題獲河北省人力資源和社會保障廳三等獎,《大數據時代職業技能人才培養模式路徑研究》課題獲河北省人力資源和社會保障廳一等獎。工作單位:河北軌道運輸職業技術學院。

目錄大綱

CONTENTS
第1篇  AI基礎
第1章  AI入門:認識人工智能模型訓練
1.1 基礎入門:了解人工智能與模型訓練
1.1.1  為什麼要學人工智能
1.1.2  人工智能是如何發展起來的
1.1.3  人工智能的核心邏輯是什麼
1.1.4  什麼是模型,模型是怎麼訓練的
1.1.5  什麼是模型量化與模型蒸餾
1.2 AI大模型:工作邏輯解析
1.2.1  了解GPT模型的工作原理
1.2.2  GPT為什麼能夠獲得成功
1.2.3  AI強化學習解決大模型推理問題
1.2.4  RAG檢索技術解決大模型幻覺問題
1.2.5  神經網絡是AI模型訓練的核心技術
1.2.6  Transformer催生出一切AI大模型
1.3 DeepSeek:探究其特性與應用
1.3.1  DeepSeek為什麼爆火
1.3.2  DeepSeek的6種使用途徑
1.3.3  DeepSeek的邏輯推理能力
1.3.4  DeepSeek的聯網搜索能力
1.3.5  DeepSeek的商業應用案例
本章小結
課後實訓
第2章  模型部署:在本地使用DeepSeek
2.1 模型安裝:DeepSeek本地部署
2.1.1  部署前的準備工作
2.1.2  安裝Python依賴項
2.1.3  下載與安裝Ollama
2.1.4  下載DeepSeek模型
2.1.5  試運行DeepSeek模型
2.1.6  配置Cherry Studio前端界面
2.2 插件部署:DeepSeek擴展應用
2.2.1  安裝Page Assist插件
2.2.2  配置Page Assist插件
2.2.3  測試DeepSeek模型
本章小結
課後實訓
第3章  數據獲取:構建AI模型的知識庫
3.1 數據與模型:看懂AI訓練中的核心關聯
3.1.1  通俗解讀模型訓練中的數據集
3.1.2  獲取公開數據集的常用途徑
3.1.3  生成高質量的模型微調數據集
3.2 搭建知識庫:構建大模型的訓練數據集
3.2.1  下載並安裝AnythingLLM
3.2.2  配置AnythingLLM
3.2.3  上傳私有的訓練數據集
本章小結
課後實訓
第4章  數據標註:引導模型學習提升性能
4.1 數據標註:大模型的“智能基因編輯師”
4.1.1  數據標註的概念與技術原理
4.1.2  數據標註在大模型中的作用
4.2 MakeSense:圖像數據標註實戰指南
4.2.1  選擇打標任務類型
4.2.2  創建和添加自定義標簽
4.2.3  給圖像數據打標
4.2.4  修改標註項目的名稱
4.2.5  導出打標數據文件
本章小結
課後實訓
第5章  模型微調:讓AI訓練效果達到預期
5.1 微調的本質:讓模型“聽懂”領域語言
5.1.1  揭開模型微調的神秘面紗
5.1.2  微調與長文本、知識庫、預訓練的區別
5.1.3  模型微調的工具和基本流程
5.2 OpenAl Platform:GPT模型微調技巧
5.2.1  模型是否真的需要微調
5.2.2  訓練數據準備規範
5.2.3  登錄OpenAl Platform平臺
5.2.4  創建微調模型並上傳訓練數據
5.2.5  模型微調的超參數配置策略
本章小結
課後實訓
第2篇  模型訓練
第6章  語言模型訓練:高效賦能各業務場景
6.1 使用Page Assist訓練DeepSeek
6.1.1  配置文本嵌入模型
6.1.2  創建知識庫
6.1.3  添加提示詞
6.1.4  測試模型效果
6.2 使用Cherry Studio訓練DeepSeek
6.2.1  添加嵌入模型
6.2.2  創建知識庫
6.2.3  添加文件並進行向量化處理
6.2.4  搜索知識庫
6.2.5  引用知識庫生成回覆
本章小結
課後實訓
第7章  繪畫模型訓練:創意生成與視覺設計
7.1 使用SD-Trainer訓練LoRA模型
7.1.1  LoRA模型簡介
7.1.2  安裝SD-Trainer訓練器
7.1.3  準備與整理訓練數據集
7.1.4  使用WD標簽器標註數據
7.1.5  設置底模文件和數據集路徑
7.2 使用Stable Diffusion測試模型效果
7.2.1  部署訓練好的LoRA模型
7.2.2  使用LoRA模型實現文生圖
本章小結
課後實訓
第8章  語音模型訓練:智能聲音克隆與處理
8.1 使用weights訓練語音模型
8.1.1  認識與登錄weights平臺
8.1.2  設置模型的詳細信息
8.1.3  上傳音頻數據集並訓練模型
8.2 使用AI模型克隆聲音制作音樂MV
8.2.1  克隆聲音唱歌
8.2.2  剪輯音頻與視頻素材
8.2.3  智能識別歌詞
本章小結
課後實訓
第3篇  商業應用
第9章  政務與教育:AI賦能治理與教學創新實踐
9.1 政務與教育領域的AI模型訓練要點
9.1.1  數據隱私防護
9.1.2  多模態融合
9.1.3  數據動態脫敏
9.2 政務領域的AI模型訓練商業應用場景
9.2.1  公共服務優化
9.2.2  政務決策支持
9.2.3  城市治理升級
9.3 教育領域的AI模型訓練商業應用場景
9.3.1  個性化學習支持
9.3.2  教學效能提升
9.3.3  教育硬件賦能
本章小結
課後實訓
第10章  交通與智駕:構建安全高效出行解決方案
10.1 交通與智駕領域的AI模型訓練要點
10.1.1  數據安全與合規
10.1.2  模型魯棒性強化
10.1.3  實時性保障方案
10.2 交通領域的AI模型訓練商業應用場景
10.2.1  智能交通管理
10.2.2  智慧出行服務
10.2.3  主動安全防控
10.3 智駕領域的AI模型訓練商業應用場景
10.3.1  感知系統升級
10.3.2  決策規劃突破
10.3.3  仿真測試革新
本章小結
課後實訓
第11章  醫療與法律:重塑精準診療與服務流程
11.1 醫療與法律領域的AI模型訓練要點
11.1.1  數據安全與隱私保護
11.1.2  持續學習機制
11.1.3  邊緣部署優化
11.2 醫療領域的AI模型訓練商業應用場景
11.2.1  臨床診療升級
11.2.2  健康管理創新
11.2.3  醫院管理優化
11.3 法律領域的AI模型訓練商業應用場景
11.3.1  法律文本智能處理
11.3.2  法律研究賦能
11.3.3  企業合規管理
本章小結
課後實訓
第12章  金融與農業:驅動智能決策與產業升級
12.1 金融與農業領域的AI模型訓練要點
12.1.1  數據治理
12.1.2  模型部署與監控
12.1.3  可解釋性突破
12.2 金融領域的AI模型訓練商業應用場景
12.2.1  投資決策智能化
12.2.2  風險管控升級
12.2.3  運營效能提升
12.3 農業領域的AI模型訓練商業應用場景
12.3.1  智能經營管理
12.3.2  資源利用優化
12.3.3  供應鏈創新
本章小結
課後實訓