實戰大模型 從對齊技術到系統治理
楊哲 趙治斌
- 出版商: 機械工業
- 出版日期: 2026-04-01
- 售價: $474
- 語言: 簡體中文
- ISBN: 7111807421
- ISBN-13: 9787111807421
-
相關分類:
Large language model
下單後立即進貨 (約4週~6週)
商品描述
本書系統梳理了大語言模型(LLM,簡稱大模型)在安全治理與行為對齊方面的核心原理、關鍵技術與工程實踐路徑,聚焦構建可信、可控的大模型人工智能系統,以應對當前生成式AI 在安全性、合規性和產業落地中的重大挑戰。本書共分為10 章,圍繞模型風險識別、語義行為對齊、內容生成管控、訓練數據治理、系統級防護、安全評估指標、合規審查流程與行業解決方案八大技術主線,構建出一套完整的大模型安全體系。全書首先深入剖析大模型在語義安全、系統防護、行為不可預測性等方面的挑戰,系統介紹監督微調、RLHF、Constitutional AI 等對齊技術,幵結合內容安全機制與訓練數據治理提供工程實現路徑。隨後,聚焦模型推理部署的系統安全,覆蓋權限控制、日誌審計、接口隔離、倫理合規等維度,強調“可控性”在工業場景下的實現策略。 聚焦安全評估工具鏈、開源平臺實踐,以及在教育、醫療、法律等高敏行業中的落地方案,為構建可信賴的AI 系統提供工程藍圖。本書兼具系統性與實戰性,既有對前沿理論方法的深入剖析,又涵蓋可覆制的工程實現路徑,同時,隨書贈送案例代碼、授課用PPT 等學習資源(掃封底二維碼獲取),適合從事人工智能研發、安全工程、合規治理與技術管理的科研人員、工程師、企業技術負責人及政策制定者參考閱讀。
作者簡介
楊哲超現任蘇州映谷科技有限公司副總裁,曾任中國電信研究院AI研發中心副主任、阿裏雲 產品專家、微軟亞太研發集團技術經理。曾 中國電信大模型安全評測平臺研發, 公安智能決策系統等項目,研究成果覆蓋通信、雲計算及政企核心場景,兼具戰略研發與行業落地影響力。趙治斌中國計算機學會 會員、 “ 物聯網工程師”、全國職業院校技能大賽裁判員。從事人工智能教學教研二十餘年,專註大模型技術與AI安全研究,主持省市級課題12項,發表論文10篇。
