破解人機共存密碼——人類最後一個大問題 Human Compatible: Artificial Intelligence and the Problem of Control
Stuart Russell 張羿
- 出版商: 中信出版社
- 出版日期: 2026-04-01
- 售價: $528
- 語言: 簡體中文
- ISBN: 7521711963
- ISBN-13: 9787521711967
-
相關分類:
Reinforcement
- 此書翻譯自: Human Compatible: Artificial Intelligence and the Problem of Control
下單後立即進貨 (約4週~6週)
商品描述
這本書重點闡述了“AI的控制問題”:如何破解人機共存密碼,掌控比我們強大得多的智能,讓AI獲得新生?智能是一種權力,我們能否控制智能,決定了我們未來的命運。
在這本書中,AI領域的“標準教科書”作者斯圖爾特·羅素提出革命性的範式轉換:“可證明有益的AI”。其核心不是給AI設定更精確的目標,而是植入“謙遜”——讓機器深知自己不知道人類真正想要什麼。
通過逆強化學習,AI從人類行為中反推真實意圖,在指令模糊時征詢許可,在價值沖突時允許被關機。這是一種基於不確定性的人機協作新秩序:機器的唯一使命是輔助人類實現覆雜、多變甚至矛盾的價值偏好。從致命性自主武器到信息繭房的算法操控,羅素展示了如何將“人類兼容”這一理念轉化為可證明的工程實踐,並提出了構建“有益的AI”的三大原則。
這本書不僅是數學上的安全論證,而且是文明存續的哲學重構。掌控超級智能的終極密碼,不在於我們更嚴密地發號施令,而在於讓機器保持對人性深淵的永久敬畏。
————————————
這是我在相當長的一段時間以來,讀到的非常重要的一本書。它清晰地解釋了超級人工智能時代的到來如何威脅到人類的控制權。至關重要的是,這本書還提出了一個新穎的解決方案,以及我們應該存有希望的原因。
——丹尼爾 ·卡尼曼(Daniel Kahneman)
諾貝爾經濟學獎得主,《思考,快與慢》作者
與那些未來學家和警告人工智能風險的人不同,羅素是一位人工智能領域的專家。這本書比其他我所知的書更能教導公眾,而且讀起來令人愉快、振奮人心。
——朱迪亞·珀爾(Judea Pearl)
貝葉斯網絡之父,2011 年圖靈獎得主
這本文筆優美的書解決了人類面臨的一項基礎性挑戰:越來越智能的機器會按照我們的要求行事,卻不會按照我們的本意行事。如果你關心我們的未來,請務必閱讀。
——約書亞·本吉奧(Yoshua Bengio)
2019 年圖靈獎得主
這是一場由人工智能先驅羅素帶來的智識之旅。羅素不僅以引人入勝且有說服力的方式解釋了人工智能帶來的風險,而且給出了一種切實可行的解決方案。
——邁克斯·泰格馬克(Max Tegmark)
未來生命研究所創始人
這本關於人工智能未來風險和解決方案的書值得一讀,作者羅素很棒!
——埃隆·馬斯克(Elon Musk)
特斯拉創始人
作者簡介
斯圖爾特·羅素(Stuart Russell)
· 加州大學伯克利分校計算機科學家,人類兼容人工智能中心(CHAI)主任,人工智能研究實驗室(BAIR)指導委員會成員。
· 世界經濟論壇人工智能和機器人委員會副主席,美國科學促進會(AAAS)會士,美國人工智能協會(AAAI)會士。
· 曾與谷歌研究總監彼得·諾維格合著,出版了人工智能領域裏的“標準教科書”《人工智能》,該書被128個國家的1400多所大學使用。
· 獲得過多項科學榮譽,包括美國國家科學基金會總統青年研究員獎、國際人工智能聯合會議(IJCAI)計算機與思想獎、國際計算機學會(ACM)卡爾斯特朗傑出教育家獎等,並受邀在TED、世界經濟論壇演講。
目錄大綱
前言 //V
01 如果我們成功了
我們如何走到今天? //006 接下來會發生什麼? //008 出了什麼問題? //010 我們能解決嗎? //013
02 人類和機器的智能
智能 //017 計算機 //035 智能計算機 //043
03 人工智能在未來會如何發展?
近未來 //067 超級人工智能何時到來? //080 概念上的突破即將到來 //082 想象一臺超級智能機器 //095 超級智能的局限 //098 人工智能如何造福人類? //100
04 人工智能的濫用
監督、勸導和控制 //107 致命性自主武器 //113 篡奪其他人類角色 //127
05 過於智能的人工智能
大猩猩問題 //137 邁達斯國王問題 //141 恐懼與貪婪:工具性目標 //145 智能爆炸 //147
06 不那麼偉大的人工智能辯論
否認 //154 轉移話題 //162 部落主義 //166 難道我們不能…… //168
辯論重新開始 //176
07 人工智能:一種不同的方法
有益機器的原則 //182 樂觀的理由 //188 謹慎的理由 //190
08 可證明有益的人工智能
數學保證 //197 從行為中學習偏好 //202 輔助博弈 //205 要求和指示 //215 “主動嗑電” //218 遞歸式自我完善 //220
09 覆雜的難題:我們
不同的人 //227 許多人 //229 善良的、可惡的、愛嫉妒的人類 //242 愚蠢的、情緒化的人類 //247 人類真的有偏好嗎? //250
10 問題解決了嗎?
有益的機器 //263 對人工智能的治理 //265 濫用 //269 衰弱與人類自主 //270
附錄 A尋找解決方案 //273
附錄 B知識與邏輯 //283
附錄 C不確定性和概率論 //289
附錄 D從經驗中學習 //301
後 記 //313
致謝 //339
註釋 //341
圖片版權 //387
