破解人機共存密碼——人類最後一個大問題 Human Compatible: Artificial Intelligence and the Problem of Control

Name: 破解人機共存密碼——人類最後一個大問題
Price: 528 TWD
Availability: OnlineOnly
Author: Stuart Russell
ISBN: 7521711963

Stuart Russell 張羿

出版商: 中信出版社
出版日期: 2026-04-01
售價: $528
語言: 簡體中文
ISBN: 7521711963
ISBN-13: 9787521711967
相關分類: Reinforcement
此書翻譯自: Human Compatible: Artificial Intelligence and the Problem of Control

下單後立即進貨 (約2週~3週)

商品描述

這本書重點闡述了“AI的控制問題”：如何破解人機共存密碼，掌控比我們強大得多的智能，讓AI獲得新生？智能是一種權力，我們能否控制智能，決定了我們未來的命運。

在這本書中，AI領域的“標準教科書”作者斯圖爾特·羅素提出革命性的範式轉換：“可證明有益的AI”。其核心不是給AI設定更精確的目標，而是植入“謙遜”——讓機器深知自己不知道人類真正想要什麼。

通過逆強化學習，AI從人類行為中反推真實意圖，在指令模糊時征詢許可，在價值沖突時允許被關機。這是一種基於不確定性的人機協作新秩序：機器的唯一使命是輔助人類實現覆雜、多變甚至矛盾的價值偏好。從致命性自主武器到信息繭房的算法操控，羅素展示了如何將“人類兼容”這一理念轉化為可證明的工程實踐，並提出了構建“有益的AI”的三大原則。

這本書不僅是數學上的安全論證，而且是文明存續的哲學重構。掌控超級智能的終極密碼，不在於我們更嚴密地發號施令，而在於讓機器保持對人性深淵的永久敬畏。

————————————

這是我在相當長的一段時間以來，讀到的非常重要的一本書。它清晰地解釋了超級人工智能時代的到來如何威脅到人類的控制權。至關重要的是，這本書還提出了一個新穎的解決方案，以及我們應該存有希望的原因。

——丹尼爾 ·卡尼曼（Daniel Kahneman）

諾貝爾經濟學獎得主，《思考，快與慢》作者

與那些未來學家和警告人工智能風險的人不同，羅素是一位人工智能領域的專家。這本書比其他我所知的書更能教導公眾，而且讀起來令人愉快、振奮人心。

——朱迪亞·珀爾（Judea Pearl）

貝葉斯網絡之父，2011 年圖靈獎得主

這本文筆優美的書解決了人類面臨的一項基礎性挑戰：越來越智能的機器會按照我們的要求行事，卻不會按照我們的本意行事。如果你關心我們的未來，請務必閱讀。

——約書亞·本吉奧（Yoshua Bengio）

2019 年圖靈獎得主

這是一場由人工智能先驅羅素帶來的智識之旅。羅素不僅以引人入勝且有說服力的方式解釋了人工智能帶來的風險，而且給出了一種切實可行的解決方案。

——邁克斯·泰格馬克（Max Tegmark）

未來生命研究所創始人

這本關於人工智能未來風險和解決方案的書值得一讀，作者羅素很棒！

——埃隆·馬斯克（Elon Musk）

特斯拉創始人

作者簡介

斯圖爾特·羅素（Stuart Russell）

· 加州大學伯克利分校計算機科學家，人類兼容人工智能中心（CHAI）主任，人工智能研究實驗室（BAIR）指導委員會成員。

· 世界經濟論壇人工智能和機器人委員會副主席，美國科學促進會（AAAS）會士，美國人工智能協會（AAAI）會士。

· 曾與谷歌研究總監彼得·諾維格合著，出版了人工智能領域裏的“標準教科書”《人工智能》，該書被128個國家的1400多所大學使用。

· 獲得過多項科學榮譽，包括美國國家科學基金會總統青年研究員獎、國際人工智能聯合會議（IJCAI）計算機與思想獎、國際計算機學會（ACM）卡爾斯特朗傑出教育家獎等，並受邀在TED、世界經濟論壇演講。

目錄大綱

前言 //V
01 如果我們成功了
我們如何走到今天？ //006 接下來會發生什麼？ //008 出了什麼問題？ //010 我們能解決嗎？ //013
02 人類和機器的智能
智能 //017 計算機 //035 智能計算機 //043
03 人工智能在未來會如何發展？
近未來 //067 超級人工智能何時到來？ //080 概念上的突破即將到來 //082 想象一臺超級智能機器 //095 超級智能的局限 //098 人工智能如何造福人類？ //100
04 人工智能的濫用
監督、勸導和控制 //107 致命性自主武器 //113 篡奪其他人類角色 //127
05 過於智能的人工智能
大猩猩問題 //137 邁達斯國王問題 //141 恐懼與貪婪：工具性目標 //145 智能爆炸 //147
06 不那麼偉大的人工智能辯論
否認 //154 轉移話題 //162 部落主義 //166 難道我們不能…… //168
辯論重新開始 //176
07 人工智能：一種不同的方法
有益機器的原則 //182 樂觀的理由 //188 謹慎的理由 //190
08 可證明有益的人工智能
數學保證 //197 從行為中學習偏好 //202 輔助博弈 //205 要求和指示 //215 “主動嗑電” //218 遞歸式自我完善 //220
09 覆雜的難題：我們
不同的人 //227 許多人 //229 善良的、可惡的、愛嫉妒的人類 //242 愚蠢的、情緒化的人類 //247 人類真的有偏好嗎？ //250
10 問題解決了嗎？
有益的機器 //263 對人工智能的治理 //265 濫用 //269 衰弱與人類自主 //270
附錄 A尋找解決方案 //273
附錄 B知識與邏輯 //283
附錄 C不確定性和概率論 //289
附錄 D從經驗中學習 //301
後記 //313
致謝 //339
註釋 //341
圖片版權 //387

破解人機共存密碼——人類最後一個大問題 Human Compatible: Artificial Intelligence and the Problem of Control

Stuart Russell 張羿

商品描述

作者簡介

目錄大綱

類似商品