不只是 CUDA，通用 GPU 程式模型及架構原理

景乃鋒, 柯晶, 梁曉嶢編著

出版商: 深智
出版日期: 2023-05-20
定價: $780
售價: 7.9 折 $616
語言: 繁體中文
頁數: 384
ISBN: 6267273385
ISBN-13: 9786267273388
相關分類: CUDA
此書翻譯自: 通用圖形處理器設計 — GPGPU 編程模型與架構原理

立即出貨(限量) (庫存=4)

買這商品的人也買了...

~~$894~~ $849

CUDA 並行程序設計 : GPU 編程指南 (CUDA Programming: A Developer's Guide to Parallel Computing with GPUs)
$469

CUDA C 編程權威指南 (Professional CUDA C Programming)
~~$360~~ $306

MIS 一定要懂的 82個網路技術知識
$299

深入淺出 SSD：固態存儲核心技術、原理與實戰
~~$300~~ $270

電路板基礎技術手札
~~$490~~ $441

電路板技術與應用彙編
~~$690~~ $621

電路板組裝技術與應用
~~$630~~ $567

電子構裝技術與應用
~~$1,074~~ $1,020

基於 CUDA 的 GPU 並行程序開發指南 (GPU Parallel Program Development Using CUDA)
~~$880~~ $695

大師養成起手式：從核心真正了解 Linux 運作原理
~~$520~~ $468

高科技廠務, 5/e
~~$714~~ $678

UEFI 編程實踐
~~$1,000~~ $790

超越多顯卡多機器：分散式機器學習超速實戰
~~$1,000~~ $790

AI 硬體專屬晶片：最新技術未來創新發展
~~$479~~ $455

GPU 編程實戰 : 基於 Python 和 CUDA (Hands-On GPU Programming with Python and CUDA: Boost your application's performance and productivity with CUDA: Explore high-performance parallel computing with CUDA)
~~$834~~ $792

並行計算與高性能計算
~~$750~~ $592

AMD, Intel, Arm 在戰什麼？一本書輕鬆看懂 CPU 原理
~~$880~~ $695

從硬體到 APP 層級 – IT 系統全平台完整監控
~~$680~~ $537

一本精通 - OpenCV 與 AI 影像辨識
~~$594~~ $564

AI 加速器架構設計與實現圖書
~~$1,280~~ $1,011

萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰
~~$880~~ $748

跟 NVIDIA 學深度學習！從基本神經網路到 ......、GPT、BERT...，紮穩機器視覺與大型語言模型 (LLM) 的建模基礎
~~$1,050~~ $997

PCI Express 體系結構導讀, 2/e
~~$774~~ $735

算力芯片 — 高性能 CPU / GPU / NPU 微架構分析
$606

CUDA 並行編程與性能優化

商品描述

人工智慧的基礎
深度學習的基石

了解GPGPU，加速您的想像力！！

　　當今科技快速發展，人工智慧、機器學習和資料分析等領域的運用已經深入到生活中。作為這些技術的重要基石，GPGPU（General Purpose Graphics Processing Unit，通
用圖形處理器）技術在硬體設計和軟體開發中扮演著關鍵角色，也使得掌握GPGPU技術及其架構，對於了解與推動相關領域的進一步發展十分重要。
　　本書試圖從架構的方式，讓讀者理解 GPGPU 的系統特點，並思考其架構設計的重點與發展方向。不僅有軟體部分，也包含硬體架構的介紹、相關工具以及如何增進效率的
技術討論。而每篇還有論文的引用、分析、討論、介紹，並於每章節附加參考文獻，幫助讀者有方向額外研究。

博客來網路書店製 20210205

【章節簡介】
　　■ 第 1 章GPGPU 概述：
　　　著重介紹GPGPU 與CPU 系統結構上的差異和現代GPGPU 產品的特點。
　　■ 第 2 章GPGPU 程式設計模型：
　　　介紹GPGPU 程式設計模型的核心概念，勾勒出GPGPU 異質計算的設計要點。
　　■ 第 3 章GPGPU 控制核心架構：
　　　對GPGPU 指令管線和關鍵控制元件的原理進行分析和介紹，並深入探討GPGPU 架構的瓶頸問題和最佳化方法。
　　■ 第 4 章GPGPU 儲存架構：
　　　對GPGPU 多樣的層次化記憶體介紹，重點探討單晶片記憶體的設計和最佳化方法。
　　■ 第 5 章GPGPU 運算單元架構：
　　　介紹數值表示和通用運算核心的設計。
　　■ 第 6 章GPGPU 張量核心架構：
　　　對專門為人工智慧加速而設計的張量核心架構展開分析與介紹，揭示GPGPU 對深度學習進行硬體加速的基本原理。在先前架構原理、設計方法的探討中，本書還著重介紹
國際前端的研究成果，力圖解釋設計背後的挑戰，促讓讀者更深入地思考GPGPU 架構設計的核心要素問題。
　　■ 第 7 章複習與展望：
　　　對全書內容進行複習，並對GPGPU 發展進行展望。
【本書適合讀者】
　　．資工、資訊科學，或電腦相關科系的大學生、研究生。
　　．相關領域的工程師、研究人員。
　　．想要了解 GPGPU 如何運作者。

作者簡介

景乃鋒
上海交通大學電子資訊與電氣工程學院的副研究員和博士生導師。他的主要研究方向是電腦體系結構、積體電路晶片設計和軟硬體協同設計。他已經發表了80多篇學術論文，其
中在GPGPU 體系結構領域發表多篇高水準學術論文。他還主持和研究多項中國國家級重大科研項目和課題，申請中國國家發明專利40餘項，獲授權6項。

柯晶
上海交通大學電子資訊與電氣工程學院的助理研究員和碩士生導師，澳大利亞新南威爾士大學電腦學院聯席講師。她曾在著名GPU廠商S3 Graphics和AMD任軟體架構工程師數年
，目前主要研究領域是電腦輔助大規模醫學圖像診斷。她以第一作者和通訊作者在重要國際期刊和會議上發表了30多篇論文，並主持和參與多項中國國家級科研專案。

梁曉嶢
上海交通大學電子資訊與電氣工程學院的教授、博士生導師和學科帶頭人。他畢業於美國哈佛大學並獲得博士學位。他的研究方向包括電腦體系結構、積體電路設計、通用圖形
處理器和人工智慧晶片架構等。他已經發表了百餘篇學術論文，包括在國際學術會議ISCA、MICRO、HPCA、ISSCC、DAC、ICCAD等上的文章。其中2篇入選計算機體系結構年度最佳論
文(IEEE MICRO TOP PICKS)。