Categories: Книги

[Jee Choi, Hyesoon Kim, Richard Vuduc, Sara Baghsorkhi, Morgan & Claypool Publishers] Performance Analysis and Tuning for General Purpose Graphics Processing Units (GPGPU)

Описание книги:

General-purpose graphics processing units (GPGPU) have emerged as an important class of shared memory parallel processing architectures, with widespread deployment in every computer class from high-end supercomputers to embedded mobile platforms. Relative to more traditional multicore systems of today, GPGPUs have distinctly higher degrees of hardware multithreading (hundreds of hardware thread contexts vs. tens), a return to wide vector units (several tens vs. 1-10), memory architectures that deliver higher peak memory bandwidth (hundreds of gigabytes per second vs. tens), and smaller caches/scratchpad memories (less than 1 megabyte vs. 1-10 megabytes).

In this book, we provide a high-level overview of current GPGPU architectures and programming models. We review the principles that are used in previous shared memory parallel platforms, focusing on recent results in both the theory and practice of parallel algorithms, and suggest a connection to GPGPU platforms. We aim to provide hints to architects about understanding algorithm aspect to GPGPU. We also provide detailed performance analysis and guide optimizations from high-level algorithms to low-level instruction level optimizations. As a case study, we use n-body particle simulations known as the fast multipole method (FMM) as an example. We also briefly survey the state-of-the-art in GPU performance analysis tools and techniques.

Table of Contents: GPU Design, Programming, and Trends / Performance Principles / From Principles to Practice: Analysis and Tuning / Using Detailed Performance Analysis to Guide Optimization


Нравится0

Не нравится0

openssource

Recent Posts

SEO & SMM [Антон Маркин] Слив курса Желудь

  ОПИСАНИЕ: Слив курса Желудь [Антон Маркин] SEO как дремучий лес, где каждый второй уже…

2 недели ago

SEO & SMM [Денис Марков] Приватка Traffic Lab. Закрытый канал по УБТ трафику (2025)

ОПИСАНИЕ:Слив курса Приватка Traffic Lab. Закрытый канал по УБТ трафику [Денис Марков]Программа:1. Связка на гемблинг…

2 недели ago

Бизнес [Anton Voroniuk] [Udemy] Сила ИИ-аватаров с HeyGen (2025)

ОПИСАНИЕ:Слив курса Сила ИИ-аватаров с HeyGen [udemy] [Anton Voroniuk]$p65e0759c3d33e Язык курса английский + русскую аудиодорожку…

2 недели ago

Бизнес [Аяз Шабутдинов] Последняя лекция. Месяц 4 (2025)

ОПИСАНИЕ:Слив курса Последняя лекция (месяц 4) [Аяз Шабутдинов]Если завтра меня не станет, то какими были…

2 недели ago

Бизнес [Дмитрий Зверев] Книга по картинкам и фото в нейросетях 3.0 (2025)

ОПИСАНИЕ:Слив курса Книга по картинкам и фото в нейросетях 3.0 [Дмитрий Зверев]Этот инфопродукт специально для…

2 недели ago

Бизнес [Александр Садеков] Освой самые мощные нейросети 2025 года (2025)

ОПИСАНИЕ:Слив курса Освой самые мощные нейросети 2025 года [Александр Садеков]Без кода и знаний программированияКлуб для…

2 недели ago

This website uses cookies.