реклама
Теги → intel gaudi2

ИИ-ускоритель Intel Gaudi2 оказался на 55 % быстрее Nvidia H100 в тестах Stable Diffusion 3, но есть нюанс

Компания Stability AI, разработчик популярной модели генеративного ИИ Stable Diffusion, сравнила производительность модели Stable Diffusion 3 на популярных ускорителях вычислений для центров обработки данных, включая Nvidia H100 Hopper, A100 Ampere и Intel Gaudi2. По утверждению Stability AI, Intel Gaudi2 продемонстрировал производительность примерно на 56 % выше, чем Nvidia H100.

 Источник изображения: Intel

Источник изображения: Intel

В отличие от H100, который представляет собой суперскалярный графический процессор с тензорными CUDA-ядрами, Gaudi2 специально спроектирован для ускорения генеративного ИИ и больших языковых моделей (LLM). В тестах приняли участие пары кластеров, которые в сумме обеспечивали по 16 тех или ускорителей, а проводились тесты с постоянным размером батча (число тренировочных объектов) в 16 на каждый ускоритель (всего 256). Системы на Intel Gaudi2 оказались способны генерировать 927 изображений в секунду по сравнению с 595 изображениями для ускорителей H100 и 381 изображением в секунду для массива A100.

 Источник изображения: Stability AI

Источник изображения: Stability AI

При увеличении количества кластеров до 32, а числа ускорителей до 256 и размере батча 16 на ускоритель (общий размер 4096), массив Gaudi2 генерирует 12 654 изображения в секунду или 49,4 изображения в секунду на ускоритель, по сравнению с 3992 изображениями в секунду или 15,6 изображениями в секунду на устройство у массива A100 Ampere.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Необходимо отметить, что производительность ускорителей ИИ измерялась с использованием фреймворка PyTorch, а в случае применения оптимизации TensorRT чипы A100 создают изображения до 40 % быстрее, чем Gaudi2. Тем не менее, исследователи Stability AI ожидают, что при дальнейшей оптимизации Gaudi2 превзойдёт A100. Компания полагает, что более быстрый интерконнект и больший объем памяти (96 Гбайт) делают решения Intel вполне конкурентоспособными и планирует использовать ускорители Gaudi2 в Stability Cloud.

 Источник изображения: techpowerup.com

Источник изображения: techpowerup.com

По сообщению Stability AI, в более ранних тестах модели Stable Diffusion XL с использованием фреймворка PyTorch ускоритель Intel Gaudi2 генерирует при 30 шагах изображение размером 1024 × 1024 за 3,2 секунды по сравнению с 3,6 секунды для PyTorch на Nvidia A100 и 2,7 секунды при использовании оптимизации TensorRT на Nvidia А100.

window-new
Soft
Hard
Тренды 🔥
FromSoftware не бросит однопользовательские игры ради мультиплеерных, хоть сейчас и сосредоточена на Elden Ring Nightreign с The Duskbloods 16 мин.
Трамп отсрочил запрет TikTok в США ещё на 75 дней 48 мин.
Eidos Montreal нацелилась возродить Deus Ex — первые подробности новой игры серии 2 ч.
Microsoft выпустила юбилейные обои для Windows с отсылками к легендарным элементам из прошлого корпорации 4 ч.
Сэм Альтман: GPT-5 задержится, чтобы стать лучше — зато «думающий» ИИ OpenAI o3 выйдет совсем скоро 6 ч.
Режиссёр Elden Ring рассказал, как будет играться The Duskbloods — эксклюзив Nintendo Switch 2 от FromSoftware 6 ч.
В России насчитали уже 134 тысяч блогеров с аудиторией выше 10 тысяч человек 6 ч.
Rutube не смог обогнать замедленный YouTube по популярности в России — это удалось только «VK Видео» 6 ч.
Европа готовится оштрафовать соцсеть X более чем на $1 миллиард 6 ч.
Представлена Midjourney V7 — ИИ-генератор изображений стал идеально понимать запросы и поразил качеством 8 ч.
Из-за новых импортных тарифов стоимость iPhone в США может вырасти до $2300 3 ч.
Honda отправит свои водородные топливные ячейки в космос — сначала на МКС, а потом дальше 3 ч.
Nintendo отложила старт предзаказов Switch 2 в США, чтобы оценить влияние пошлин Трампа 5 ч.
Представлен смартфон Honor 400 Lite с чипом Dimensity 7025-Ultra и 108-Мп камерой 5 ч.
Китай зеркально ответил на пошлины Трампа, обложив товары из США пошлиной в 34 % 6 ч.
Российская компания iRU начала выпускать материнские платы для процессоров AMD и Intel 7 ч.
Тайваньский производитель серверов Wistron инвестирует $50 млн в производство в США на фоне новых тарифов Дональда Трампа 7 ч.
Китайская Loongson анонсировала восьмиядерный процессор для ноутбуков с поддержкой 4K и PCIe 3.0 8 ч.
Испанская Sateliot привлекла €70 млн европейских инвесторов на спутниковый Интернет вещей 8 ч.
Каждый пятый проданный в России в этом году смартфон выпустила Xiaomi, но заработала больше всех Apple 9 ч.