реклама
Новости Hardware

ИИ обойдётся без Nvidia: Amazon выпустила системы на чипах Trainium2, а через год выйдут Trainium3

Подразделение Amazon Web Services (AWS) компании Amazon объявило на проводимой им конференции re:Invent, что клиенты её облачной платформы теперь могут пользоваться системами с ускорителями Trainium2, предназначенными для обучения и запуска больших языковых моделей искусственного интеллекта.

 Источник изображения: aws.amazon.com

Источник изображения: aws.amazon.com

Представленные в прошлом году чипы работают в четыре раза быстрее предшественников: один инстанс EC2 с 16 ускорителями Trainium2 предлагает производительность до 20,8 Пфлопс. Это значит, что при развёртывании масштабной модели Meta Llama 405B на платформе Amazon Bedrock клиент получит «трёхкратный прирост скорости генерации токенов по сравнению с другими доступными предложениями крупных облачных провайдеров». Можно будет также выбрать систему EC2 Trn2 UltraServer с 64 ускорителями Trainium2 и производительностью 83,2 Пфлопс. Отмечается, что показатель 20,8 Пфлопс относится к плотным моделям и точности FP8, а 83,2 Пфлопс — к разреженным моделям и FP8. Для связи между ускорителями в системах UltraServer используется интерконнект NeuronLink.

Совместно со своим партнёром в лице Anthropic, основным конкурентов OpenAI в области больших языковых моделей, AWS намеревается построить крупный кластер систем UltraServer с «сотнями тысяч чипов Trainium2», где стартап сможет обучать свои модели. Он будет в пять раз мощнее кластера, на котором Anthropic обучала модели текущего поколения — по оценке AWS, он «станет крупнейшим в мире вычислительным кластером для ИИ, о котором сообщалось до настоящего времени». Проект поможет компании превзойти показатели, которые обеспечиваются актуальными ускорителями Nvidia, которые по-прежнему пользуются высоким спросом и остаются в дефиците. Хотя в начале следующего года Nvidia готовится запустить ускорители нового поколения Blackwell, которые при 72 чипах на стойку предложат до 720 Пфлопс для FP8.

Возможно, поэтому AWS уже сейчас анонсировала ускорители нового поколения Trainium3, которые предлагают ещё один четырёхкратный прирост производительности для систем UltraServer — ускорители будут производиться с использованием техпроцесса 3 нм, а их развёртывание начнётся в конце 2025 года. Потребность в системах нового поколения в компании обосновали тем, что современные модели ИИ по масштабам подходят к триллионам параметров. Инстансы Trn2 пока доступны только в регионе US East инфраструктуры AWS, но скоро появятся и в других; системы UltraServer в настоящее время работают в режиме предварительного доступа.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
«Выглядит отвратительно, я готов»: в открытый доступ попали 6 минут геймплея и новые скриншоты Half-Life 2 RTX 34 мин.
Разработчики Kingdom Come: Deliverance 2 подтвердили релиз в GOG — игра выйдет без DRM-защиты, но с задержкой 3 ч.
Трамп обвалил рынок криптовалют, забыв о них на инаугурации и в первых указах 3 ч.
У Nvidia закончились игровые видеокарты в облаке 3 ч.
Российское ПО не удовлетворяет 63 % айтишников по части совместимости с другим софтом 4 ч.
Олдскульная стратегия Tempest Rising в духе Command & Conquer стала доступна для предзаказа в российском Steam и обзавелась временной демоверсией 4 ч.
Золотой век наступил раньше времени: разработка Sid Meier’s Civilization VII официально завершена 4 ч.
«Мечты сбываются»: амбициозный мод GTA: Vice City Nextgen Edition на движке от GTA IV наконец получил точную дату выхода 5 ч.
RuStore стал вторым самым популярным магазином Android-приложений в России 5 ч.
«Начало новой эры»: Marvel Snap возобновила работу в США после разблокировки TikTok и готовится к переменам 7 ч.
Microsoft ввязалась в выпуск чужих квантовых компьютеров — это будут лучшие системы на рынке 21 мин.
Цена бренда Tesla рухнула на $15 млрд в прошлом году — виноват Илон Маск и устаревший модельный ряд 2 ч.
Amazon снова стала крупнейшим в мире корпоративным покупателем возобновляемой энергии в 2024 году 3 ч.
Учёные отказали частицам тёмной материи в возможности быть сверхтяжёлыми 4 ч.
Спецслужбы США и ЕС: причиной обрывов кабелей в Балтийском море стали не диверсии, а низкая квалификация экипажей 4 ч.
Seagate начала поставки HAMR-дисков Exos M вместимостью 36 Тбайт 4 ч.
Трамп отменил принудительный перевод США на электромобили 4 ч.
AAEON выпустила плату Boxer-8654AI-Kit на базе NVIDIA Jetson Orin NX 4 ч.
Huawei стала помогать клиентам внедрять ИИ-ускорители Ascend, чтобы отвоевать рынок у Nvidia 4 ч.
Huawei показала взрывной рост и стала вторым брендом смартфонов в Китае — Apple быстрее всех теряет рынок 5 ч.