реклама
Новости Hardware

ИИ обойдётся без Nvidia: Amazon выпустила системы на чипах Trainium2, а через год выйдут Trainium3

Подразделение Amazon Web Services (AWS) компании Amazon объявило на проводимой им конференции re:Invent, что клиенты её облачной платформы теперь могут пользоваться системами с ускорителями Trainium2, предназначенными для обучения и запуска больших языковых моделей искусственного интеллекта.

 Источник изображения: aws.amazon.com

Источник изображения: aws.amazon.com

Представленные в прошлом году чипы работают в четыре раза быстрее предшественников: один инстанс EC2 с 16 ускорителями Trainium2 предлагает производительность до 20,8 Пфлопс. Это значит, что при развёртывании масштабной модели Meta Llama 405B на платформе Amazon Bedrock клиент получит «трёхкратный прирост скорости генерации токенов по сравнению с другими доступными предложениями крупных облачных провайдеров». Можно будет также выбрать систему EC2 Trn2 UltraServer с 64 ускорителями Trainium2 и производительностью 83,2 Пфлопс. Отмечается, что показатель 20,8 Пфлопс относится к плотным моделям и точности FP8, а 83,2 Пфлопс — к разреженным моделям и FP8. Для связи между ускорителями в системах UltraServer используется интерконнект NeuronLink.

Совместно со своим партнёром в лице Anthropic, основным конкурентов OpenAI в области больших языковых моделей, AWS намеревается построить крупный кластер систем UltraServer с «сотнями тысяч чипов Trainium2», где стартап сможет обучать свои модели. Он будет в пять раз мощнее кластера, на котором Anthropic обучала модели текущего поколения — по оценке AWS, он «станет крупнейшим в мире вычислительным кластером для ИИ, о котором сообщалось до настоящего времени». Проект поможет компании превзойти показатели, которые обеспечиваются актуальными ускорителями Nvidia, которые по-прежнему пользуются высоким спросом и остаются в дефиците. Хотя в начале следующего года Nvidia готовится запустить ускорители нового поколения Blackwell, которые при 72 чипах на стойку предложат до 720 Пфлопс для FP8.

Возможно, поэтому AWS уже сейчас анонсировала ускорители нового поколения Trainium3, которые предлагают ещё один четырёхкратный прирост производительности для систем UltraServer — ускорители будут производиться с использованием техпроцесса 3 нм, а их развёртывание начнётся в конце 2025 года. Потребность в системах нового поколения в компании обосновали тем, что современные модели ИИ по масштабам подходят к триллионам параметров. Инстансы Trn2 пока доступны только в регионе US East инфраструктуры AWS, но скоро появятся и в других; системы UltraServer в настоящее время работают в режиме предварительного доступа.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Prince of Persia: The Lost Crown выйдет на новых платформах, причём совсем скоро 2 ч.
Сюжетный боевик MindsEye от студии экс-продюсера GTA получил дату выхода и взрывной трейлер — в российском Steam доступен предзаказ 3 ч.
«Корейцы сделали то, что EA не смогли за 10 лет»: симулятор жизни Inzoi стартовал в раннем доступе Steam с «очень положительными» отзывами 4 ч.
38 миллиардов потерянных рун и 58 тысяч побед над финальным боссом: опубликована статистика игроков с тестирования Elden Ring Nightreign 5 ч.
Обнаружен вредоносный загрузчик CoffeeLoader — он прячется от антивирусов на видеокарте и прибегает к другим уловкам 6 ч.
Nintendo раскрыла дату выхода экранизации The Legend of Zelda, но подробности фильма держит в секрете 6 ч.
Россия заняла третье место в мире по объёму вредоносного бот-трафика 7 ч.
Android Auto получила полную поддержку игр для Android, но на ходу они запускаться не будут 8 ч.
Не всё потеряно: студия Nightdive обнадёжила фанатов, заждавшихся новостей о System Shock 3 11 ч.
Разработчики Warhammer 40,000: Space Marine 2 пообещали, что «никто не забрасывает игру» ради Space Marine 3 11 ч.
Запущено производство летающих электрических мотоциклов Jetson One стоимостью $128 000 3 ч.
Google наконец определилась, когда начнёт продажи Pixel 9a 5 ч.
Мобильная GeForce RTX 5090 разочаровала обозревателей слабым ростом производительности относительно RTX 4090 5 ч.
Crusoe привлекла $225 млн на закупку чипов NVIDIA для развития облачной ИИ-инфраструктуры 6 ч.
Разработчик легендарных смарт-часов Pebble раскрыл подробности о новых часах Core 2 Duo и Core Time 2 6 ч.
Разработана перчатка для передачи разных ощущений в виртуальной реальности 7 ч.
Gigabyte выпустила плату B760M Aorus Elite WIFI6E Gen5 с разъёмом PCIe 5.0 x16 и поддержкой Wi-Fi 6E 7 ч.
Public Power Corp (PPC) представила план строительства ЦОД в старых угольных шахтах Греции 8 ч.
Космический телескоп «Гайя» прекратил работу — его пытались выключить с января, но он сопротивлялся 8 ч.
Китайцы готовы обогнать Tesla и Boston Dynamics в наполнении мира человекоподобными роботами 9 ч.