реклама
Новости Hardware

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
«Станет тем, чем должна была быть The Callisto Protocol»: геймплейный трейлер Cronos: The New Dawn от авторов ремейка Silent Hill 2 заинтриговал игроков 53 мин.
Microsoft позволила Copilot Studio самостоятельно управлять компьютером по заданию пользователя 60 мин.
ИИ помог Google заблокировать более 39 млн подозрительных рекламных аккаунтов 3 ч.
В классическом Outlook обнаружилась ошибка — из-за неё нагрузка на процессор при наборе текста возрастает до 50 % 3 ч.
«Путешествие важнее конечной цели»: ведущий разработчик Skyblivion отреагировал на утечку The Elder Scrolls IV: Oblivion Remastered 5 ч.
Planescape: Torment могла получить сиквел — над ним работали бывшие сценаристы Dragon Age и Fallout: New Vegas 5 ч.
Opera Mini получила ИИ-помощника Aria AI 6 ч.
Orion soft уже заместила 15 % всей бывшей инсталляционной базы VMware на рынке РФ 6 ч.
Шведские учёные обучили ИИ переводу с лошадиного 7 ч.
Похищение Дракулы, интерактивные сны и 35 квестов: сооснователь Warhorse рассказал, что вырезали из Kingdom Come: Deliverance 2 7 ч.
GeForce RTX 5060 Ti поступили в продажу — в России карты за $429 оценили от 55 тыс. рублей 30 мин.
47 дней вместо 398: вскоре срок действия новых SSL/TLS-сертификатов заметно сократится 51 мин.
IBM развернула один из мощнейших в мире квантовых компьютеров — у него 156 кубитов 55 мин.
PQ.Domains от PQ.Hosting, выделенные серверы в Германии и 47-я локация со сверхскоростными VPS 3 ч.
Представлены доступные смартфоны Acer Super ZX и Super ZX Pro, которые на самом деле не Acer 3 ч.
atNorth отдаст тепло ЦОД финскому ретейл-гиганту Kesko 4 ч.
Уникальный суперкомпьютер Anton 3 для задач молекулярной динамики введён в эксплуатацию 5 ч.
Pure Storage анонсировала младшую All-Flash СХД FlashArray//RC20 для периферийных развёртываний 6 ч.
Nvidia раскрыла характеристики мобильной GeForce RTX 5060 — третья часть мобильной RTX 5090 6 ч.
Gigabyte представила первую низкопрофильную Blackwell для геймеров — GeForce RTX 5060 OC LP с тремя вентиляторами 7 ч.