реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Инсайдер: ремейк The Elder Scrolls IV: Oblivion реален и как никогда близок к анонсу 10 мин.
На грани авторского права: можно ли считать ИИ автором и как определить границы свободного использования 11 мин.
«Что-то определённо случилось»: CD Projekt Red подтвердила, что Цири в «Ведьмаке 4» не будет такой сильной, как в The Witcher 3: Wild Hunt 2 ч.
ЕС порекомендовала Apple открыть iOS для конкурентов — в компании видят в этом угрозу безопасности пользователей 2 ч.
На северокорейских хакеров пришлись 61 % всей украденной в 2024 году криптовалюты 2 ч.
Ubisoft не бросит Skull and Bones после первого года поддержки — у компании есть план 3 ч.
Apple и Meta обвинили друг друга в саботаже совместимости мессенджеров 4 ч.
Роскомнадзор расставит капканы на хакеров 4 ч.
Windows 11 24H2 снова стала ломать игры — Microsoft приостановила выпуск обновления 4 ч.
Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ 6 ч.
Samsung анонсировала первый в мире холодильник с элементами Пельтье и ИИ 15 мин.
DJI увернулась от запрета на продажи дронов в США, но ненадолго 2 ч.
Принято в эксплуатацию самое большое судно с роторными парусами — старая технология здорово экономит топливо 2 ч.
Россияне бросились скупать комплектующие для ПК после повышения курса доллара 2 ч.
Анонсирован крошечный игровой ноутбук OneXplayer G1 на базе Ryzen 9 HX 370 с двумя клавиатурами 3 ч.
Регулятор NERC: ИИ представляет угрозу для североамериканской электросети 3 ч.
«В данном случае патриотизм не работает»: российские смартфоны так и не захватили рынок, в отличие от ноутбуков 4 ч.
SK hynix получит $458 млн субсидий на строительство фабрики чипов в США 5 ч.
Японские 2-нм чипы всё ближе: Rapidus получила первый литографический EUV-сканер ASML 6 ч.
SMR-стартап Oklo подписал сделку о поставке 12 ГВт оператору ЦОД Switch 6 ч.