реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
«В данном случае патриотизм не работает»: российские смартфоны так и не захватили рынок, в отличие от ноутбуков 29 мин.
SK hynix получит $458 млн субсидий на строительство фабрики чипов в США 2 ч.
Японские 2-нм чипы всё ближе: Rapidus получила первый литографический EUV-сканер ASML 3 ч.
SMR-стартап Oklo подписал сделку о поставке 12 ГВт оператору ЦОД Switch 3 ч.
Луна оказалась более древней, чем предполагалось — учёные дали новую оценку возраста спутника 3 ч.
Micron начала поставлять передовую память HBM3E не только Nvidia 4 ч.
Малайзия открывает Национальный офис ИИ для становления в стране ключевого ИИ-хаба Юго-Восточной Азии 4 ч.
В Китае построили солнечную электростанцию, которая вырабатывает энергию днём и ночью 5 ч.
Китайские iPhone могут получить ИИ от Tencent и ByteDance — Apple начала переговоры 5 ч.
Sandisk сменила логотип, вдохновившись «одной точкой данных» 6 ч.