реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Не всё потеряно: студия Nightdive обнадёжила фанатов, заждавшихся новостей о System Shock 3 3 ч.
Разработчики Warhammer 40,000: Space Marine 2 пообещали, что «никто не забрасывает игру» ради Space Marine 3 3 ч.
Mozilla закрыла уязвимость Firefox, аналогичную обнаруженной ранее в Google Chrome 3 ч.
Платным пользователям YouTube разрешили делиться видео без рекламы с другими, но не всем 4 ч.
Полицейский экшен The Precinct с элементами первых GTA не заставит долго ждать — дата выхода и геймплейный трейлер 5 ч.
«Думал, не доживу»: первый за восемь лет полноценный трейлер симулятора школы магии Witchbrook очаровал игроков 5 ч.
Сюжетное дополнение к Hogwarts Legacy стало жертвой реструктуризации Warner Bros. Games 7 ч.
Facebook вернул свой 2007-й: запущена лента только с публикациями друзей, без алгоритмического мусора 15 ч.
Microsoft ускорит запуск приложений Office — начнут с Word 18 ч.
Ubisoft откроет с Tencent новую компанию, которая будет владеть Assassin’s Creed, Far Cry и Rainbow Six 18 ч.
Китайцы готовы обогнать Tesla и Boston Dynamics в наполнении мира человекоподобными роботами 15 мин.
Новый гендиректор Тан пообещал построить «новую Intel» с передовыми техпроцессами и лучшими чипами 2 ч.
Пошлины сработали: объём продаж китайских электромобилей в Европе упал до двухлетнего минимума 2 ч.
Солнечный зонд «Паркер» снова окунулся в солнечную корону и вышел на связь невредимым 2 ч.
5 Экзабайт для ИИ: OpenAI может построить специальный дата-центр для хранения за миллиарды долларов 3 ч.
Hina Battery представила натрий-ионные батареи, которые не боятся холода и заряжаются за 20 минут 3 ч.
Boeing Starliner попытается восстановить репутацию после прошлогоднего провала, снова доставив людей на МКС 3 ч.
Только ИИ, только Stargate: Crusoe окончательно избавилась от криптобизнеса, продав его NYDIG 3 ч.
Представлен бюджетный геймерский смартфон Realme 14 5G с чипом Snapdragon 6 Gen 4 и Mecha-дизайном 4 ч.
Xenium X280 — классический мобильный телефон, который может заряжать другие гаджеты 4 ч.