реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Бренды вернули рекламу в X с минимальными бюджетами, лишь бы не разгневать Илона Маска 14 мин.
Российский футбольный союз раскрыл, когда ждать релиз отечественного аналога FIFA и EA Sports FC 37 мин.
«Весь бюджет ушёл на анимацию наковальни»: демонстрация боевика Blades of Fire про боевого кузнеца разочаровала игроков 2 ч.
Apple добавит ИИ-врача в приложение «Здоровье» для iPhone 3 ч.
Изменения в лицензионной политике Broadcom VMware побуждают мелких и средних клиентов искать альтернативное решение 19 ч.
Google выпустила тестовую версии нейросети Gemini 2.5 Pro для всех пользователей 22 ч.
IBM сокращает персонал в США, но активно нанимает малоопытных сотрудников в Индии 30-03 01:58
Новая статья: Assassin’s Creed Shadows — мы ждали этого почти двадцать лет. Рецензия 30-03 00:03
Новая статья: Gamesblender № 719: «прощальная» Half-Life 3, сроки выхода The Witcher 4 и ИИ-ассистент от Nvidia 29-03 23:30
В RuStore появилась оплата ChatGPT и других ИИ-сервисов рублями, но с большой наценкой 29-03 19:20
Intel запустит массовое производство 3-нм чипов в Европе в этом году 6 мин.
Японский консорциум предложил построить плавучий ЦОД с питанием от возобновляемых источников в Иокогаме 26 мин.
Новые нормы энергоэффективности ИИ-ускорителей угрожают бизнесу NVIDIA в Китае 36 мин.
Samsung представила холодильник, который поможет найти потерявшийся смартфон 52 мин.
XPeng: Рынок летающих электромобилей в два раза обойдёт по оборотам автомобильный, но не скоро 4 ч.
Японские власти решились выделить ещё $5,4 млрд поддержки для производителя 2-нм чипов Rapidus 5 ч.
Технически Intel готова упаковывать чипы для клиентов TSMC 7 ч.
Новая статья: Обзор моноблока MSI PRO AP242P 14M: для тех, кому нужны хороший экран и повышенный комфорт 12 ч.
Во второй половине 2025 года выйдет планшет Apple iPad Pro на чипе M5 17 ч.
AOC представила 27-дюймовый игровой монитор Q27G3H с 1440p и 200 Гц за $158 22 ч.