реклама
Теги → yandexgpt 5 lite

«Яндекс» выпустила ИИ-модель YandexGPT 5 Lite — она поможет ускорить IT-разработку и исследования

Компания «Яндекс» открыла доступ к Instruct-версии обновлённой языковой модели YandexGPT 5 Lite, которую можно использовать как в некоммерческих, так и в коммерческих целях. Алгоритм будет полезен для разных людей, например, для разработчиков и исследователей, поскольку его можно сразу внедрить в собственный проект.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

ИИ-модель не слишком требовательна к вычислительным ресурсам, поэтому её можно протестировать на собственном компьютере без необходимости использования дополнительного оборудования. Отмечается, что помимо предварительного обучения ИИ-модель прошла дополнительный этап настройки, благодаря чему она способна выполнять конкретные задачи по промптам (пользовательским инструкциям или запросам). Другая версия YandexGPT 5 Lite (Pretrain) не проходила этот этап, поэтому пользователям придётся дообучать её под свои задачи самостоятельно.

Результаты тестирования YandexGPT 5 Lite Instruct указывают на то, что алгоритм близок по результатам к китайской нейросети Qwen2.5-7B-Instruct и превосходит её при выполнении задач классификации и разметки текстов, в знании русской культуры и фактов, умении отвечать в заданном формате. Замеры «Яндекса» методом слепого сравнения (Side by Side) показали, что YandexGPT 5 Lite в 62 % случаев превосходит Qwen2.5-7B-Instruct и по качеству ответов сравнима с GPT-4o Mini в решении стандартных задач сервисов «Яндекса».

Вместе с этим была обновлена лицензия ИИ-модели, теперь её можно задействовать в любых целях, в том числе в коммерческих (при условии, что объём выходных токенов не превышает 10 млн в месяц). В компании считают, что такого объёма достаточно для чат-ботов на небольших и средних сайтах, генерации описаний товаров в интернет-магазинах с ограниченным ассортиментом, автоматизации ответов клиентам в сервисных центрах и др.

Модель YandexGPT 5 Lite включает 8 млрд параметров и поддерживает контекст до 32 тыс. токенов. По данным разработчиков, компактность и качество алгоритма, совместимость с библиотекой llama.cpp и поддержка формата GPT-Generated Unified Format делают возможным запуск ИИ-модели даже на персональных компьютерах. Разработчикам и исследователям Instruct-версия модели доступна на Hugging Face, а простые пользователи могут протестировать алгоритм в чате с «Алисой» (доступно 5 бесплатных запросов в день). Для бизнеса ИИ-модель доступна через соответствующий API в Yandex Cloud.

«Яндекс» запустил генеративную нейросеть YandexGPT Lite третьего поколения

Компания «Яндекс» официально представила облегчённую версию своей генеративной нейросети третьего поколения YandexGPT 3 Lite. ИИ-сервис доступен клиентам облачной платформы Yandex Cloud через соответствующий API. Нейросеть может быть полезна для разных сценариев использования, например, в чат-ботах, для проверки орфографии или анализа данных.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

В компании отметили, что новая версия нейросети подходит для применения в разных сегментах бизнеса. Использование YandexGPT 3 Lite позволит оптимизировать процесс выполнения разных задач, включая консультирование клиентов по телефону и в чатах, подготовку ответов для служб поддержки, генерацию маркетинговых материалов и др. В крупных организациях со сложными бизнес-процессами и большими потоками данных ИИ-сервис может оказаться полезным для анализа информации.

По словам разработчиков «Яндекса», YandexGPT 3 Lite по многим параметрам превосходит ИИ-модель предыдущего поколения. В ходе тестирования языковой модели в YaMMLU_ru (русскоязычная версия международного эталонного теста MMLU) было установлено, что YandexGPT 3 Lite даёт на 6 % больше верных ответов, чем модель YandexGPT 2 Lite.

Алгоритмы также сравнивались по методу Side by Side, когда им приходится отвечать на одинаковые вопросы, а лучший ответ выбирается экспертной группой. В результате было установлено, что YandexGPT 3 Lite отвечает лучше в 68 % случаев. Ещё в ходе тестирования специалисты оценили, насколько хорошо YandexGPT 3 Lite справляется с задачами классификации, генерации контента, ответами на вопросы и др. Также упоминается, что новый алгоритм допускает меньше орфографических и фактических ошибок по сравнению с YandexGPT 2 Lite.

В процессе создания новой ИИ-модели разработчики усовершенствовали все этапы обучения. Был улучшен отбор данных для предварительного этапа обучения, за счёт чего увеличилась доля полезной информации. Также была задействована технология Curriculum Learning для поэтапного усложнения данных. На втором этапе обучения, включающем в себя обучение с подкреплением, была улучшена модель для оценки качества ответов алгоритма. В дополнение к этому в архитектуре нейросети появилась технология Grouped Query Attention для ускорения обработки данных без потери качества.

Стоимость использования YandexGPT 3 Lite составляет 20 копеек за 1000 токенов. Новые пользователи Yandex Cloud смогут бесплатно протестировать ИИ-сервис в демо-режиме. Новая модель заменит предыдущую версию алгоритма в течение месяца.

window-new
Soft
Hard
Тренды 🔥
«Буду плакать слезами счастья»: датамайнеры Apex Legends заявили, что Titanfall 3 жива и выйдет в 2026 году 53 мин.
ИИ впервые стал студентом вуза — Венский университет прикладного искусства зачислил систему Flynn 2 ч.
Бенчмарк MLPerf показал, что ускорители AMD Instinct не уступают NVIDIA H200 2 ч.
Россия заняла четвёртое место по размеру аудитории в Kingdom Come: Deliverance 2, хотя игра в стране даже не продаётся 3 ч.
Трамп заявил, что сделка с TikTok близка к заключению, и тарифы могут пригодиться в переговорах с Китаем 6 ч.
Amazon добавила ИИ-функцию кратких обзоров книг Kindle, но предупредила о спойлерах 8 ч.
Инвесторы потребовали от Ubisoft пересмотреть условия сделки с Tencent и готовы добиваться своего через суд 13 ч.
Microsoft запустила собственный ИИ-поисковик Copilot Search 14 ч.
Спустя почти пять лет после дебюта на консолях The Last of Us Part II наконец вышла на ПК 14 ч.
ЕС оштрафует TikTok на €500 млн за передачу данных европейцев в Китай 15 ч.
Богатейшие люди мира за день потеряли $208 млрд из-за новых пошлин США 12 мин.
Cyclotech впервые подняла в воздух проворный летающий автомобиль с роторными «бочонками» вместо пропеллеров 16 мин.
NVIDIA может переключиться на выполнение заказов только из Китая в преддверии усиления санкций США 32 мин.
Zalman CNPS14X Duo Black — универсальный кулер для мощных процессоров 51 мин.
Вскоре SpaceX впервые запустит Starship на б/у ускорителе Super Heavy 2 ч.
Tenstorrent представила ИИ-ускорители Blackhole на архитектуре RISC-V 2 ч.
Один из крупнейших производителей серверов в мире анонсировал локализацию в США после повышения Трампом пошлин 2 ч.
Jabil представила оптические трансиверы для 1,6-Тбит/с сетей 3 ч.
Объем мирового рынка генеративного ИИ в 2024 году вырос более чем в четыре раза 4 ч.
Министр торговли США дал понять, что Трамп всё равно перетащит производство электроники с Тайваня 4 ч.