реклама
Теги → yandexgpt 3 lite

«Яндекс» запустил генеративную нейросеть YandexGPT Lite третьего поколения

Компания «Яндекс» официально представила облегчённую версию своей генеративной нейросети третьего поколения YandexGPT 3 Lite. ИИ-сервис доступен клиентам облачной платформы Yandex Cloud через соответствующий API. Нейросеть может быть полезна для разных сценариев использования, например, в чат-ботах, для проверки орфографии или анализа данных.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

В компании отметили, что новая версия нейросети подходит для применения в разных сегментах бизнеса. Использование YandexGPT 3 Lite позволит оптимизировать процесс выполнения разных задач, включая консультирование клиентов по телефону и в чатах, подготовку ответов для служб поддержки, генерацию маркетинговых материалов и др. В крупных организациях со сложными бизнес-процессами и большими потоками данных ИИ-сервис может оказаться полезным для анализа информации.

По словам разработчиков «Яндекса», YandexGPT 3 Lite по многим параметрам превосходит ИИ-модель предыдущего поколения. В ходе тестирования языковой модели в YaMMLU_ru (русскоязычная версия международного эталонного теста MMLU) было установлено, что YandexGPT 3 Lite даёт на 6 % больше верных ответов, чем модель YandexGPT 2 Lite.

Алгоритмы также сравнивались по методу Side by Side, когда им приходится отвечать на одинаковые вопросы, а лучший ответ выбирается экспертной группой. В результате было установлено, что YandexGPT 3 Lite отвечает лучше в 68 % случаев. Ещё в ходе тестирования специалисты оценили, насколько хорошо YandexGPT 3 Lite справляется с задачами классификации, генерации контента, ответами на вопросы и др. Также упоминается, что новый алгоритм допускает меньше орфографических и фактических ошибок по сравнению с YandexGPT 2 Lite.

В процессе создания новой ИИ-модели разработчики усовершенствовали все этапы обучения. Был улучшен отбор данных для предварительного этапа обучения, за счёт чего увеличилась доля полезной информации. Также была задействована технология Curriculum Learning для поэтапного усложнения данных. На втором этапе обучения, включающем в себя обучение с подкреплением, была улучшена модель для оценки качества ответов алгоритма. В дополнение к этому в архитектуре нейросети появилась технология Grouped Query Attention для ускорения обработки данных без потери качества.

Стоимость использования YandexGPT 3 Lite составляет 20 копеек за 1000 токенов. Новые пользователи Yandex Cloud смогут бесплатно протестировать ИИ-сервис в демо-режиме. Новая модель заменит предыдущую версию алгоритма в течение месяца.

window-new
Soft
Hard
Тренды 🔥
Anthropic научила чат-бот Claude имитировать стиль письма пользователя, причём бесплатно 2 ч.
Threads стала самой быстрорастущей соцсетью — в ноябре аудитория выросла на 35 млн 5 ч.
Devolver проведёт церемонию Devolver Delayed Awards 2024, на которой наградит разработчиков за героический перенос игр 11 ч.
Нашумевший ИИ-генератор видео Sora без разрешения OpenAI приоткрыли для всех желающих 12 ч.
Показатели падают, но CD Projekt не унывает — продажи Cyberpunk 2077 взяли новую высоту 13 ч.
«Можем сделать новую ведьмачью сагу замечательной»: CD Projekt подтвердила, что The Witcher 4 перешла в стадию активной разработки 14 ч.
Поддержка до 2026 года, сюрприз на юбилей и бесплатный контент: 11 bit studios раскрыла план развития Frostpunk 2 14 ч.
После обновления до Windows 11 24H2 компьютеры перестали «видеть» многие сканеры и МФУ 15 ч.
Госдума определила, сколько россияне будут платить налогов с майнинга и сделок с криптовалютой 16 ч.
Бразилия пригрозила Apple ежедневными штрафами за ограничения в App Store 16 ч.
Apple вернулась в тройку лидеров по интернет-продажам в России 3 ч.
Санкции США в действии: китайская HBM2 появится с отставанием на 7 лет как минимум 3 ч.
Samsung выгнала главу отдела по выпуску памяти на фоне провала с HBM3E 4 ч.
Южная Корея готовится к возвращению Трампа с помощью новых субсидий для национальных чипмейкеров 6 ч.
Новая статья: Обзор робота-пылесоса Midea VCR M7 EVO: уборка помещения — моё главное призвание 9 ч.
DIGITIMES Research ожидает снижение поставок серверов в IV квартале — «виноваты» будут суперускорители NVIDIA GB200 NVL72 10 ч.
Новая статья: Обзор и тест двухбашенного кулера Ocypus Iota A62 BK: кто ты, воин? 11 ч.
Blackstone и EQT создают совместное $3,5-млрд предприятие для строительства газопровода — на фоне бума ЦОД и ИИ 11 ч.
Huawei Mate 70 получили новый суверенный процессор Kirin 9020, который очень похож на старый 12 ч.
На фоне ажиотажа вокруг ИИ акции японского производителя оптических кабелей выросли с начала года на 400 % 12 ч.