реклама
Теги → yandexgpt

«Яндекс» протестирует новую «Алису» на базе YandexGPT 2

Компания «Яндекс» начала принимать заявки на участие в бета-тестировании новой версии голосового помощника «Алиса», созданного на базе языковой модели YandexGPT 2. Особенностью этой версии ассистента является то, что он способен поддерживать связный диалог и отвечать на уточняющие вопросы с учётом предыдущих реплик.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

В дополнение к этому поисковые технологии открыли «Алисе» доступ ко всему интернет-контенту для формирования более точных и развёрнутых ответов. Уже в бета-версии алгоритма нет необходимости запуска навыка «Давай придумаем», поскольку «Алиса» научилась решать разные задачи в одном диалоге с учётом его контекста. К примеру, ассистент подскажет, какие сказки были написаны в XIX веке, после чего может перейти к чтению выбранной пользователем, или объяснит почему небо голубого цвета, и как появляется северное сияние.

Ещё новая версия «Алисы» может не только предложить тезисный план презентации, но и дать советы о том, как лучше подготовиться к публичному выступлению. Голосовой помощник будет полезен при составлении меню новогоднего ужина и создании праздничных поздравлений. Вместе с этим «Алиса» предложит дополнительные игры и обучающие занятия для ежедневного развития детей. Одним из нововведений стал навык «Помощь близких», который позволяет быстро связаться с родственниками.

Принять участие в бета-тестировании новой «Алисы» могут подписчики «Яндекс Плюса». Желающие сделать это, должны оставить заявку на сайте, но количество участников программы тестирования ограничено. Бета-версия ассистента станет доступна пользователям «Яндекс Станций», а также в чате с «Алисой» в приложении «Яндекс», в браузере компании и на странице ya.ru.

«Яндекс» открыл доступ к YandexGPT API для всех пользователей

«Яндекс» сообщил об доступности для всех пользователей YandexGPT API в режиме превью через облачную платформу Yandex Cloud. Также было объявлено о запуске программы грантов Yandex Cloud Boost AI, в рамках которой технологическим компаниям может быть выделено 1 млн рублей на использование YandexGPT API для создания чат-ботов и умных помощников, генерации, структурирования и суммаризации текстовой информации в бизнес-приложениях и веб-сервисах.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Кроме этого, пользователям предоставят возможность получить консультации архитекторов по работе с нейросетью нового поколения и скидку на дальнейшее использование YandexGPT API в рамках предлагаемых тарифов.

Наряду с моделью для решения задач, где требуется выполнение запросов в режиме реального времени, в YandexGPT API теперь доступна большая модель в асинхронном режиме, предназначенная для решения более сложных текстовых задач, например, для аналитики аудиозаписей.

Также можно воспользоваться библиотекой промтов (готовых текстовых запросов) по наиболее популярным для бизнеса сценариям использования нейросети, которые помогут упростить и ускорить работу с типовыми GPT-сценариями. Например, быстро сгенерировать заголовки или подготовить рекламное объявление.

Бизнес сможет получить бесплатный доступ к сервису в рамках программы Yandex Cloud Boost AI. Для этого компания должна заниматься созданием собственного технологического продукта, и её проект должен быть на стадии MVP и выше. И конечно же, у компании должна быть готова задача для использования YandexGPT API.

В процессе тестирования YandexGPT API было подано более 20 тысяч заявок компаний, больше всего — из сферы ИТ, ретейла и банков.

Нейросеть YandexGPT 2 успешно сдала ЕГЭ по литературе

Разработанная «Яндексом» большая языковая модель YandexGPT 2 справилась с несколькими вариантами ЕГЭ по литературе, получив усреднённую оценку 55 баллов. Это выше минимального порога, необходимого для поступления в вуз (40 баллов) и близко к средней оценке (64 балла), которую получают российские школьники, когда выбирают данный предмет и специально готовятся к экзамену.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

ЕГЭ по литературе содержит несколько испытаний разного рода: вопросы на эрудицию, а также задания для оценки стиля письма и творческих способностей. Для нейросети это непростая задача, но YandexGPT 2 выдержала все испытания: в первой части экзамена она проанализировала произведение и ответила на вопросы о нём, а во второй — написала сочинение на предложенную тему.

В рамках испытания специалисты «Яндекса» получили в Московском центре непрерывного математического образования варианты настоящего ЕГЭ по литературе, которые использовались на тренировочных экзаменах с 2021 по 2023 гг., и удостоверились, что в массиве использованных при обучении YandexGPT 2 данных ответов на эти вопросы нет. Таким образом, нейросеть работала с заданиями наравне с любым школьником, выбирая предложенные варианты и генерируя ответы на открытые вопросы. Проверку проводили официальные эксперты ЕГЭ по литературе.

Разница между сдающими ЕГЭ школьниками и YandexGPT 2 в том, что первые специально готовятся к сдаче, то есть погружаются в специфику предмета, тогда как нейросеть работала скорее экспромтом — схожим образом сдаёт школьные экзамены взрослый человек, опираясь только на накопленные знания. Стандартным способом проверки нейросетей является тест MMLU (Massive Multitask Language Understanding) — он включает вопросы из 57 областей, но не предусматривает оценки ответов на открытые вопросы или написания творческих заданий. Поэтому в «Яндексе» остановились на ЕГЭ по литературе.

«Яндекс Браузер» научился кратко пересказывать видеоролики

Компания «Яндекс» сообщила об очередных доработках своего фирменного браузера и включении функции краткого пересказа русскоязычных видео. Она позволяет быстро ознакомиться с содержанием ролика и понять, есть ли в нём ответ на нужный вопрос.

В основу новой функции положены технологии распознавания речи и генеративная нейросеть нового поколения YandexGPT. Сначала алгоритм конвертирует аудиодорожку в текст с помощью системы распознавания речи, а затем YandexGPT разбивает его на смысловые фрагменты. Нейросеть обобщает каждый из них и указывает таймкод начала блоков, кликнув по которому, можно перейти к интересующему фрагменту видео.

Чтобы получить пересказ ролика, нужно открыть видео в «Яндекс Браузере» и нажать на кнопку «Краткий пересказ». Функция также доступна в поиске «Яндекса» и сервисе краткого пересказа 300.ya.ru.

Согласно данным статистического сервиса LiveInternet.ru, «Яндекс.Браузер» является вторым по популярности веб-обозревателем в Рунете и контролирует 28,3 % рынка. Лидирующую позицию занимает Google Chrome c 51,3 процентами отечественной аудитории (показатели приведены за октябрь 2023 года).

«Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев

«Яндекс» представил новую версию большой языковой модели YandexGPT 2 — она уже поддерживается голосовым помощником «Алиса» и отвечает на пользовательские запросы лучше старой в 67 % случаев. Этого удалось добиться за счёт улучшений на каждом этапе обучения модели, главным из которых оказался претрейн (pretrain).

 Источник изображений: ya.ru/gpt/2

Источник изображений: ya.ru/gpt/2

Для сравнения качества работы первой и второй моделей YandexGPT разработчики подготовили набор из 500 пользовательских заданий, которые максимально отличаются друг от друга, предложили их обеим моделям и сравнили результаты — новая оказалась лучше в 67 % случаев. Чтобы конкретизировать критерии, поставленные задачи были поделены на группы, и оценки отдельно провели по каждой из них:

  • генерация текста — YandexGPT 2 победила в 69 % заданий;
  • пересказ и анализ текста — 68 %;
  • «мозговой шторм» идей — 66 %;
  • стилизация текста под аудиторию или конкретного пользователя — 62 %;
  • ответы на вопросы — 62 %.

Обучение моделей производится в два этапа: один называется претрейн (pretrain), второй — файнтюн (finetune). Первый отвечает за сбор фактической информации, второй — за формат и стиль ответа. Эти этапы независимы друг от друга в том смысле, что проблемы одного невозможно исправить на другом. На этапе претрейна ИИ потребляет полезные знания, поэтому разработчикам необходимо правильно набирать их в общий массив — датасет. Обучать модель заново с каждым изменением датасета — слишком трудозатратный и недешёвый процесс. Поэтому переобучение производится, когда накапливается определённая критическая масса обновлений датасета.

Есть и другая проблема: обновлённый датасет может не улучшить, а ухудшить качество работы модели, и контролировать это вручную тоже крайне сложно, потому что чем выше качество датасета, тем труднее обнаруживать его проблемы. Данный процесс решили автоматизировать, производя тестовое обучение маленьких, быстрых моделей, разные версии которых сравниваются по качеству работы. При этом маленькая модель не всегда в полной мере отражает качество большой, поэтому приходится пользоваться дополнительными инструментами:

  • классификатор некачественного текста помог обнаружить проблемы с кодировками, наличие лишних тегов HTML, повторы предложений и другие ошибки;
  • классификатор полезного текста помог обнаружить, отвечает ли материал на конкретный вопрос пользователя;
  • долю текстов с высокой цитируемостью увеличили;
  • долю дублей сократили до значения менее 0,5 %;
  • запустили инструмент для оценки «фактовой полноты» — претрейн обучили давать ответы на 80 % фактовых запросов, с которыми справляется поисковая служба «Яндекса».

Модель YandexGPT 2 уже интегрирована в голосового помощника «Алиса» в навыке «Давай придумаем» в «Яндекс Станциях», умных телевизорах с «Алисой», приложении «Яндекса», в «Яндекс Браузере», а также на поисковых страницах ya.ru. Разработчики модели продолжат совершенствовать датасеты для претрейна и файнтюна. В перспективе планируется внедрение обучения с подкреплением на основе отзывов людей (RLHF — Reinforcement Learning from Human Feedback). Нейросеть появится и в других сервисах «Яндекса», где она может оказаться полезной.

window-new
Soft
Hard
Тренды 🔥
Microsoft выпустила первые собственные ИИ-модели: одна генерирует речь, а другая — текст 3 ч.
Кроссплатформенная история запущенных игр на ПК и консолях Xbox вышла из «беты» и скоро станет доступна всем 4 ч.
«Группа Астра» увеличила на треть выручку в I полугодии 2025 года 4 ч.
Ghost of Yotei выйдет в срок — наследник Ghost of Tsushima ушёл на золото за месяц до релиза 5 ч.
Broadcom интегрировала в VCF ИИ-сервисы и поддержку новейших ускорителей AMD и NVIDIA — всё это будет доступно бесплатно 5 ч.
Epic Games Store устроил на PC, Android и iOS раздачу культового приключения Machinarium от создателей Botanicula и Samorost 6 ч.
Nvidia выпустила драйвер с поддержкой дополнения The Order of Giants к Indiana Jones and the Great Circle и DLSS 4 в Wuthering Waves 6 ч.
Автосохранение в Microsoft Word теперь включено по умолчанию — но копии сохраняются не на ПК 8 ч.
В Elden Ring Nightreign скоро появятся экспедиции повышенной сложности — анонсирован режим Deep of Night для самых смелых 9 ч.
Нелинейный шутер Judas от создателя BioShock вернулся из небытия с новыми подробностями и ключевой иллюстрацией 10 ч.