реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Илон Маск намерен удвоить стоимость ИИ-стартапа xAI до $45 млрд благодаря ближневосточным инвесторам 51 мин.
Превращение OpenAI в коммерческую компанию может застопориться — оно привлекло внимание генпрокурора Делавэра 59 мин.
МТС запустит публичную облачную платформу 2 ч.
PC Gaming Show: Most Wanted вернётся 5 декабря — с бессменной ведущей и 25 ожидаемыми играми 2 ч.
Ubisoft прокомментировала слухи о ещё одном переносе Assassin’s Creed Shadows 4 ч.
Минцифры РФ подготовит единый прайс-лист на ПО для государственных структур 4 ч.
В Windows обнаружена опасная уязвимость нулевого дня, которую закрыл сторонний разработчик 5 ч.
Call of Duty: Black Ops 6 показала крупнейший запуск в истории серии и помогла Game Pass установить новый рекорд 5 ч.
Microsoft переманила ведущего разработчика Marvel’s Wolverine — он возглавил команду Perfect Dark 6 ч.
Поражённый зомби-вирусом Сеул в трейлере PvPvE-экшена Nakwon: Last Paradise 6 ч.
В Австралии запустили опытное производство гибких солнечных панелей из перовскита, но КПД разочаровал 2 ч.
DIGITIMES Research: в 2024 году Google увеличит долю на рынке кастомных ИИ ASIC до 74 % 3 ч.
Asus выпустила 27-дюймовый профессиональный монитор ProArt Display 5K PA27JCV за $799 3 ч.
Avride, выделившаяся из «Яндекса», показала четырёхколёсного робота-курьера на чипе Nvidia 4 ч.
Несостоявшиеся звёзды могут иметь собственные планеты, подсказывает «Джеймс Уэбб» 4 ч.
Ученые вычислили скрытый океан на спутнике Урана — там есть потенциал для зарождения жизни 4 ч.
Рынок смартфонов показал рекордный рост с 2021 года: сильнее всех поднялись Vivo и Apple, а Samsung теряет рынок 4 ч.
ИИ-гонка очень дорого обходится Microsoft, Google и другим IT-гигантам — инвесторы обеспокоены 5 ч.
KKR подписала соглашение о партнёрстве с ECP для строительства ЦОД и реализации энергетических проектов на $50 млрд 6 ч.
Cisco представила ИИ-сервер UCS C885A M8 на базе NVIDIA H100/H200 или AMD Instinct MI300X 6 ч.