реклама
Теги → flux.1

Стартап Black Forest Labs представил ИИ-генератор изображений FLUX.1 — он отлично справляется с прорисовкой рук человека

В конце прошлой недели стартап Black Forest Labs объявил о начале своей деятельности в сфере разработки генеративных нейросетей. Вместе с этим компания, созданная выходцами из Stability AI, представила семейство моделей генерации изображений по текстовому описанию под названием FLUX.1, которые претендуют на звание лучших в своём классе.

 Источник изображений: FLUX.1

Источник изображений: FLUX.1

Запуск FLUX.1 произошёл примерно через семь недель после того, как в середине июня Stability AI выпустила ИИ-генератор Stable Diffusion 3 Medium, который собрал много критики из-за невысокого качества при создании изображений, на которых есть люди. Пользователи активно делились в соцсетях результатами генерации алгоритма с искажёнными конечностями и телами людей.

Запуск Stable Diffusion 3 Medium последовал за уходом из Stability AI трёх ключевых сотрудников — Робина Ромбаха (Robin Rombach), Андреаса Блаттманна (Andreas Blattmann) и Доминика Лоренца (Dominik Lorenz). Именно они вместе с Патриком Эссером (Patrick Esser), который участвовал в разработке первой версии Stable Diffusion и с тех пор работал над разными ИИ-алгоритмами, а также другими инженерами, основали компанию Black Forest Lab.

На данный момент стартап представил три модели для генерации по текстовому описанию FLUX.1. ИИ-модель FLUX.1 pro представляет собой наиболее производительный генератор изображений, предназначенный для коммерческого использования через соответствующий API. Вместе с этим были выпущены FLUX.1 dev, доступная для некоммерческого использования, а также более лёгкая и быстрая FLUX.1 schnell (в переводе с немецкого — «быстрый» или «стремительный»).

Разработчики утверждают, что их ИИ-модели превосходят существующие аналоги, такие как Midjourney и DALL-E, по целому ряду показателей, включая качество создаваемых изображений и точность следования исходному описанию. В целом результаты генерации FLUX.1 сопоставимы с тем, что можно создать с помощью DALL-E 3 от OpenAI по точности следования описанию, и близки по фотореалистичности к Midjourney 6. При этом алгоритм явно более качественно работает по сравнению со Stable Diffusion XL, последним крупным релизом команды этих разработчиков, когда они ещё были частью Stability AI, не считая Stable Diffusion XL Turbo.

Модели Black Forest Lab построены на базе гибридной архитектуры, которая объединяет методы трансформации и диффузии, с масштабированием до 12 млрд параметров. Похоже, что такой подход делает нейросеть FLUX.1 способной качественно генерировать руки человека, что было слабым местом многих уже выпущенных на рынок аналогов. При этом разработчики не уточнили, на каких данных обучались модели FLUX.1.

Отметим, что Black Forest Lab уже привлекла финансирование в размере $31 млн. Желающим опробовать FLUX.1 в действии можно воспользоваться сервисами Fal.ai или Replicate.com, где придётся платить деньги для работы с алгоритмами.

window-new
Soft
Hard
Тренды 🔥
Marvel любит Fortnite: Доктор Дум, Эластика и другие герои комиксов появятся в новом сезоне королевской битвы 13 ч.
Amazon теряет миллиарды на Alexa и умных колонках, но ИИ может всё исправить 14 ч.
Новая статья: Minds Beneath Us — разум в чужом теле. Рецензия 11-08 00:09
Новая статья: Gamesblender № 686: новый след Half-Life 3, ремейк «Готики» и российская консоль на «Эльбрусе» 10-08 23:47
CoreWeave активно нанимает топ-менеджеров Google, Oracle и AWS для развития ИИ ЦОД 10-08 22:58
Microsoft прекратила поддержку Paint 3D и удалит его из магазина приложений 10-08 21:24
Исследователь продемонстрировал обход защиты Microsoft Copilot 10-08 17:46
OpenAI забеспокоилась об отношениях людей с ChatGPT в новом голосовом режиме 10-08 13:51
Новая статья: World of Goo 2 — возвращение легендарной головоломки. Рецензия 10-08 00:08
Красота требует жертв: у симулятора жизни inZOI с фотореалистичной графикой появилась страница в Steam и системные требования 09-08 23:29
Новая статья: Гид по выбору игрового монитора в 2024 году: всё дело в скорости! 4 ч.
Western Digital представила NVMe-oF-платформу OpenFlex Data24 4000 вместимостью до 368 Тбайт 6 ч.
Cisco уволит ещё 4000 работников и сосредоточится на кибербезопасности и ИИ 12 ч.
Самый доступный Cybertruck теперь продаётся за $100 000 14 ч.
Тысячесильный спорткар Denza Z9 GT, способный разгоняться до «сотни» менее чем за три секунды, скоро поступит в продажу 20 ч.
Японская Rapidus за счёт автоматизации рассчитывает значительно ускорить выполнение заказов на выпуск 2-нм чипов 21 ч.
«Охотник за астероидами» NEOWISE завершил миссию и вскоре сгорит в атмосфере 10-08 23:54
ЦОД с газопроводом: энергокомпании США обсуждают с операторами дата-центров поставки голубого топлива 10-08 23:28
XFX представила седьмую видеокарту серии RX 7800 XT — Speedster SWFT 210 10-08 20:38
Британский Королевский монетный двор начал добывать золото из материнских плат 10-08 18:59