реклама
Новости Software

Meta✴ представила открытую ИИ-модель ImageBind, способную обрабатывать шесть типов данных

Meta объявила о разработке модели искусственного интеллекта с открытым кодом, которая способна обрабатывать шесть потоков данных: текст, звук, статическое и динамическое изображение (видео), температуру, информацию о глубине сцены, а также информацию о движении.

 Источник изображения: ***

Источник изображения: Meta

ИИ-модель ImageBind пока представляет собой исследовательский проект, о возможном практическом применении которого пока не говорится ничего, но этот проект указывает на перспективы генеративных систем. Стоит также отметить, что Meta упорно продолжает делиться своими разработками с общественностью, тогда как её конкуренты масштаба OpenAI и Google становятся всё более закрытыми.

Ключевая концепция исследования — объединение данных различных типов в многомерный индекс. Это своеобразное развитие идеи генеративных ИИ, которые сегодня доступны потребителю. К примеру, генераторы изображений вроде DALL-E, Stable Diffusion и Midjourney обучаются на сопоставлении текста и изображения, то есть двух типов данных: нейросеть ищет закономерности в визуальных данных, которые связываются с описаниями изображений. Это в итоге позволяет системам генерировать картинки по произвольным описаниям. Схожим образом работают генераторы аудио и видео.

Проект ImageBind — попытка поместить в единое пространство сразу шесть типов данных: визуальные, в том числе неподвижные картинки и видео; тепловые, то есть информацию от инфракрасных сенсоров; текст; звук; данные о глубине; данные о движении от инерциального измерительного блока (IMU) — такие используются в смартфонах и смарт-часах. Разработчики платформы пытаются обучить её работать с этими данными так же, как с текстом или изображениями. Обученная таким образом будущая система виртуальной реальности сможет генерировать целостные окружения: так, если попросить её сымитировать морское путешествие, она поместит пользователя на корабль с шумом волн на заднем плане, дополнив его раскачивающейся палубой и океанским бризом.

В перспективе инженеры Meta предполагают и далее расширять потоки сенсорных данных, добавив «осязание, речь, обоняние и сигналы функциональной МРТ мозга». Машины же, в свою очередь, получат возможность самообучаться в реальном времени на информации в различных формах.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Microsoft выпустила юбилейные обои для Windows с отсылками к легендарным элементам из прошлого корпорации 10 мин.
Сэм Альтман: GPT-5 задержится, чтобы стать лучше — зато «думающий» ИИ OpenAI o3 выйдет совсем скоро 2 ч.
Режиссёр Elden Ring рассказал, как будет играться The Duskbloods — эксклюзив Nintendo Switch 2 от FromSoftware 2 ч.
В России насчитали уже 134 тысяч блогеров с аудиторией выше 10 тысяч человек 2 ч.
Rutube не смог обогнать замедленный YouTube по популярности в России — это удалось только «VK Видео» 3 ч.
Европа готовится оштрафовать соцсеть X более чем на $1 миллиард 3 ч.
Представлена Midjourney V7 — ИИ-генератор изображений стал идеально понимать запросы и поразил качеством 5 ч.
Соавтор Dishonored «с радостью» бы взялся за Dishonored 3, но есть нюанс 6 ч.
ООН: ИИ уничтожит почти половину рабочих мест к 2033 году 6 ч.
Визг шин, рёв двигателей и атмосфера 90-х: гоночная игра #Drive Rally устремилась к выходу из раннего доступа 8 ч.
Nintendo отложила старт предзаказов Switch 2 в США, чтобы оценить влияние пошлин Трампа 40 мин.
Представлен смартфон Honor 400 Lite с чипом Dimensity 7025-Ultra и 108-Мп камерой 59 мин.
Китай зеркально ответил на пошлины Трампа, обложив товары из США пошлиной в 34 % 3 ч.
Российская компания iRU начала выпускать материнские платы для процессоров AMD и Intel 4 ч.
Тайваньский производитель серверов Wistron инвестирует $50 млн в производство в США на фоне новых тарифов Дональда Трампа 4 ч.
Китайская Loongson анонсировала восьмиядерный процессор для ноутбуков с поддержкой 4K и PCIe 3.0 4 ч.
Испанская Sateliot привлекла €70 млн европейских инвесторов на спутниковый Интернет вещей 4 ч.
Каждый пятый проданный в России в этом году смартфон выпустила Xiaomi, но заработала больше всех Apple 5 ч.
McLaren заполучила арабские инвестиции и скоро может прийти к выпуску электромобилей 6 ч.
Российские операторы получат низкие частоты для 5G не раньше 2029 года — сейчас диапазон занят телевещателями 6 ч.