реклама
Теги → lg ai research

LG представила нейросеть Captioning AI, которая создаёт текстовые описания для изображений

Одно из подразделений компании LG представило генеративную систему ИИ Captioning AI, которая может распознавать элементы изображения и генерировать для них описания и ключевые слова — трудно переоценить пользу, которую подобная технология способна оказать, например, при систематизации баз фотоснимков крупных компаний.

 Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Представители LG AI Research, занимавшейся разработкой Captioning AI, выступили на мероприятии Computer Vision and Pattern Recognition 2023, крупнейшей в мире конференции, посвящённой «компьютерному зрению» — она проходила в воскресенье в Ванкувере (Канада). Как сообщили в LG, сервис основан на разработанной LG AI Research технологии Zero-shot Image Captioning, позволяющей ИИ «понимать» и описывать объекты или сцены, которые нейросеть оценивает впервые без дополнительных подсказок, на основе своего предыдущего опыта — так же, как и люди.

В компании объяснили, что технология отличается от ИИ-сервисов вроде Midjourney, в которых всё происходит ровно наоборот — пользователи вводят текст или загружают картинку, на основе которых ИИ генерирует собственное творение. Создание «субтитров» к картинкам может показаться довольно лёгким, поскольку концепция не нова. Тем не менее, технология вышла на новый уровень. Например, искусственный интеллект действительно может делать выводы и описывать то, чего он не «видел» никогда раньше — посмотреть на пейзаж или человека и вычислить, о каком именно месте идёт речь. Технология позволяет распознавать на изображении фон, персонажей и даже активность и описывать взаимодействие элементов.

 Источник изображения: LG

Источник изображения: LG

Captioning AI может генерировать текстовые описания и ключевые слова для 10 тыс. изображений менее чем за два дня, что в теории позволяет повысить эффективность и продуктивность для компаний, которым необходимо справляться с большими массивами изображений. В среднем система может генерировать 5 предложений и 10 ключевых слов за 10 секунд.

Сервис разработан при сотрудничестве с Shutterstock, одной из крупнейших платформ для размещения визуального контента — от изображений до видео. LG AI Research сотрудничала с этой американской компанией ранее и намерена делать это и впредь расширяя сотрудничество и с другими партнёрами. Как сообщили в Shutterstock, технология Caption AI развивается благодаря «раннему доступу» к программе десяти глобальных клиентов.

window-new
Soft
Hard
Тренды 🔥
Рассуждающий ИИ скоро замедлится в развитии, выяснили эксперты 15 мин.
«Игра года, не иначе»: шутер Doom: The Dark Ages стартовал в расширенном доступе Steam с «очень положительными» отзывами 29 мин.
Криптобиржа впервые попала в индекс S&P 500 — этому помог рост биткоина 30 мин.
Apple представила новый режим чтения и другие функции для пользователей с ограниченными возможностями 31 мин.
Не совсем Game Ready: id Software подтвердила «постоянные сбои» в DOOM: The Dark Ages из-за драйвера GeForce 576.40 32 мин.
Экшен Marvel 1943: Rise of Hydra от команды бывшей сценаристки Uncharted не выйдет в 2025 году — объявлены новые сроки релиза 2 ч.
Microsoft пообещала поддержку Office в устаревшей Windows 10 до 2028 года 3 ч.
Система оценки совместимости игр для Steam Deck станет актуальной для всех устройств на базе SteamOS 3 ч.
ClickHouse готовится к новому раунду финансирования — оценка капитализации компании выросла до $6 млрд 4 ч.
Google собралась избавиться от кнопки «Мне повезёт!» — её заменит ИИ-поиск 5 ч.
DJI представила свой лучший потребительский дрон Mavic 4 Pro с тройной камерой и ценой от €2099 2 ч.
Stow рвёт страницы, Pick теряется в товарах — Amazon признала, что складские роботы уступают людям 2 ч.
Мировые поставки планшетов подскочили благодаря пандемии — в лидерах роста Xiaomi, Lenovo и Apple 3 ч.
Samsung представила маленькие OLED-дисплеи с высоченной яркостью и разрешением выше 8K 3 ч.
Марсотрясение подсказало, куда девалась вода с поверхности Красной планеты 3 ч.
Western Digital стала ключевым спонсором революционных керамических накопителей Cerabyte 4 ч.
QNAP представила флагманское All-Flash хранилище TDS-h2489FU R2 с 24 отсеками U.2 5 ч.
Zotac скоро представит игровую приставку на Linux и Ryzen AI 9 HX 370 5 ч.
Анонсирован настольный ИИ-суперкомпьютер MSI EdgeXpert MS-C931 на базе NVIDIA DGX Spark 5 ч.
SpaceX установила рекорд повторного использования ракет Falcon 9 — всё ближе к трём десяткам 6 ч.
Включить темный режим