Сегодня 30 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple научит ИИ понимать интерфейсы приложений

Исследователи компании Apple опубликовали работу, в которой описали систему генеративного искусственного интеллекта Ferret-UI, предназначенную для распознавания интерфейсов мобильных приложений. С её помощью ИИ сможет без предварительного обучения понимать интерфейс разных приложений и взаимодействовать с ними.

 Источник изображения: Carl Heyerdahl / unsplash.com

Источник изображения: Carl Heyerdahl / unsplash.com

Ferret-UI представляет собой большую мультимодальную языковую модель (MLLM), характерная особенность которых — способность к обучению на самых разных материалах, включающих текст, изображения, видео- и аудиоконтент. MLLM пока плохо справляются с распознаванием интерфейсов приложений и тому есть множество причин, одна из которых — несоответствие пропорций используемых для обучения изображений соотношению сторон экрана типичного смартфона. Искусственный интеллект плохо понимает мелкие изображения, такие как значки и кнопки, а кроме того, для анализа интерфейса приложения ему необходимо с ним взаимодействовать. По словам исследователей, им уже удалось превзойти GPT-4V и другие специализирующиеся на анализе интерфейсов MLLM.

Сфера применения Ferret-UI описана довольно расплывчато. С одной стороны, Apple может делать это намеренно, дабы не подавать конкурентам идеи конкретных продуктов, с другой — исследователи разрабатывают технологии, а поиск возможностей их применения не входит в их задачи. Но есть очевидные варианты: например, с помощью Ferret-UI можно попробовать оценить эффективность пользовательского интерфейса или помочь слепым лучше понять происходящее на экране смартфона. Другим возможным применением нового ИИ может стать интеграция с Siri, благодаря чему последней можно будет отдавать команды для взаимодействия с приложениями, например, купить авиабилеты на определённое время и по указанному тарифу.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Microsoft добавила поддержку русского и ещё 15 языков в Copilot для Microsoft 365 30 мин.
Создатели Commandos: Origins показали новый геймплейный трейлер и анонсировали закрытую «бету» 2 ч.
Верховный суд США отказался освободить Илона Маска от «Twitter-няни» 3 ч.
Meta подтвердила, что будет вознаграждать популярных авторов в Threads 3 ч.
Microsoft позволит открывать без подключения к интернету файлы в веб-версии OneDrive 3 ч.
Цифровые археологи восстановили контроль над червём PlugX и выявили глобальную эпидемию 5 ч.
Из-за бага крестьяне в Manor Lords предпочитают оставаться бездомными — разработчик отреагировал 5 ч.
Выручка Yandex Cloud выросла в I квартале 2024 года на 58 % благодаря росту спроса на облачные сервисы 6 ч.
Microsoft стала рекламировать свои продукты при первом запуске Windows 11 после обновления 7 ч.
YouTube начал показывать рекламу во время паузы в видео — пока в тестовом режиме 7 ч.
Новая статья: Он вам не силикон! Часть вторая: сила, блеск и двумерность 2 ч.
Boston Dynamics показала Sparkles — мохнатого робопса, который умеет танцевать 3 ч.
MediaTek представит 7 мая флагманский процессор Dimensity 9300+ с расширенными ИИ-функциями 4 ч.
Razer грозит штраф на $1,1 млн за обман с масками с RGB-подсветкой Zephyr — они не защищали от COVID-19 4 ч.
У «Хаббла» снова засбоил гироскоп — космический телескоп прекратил работу и перешёл в безопасный режим 4 ч.
В США разработали экологичные печатные платы vPCB, которые легко перерабатывать 5 ч.
Квартальная выручка Western Digital в облачном сегменте выросла более чем на четверть 6 ч.
Infinix представила геймерский смартфон GT 20 Pro с чипом Dimensity 8200 Ultimate и RGB-подсветкой 6 ч.
DJI представила бюджетный дрон Mini 4K — видео 4K и 31 минута полёта за $299 8 ч.
Sparkle выпустила белые видеокарты Arc A770 и A750 ROC OC Luna Edition на синих платах 8 ч.