реклама
Новости Software

Apple незаметно выпустила нейросеть Ferret, которая работает с текстом и изображениями

Apple при поддержке учёных Корнеллского университета ещё в октябре выложила в открытый доступ собственную мультимодальную большую языковую модель Ferret, которая в качестве запросов может принимать фрагменты изображений.

 Источник изображения: Laurenz Heymann / unsplash.com

Источник изображения: Laurenz Heymann / unsplash.com

Выход Ferret на GitHub в октябре не сопровождался со стороны Apple крупными объявлениями, но проект впоследствии привлёк участие специалистов отрасли. Принцип работы Ferret состоит в том, что модель изучает указанный фрагмент изображения, идентифицирует объекты на этом участке и очерчивает их рамкой. Распознанные на фрагменте изображения объекты система воспринимает как часть запроса, ответ на который предоставляется в текстовом формате. К примеру, пользователь может выделить на картинке изображение животного и попросить Ferret распознать его. Модель даст ответ, к какому виду относится животное, и ей можно будет задать дополнительные вопросы в контексте, уточнив информацию по другим объектам или действиям.

 Источник изображения: twitter.com/zhegan4

Источник изображения: twitter.com/zhegan4

Открытая модель Ferret — это система, способная «давать ссылки и обосновывать что угодно, где угодно и с любыми подробностями», пояснил исследователь из ИИ-подразделения Apple Чжэ Гань (Zhe Gan). Отраслевые эксперты отмечают важность выхода проекта в этом формате — он демонстрирует открытость традиционно закрытой компании. По одной из версий, Apple решилась на этот шаг, поскольку стремится конкурировать с Microsoft и Google, но не обладает сопоставимыми вычислительными ресурсами. Из-за этого она не смогла рассчитывать на выпуск собственного конкурента ChatGPT и была вынуждена выбирать между партнёрством с облачным гиперскейлером и выпуском проекта в открытом формате, как это ранее сделала Meta.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
«Буду плакать слезами счастья»: датамайнеры Apex Legends заявили, что Titanfall 3 жива и выйдет в 2026 году 41 мин.
ИИ впервые стал студентом вуза — Венский университет прикладного искусства зачислил систему Flynn 49 мин.
Windows 11 скоро получит переработанный «Пуск», который можно будет настраивать под себя 59 мин.
Бенчмарк MLPerf показал, что ускорители AMD Instinct не уступают NVIDIA H200 2 ч.
Россия заняла четвёртое место по размеру аудитории в Kingdom Come: Deliverance 2, хотя игра в стране даже не продаётся 3 ч.
Трамп заявил, что сделка с TikTok близка к заключению, и тарифы могут пригодиться в переговорах с Китаем 5 ч.
Amazon добавила ИИ-функцию кратких обзоров книг Kindle, но предупредила о спойлерах 8 ч.
Инвесторы потребовали от Ubisoft пересмотреть условия сделки с Tencent и готовы добиваться своего через суд 13 ч.
Microsoft запустила собственный ИИ-поисковик Copilot Search 13 ч.
Спустя почти пять лет после дебюта на консолях The Last of Us Part II наконец вышла на ПК 14 ч.