реклама
Новости Software

Ещё один китайский удар по OpenAI: Alibaba выпустила ИИ, который может управлять ПК и смартфоном

Самой яркой звездой китайской отрасли искусственного интеллекта в последние дни стала лаборатория DeepSeek, но не сидят сложа руки и технологические гиганты: подразделение Alibaba Qwen представило семейство моделей Qwen2.5-VL, способных управлять ПК и смартфоном, как это делает виртуальный помощник OpenAI Operator.

 Источник изображения: alibabacloud.com

Источник изображения: alibabacloud.com

Самая мощная модель в семействе Qwen2.5-VL превзошла крупнейшие американские проекты, в том числе OpenAI GPT-4o, Anthropic Claude 3.5 Sonnet и Google Gemini 2.0 Flash в ряде испытаний, включая «понимание» видео, решение математических задач, анализ документов и ответы на вопросы, утверждают разработчики. Испытать эту модель можно в приложении Alibaba Qwen Chat, доступна её загрузка с платформы Hugging Face. Она анализирует диаграммы и графики, извлекает данные из бухгалтерских документов, изучает многочасовые видео, а также распознаёт фрагменты фильмов и сериалов — возможно, её обучение велось с использованием защищённых авторским правом работ. Как и другие китайские модели, она отказывается комментировать политику Пекина.

 Источник изображения: x.com/_philschmid

Источник изображения: x.com/_philschmid

Одной из наиболее интересных особенностей Qwen2.5-VL является её способность управлять программами на ПК и мобильных устройствах. В одном из примеров модель запустила приложение на Android и забронировала авиабилеты. В другом примере ей поручили управление ПК под Linux, но она смогла совершить лишь базовые действия, в частности, переключала вкладки в браузере. Младшие версии Qwen2.5-VL-3B и Qwen2.5-VL-7B доступны по открытой лицензии без ограничений; флагманская Qwen2.5-VL-72B требует, чтобы владельцы платформ с более чем 100 млн пользователей получали разрешение у Alibaba Qwen перед коммерческим развёртыванием модели.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Новая статья: Rift of the NecroDancer — дофаминовый разлом. Рецензия 5 ч.
В раннем доступе Steam вышла комедийная песочница про секретного агента в школе магии, которая выглядит как те самые игры по «Гарри Поттеру» 6 ч.
В «Google Календаре» появится ИИ Gemini для удобного управления расписанием и планами 7 ч.
Релиз Killing Floor 3 перенесли на неопределённый срок — закрытая «бета» ужаснула участников низким качеством 9 ч.
Инсайдер: старт предзаказов и анонс даты выхода Death Stranding 2: On The Beach как никогда близко 10 ч.
В Telegram появились платные сообщения, досье на незнакомцев и другие нововведения 10 ч.
Следующие ИИ-модели Llama от Meta получат улучшенные голосовые функции 10 ч.
Никаких маркеров и полная свобода выбора: авторы экшена Hell is Us показали прохождение сюжетного задания 10 ч.
Смартфоны на Android 16 получат виджеты на экраны блокировки уже в этом году 12 ч.
Все актуальные смартфоны Google Pixel теперь могут запускать Linux-приложения 13 ч.
Google отключилась от российских IX и ЦОД, но о полном уходе из страны речи нет 3 ч.
В Ростове-на-Дону запустили завод электроники, который сможет выпускать до 500 тысяч изделий в год 5 ч.
Зонд Intuitive Machines опрокинулся при посадке на Луну — это становится недоброй традицией 7 ч.
Boston Dynamics превратила человекообразного робота Atlas в идеального кладовщика 7 ч.
Инвесторы разуверились в полупроводниковой промышленности на фоне повышения тарифов и экспортного контроля в США 9 ч.
«Не стоит отчаиваться»: AMD пообещала больше Radeon RX 9070 XT и RX 9070 по рекомендованным ценам 9 ч.
В интернет утекли маркетинговые материалы и изображения Google Pixel 9a 11 ч.
CoreWeave опровергла слухи о расторжении контрактов с Microsoft перед многомиллиардным IPO 12 ч.
Saigon Asset Management (SAM) намерена построить «крупнейший во Вьетнаме» кампус ЦОД близ Ханоя 12 ч.
Китайские учёные придумали молекулярный жёсткий диск с многоуровневой записью 13 ч.
Включить темный режим