реклама
Новости Software

Мощнейшая ИИ-модель OpenAI o3 тратит до $30 000 на решение одной задачи

В декабре OpenAI представила рассуждающую модель искусственного интеллекта o3 и продемонстрировала результаты бенчмарка ARC-AGI — самого сложного теста для оценки возможностей ИИ. Теперь результаты теста пришлось пересмотреть, и выглядят они менее впечатляющими: модель оказалась слишком дорогой в обслуживании.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

На минувшей неделе организация Arc Prize Foundation, ответственная за ARC-AGI, обновила свою оценку затрат на вычисления для OpenAI o3. Первоначально считалось, что её наиболее мощная конфигурация o3 high требует расходов в размере около $3000 на решение одной задачи ARC-AGI. Теперь же было установлено, что стоимость обслуживания намного выше — она, возможно, достигает $30 000 за задачу. Это иллюстрирует, насколько дорогими могут оказаться самые сложные современные модели ИИ в определённых задачах, по крайней мере, на начальном этапе. Цену на o3 компания OpenAI ещё не установила, и в общий доступ модель не поступила, но в Arc Prize Foundation предположили, что можно ориентироваться на показатели OpenAI o1-pro.

«Считаем, что o1-pro является более близким сравнением [для определения] истинной стоимости o3 <..> из-за объёма используемых во время тестирования вычислений. Но это не точная оценка, и мы оставили для o3 пометку о предварительной версии в нашей таблице лидеров, чтобы отразить неопределённость, пока не объявлена официальная цена», — рассказали в Arc Prize Foundation ресурсу TechCrunch. Известно, что при решении одной задачи o3 high использовала в 172 раза больше вычислительных ресурсов в ARC-AGI, чем o3 low — наиболее слабая модель в линейке.

Ранее стало известно, что тарифные планы на передовые системы OpenAI могут оказаться чрезвычайно дорогостоящими — до $20 000 в месяц за работу специализированных агентов ИИ. При этом моделям свойственно ошибаться: той же o3 high потребовалось 1024 попытки для решения каждой задачи теста ARC-AGI, чтобы показать лучший результат.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
11 bit studios подтвердила разработку двух новых игр, включая следующую Frostpunk 10 мин.
«Станет тем, чем должна была быть The Callisto Protocol»: геймплейный трейлер Cronos: The New Dawn от авторов ремейка Silent Hill 2 заинтриговал игроков 2 ч.
Microsoft позволила Copilot Studio самостоятельно управлять компьютером по заданию пользователя 2 ч.
ИИ помог Google заблокировать более 39 млн подозрительных рекламных аккаунтов 4 ч.
В классическом Outlook обнаружилась ошибка — из-за неё нагрузка на процессор при наборе текста возрастает до 50 % 4 ч.
«Путешествие важнее конечной цели»: ведущий разработчик Skyblivion отреагировал на утечку The Elder Scrolls IV: Oblivion Remastered 6 ч.
Planescape: Torment могла получить сиквел — над ним работали бывшие сценаристы Dragon Age и Fallout: New Vegas 6 ч.
Opera Mini получила ИИ-помощника Aria AI 7 ч.
Orion soft уже заместила 15 % всей бывшей инсталляционной базы VMware на рынке РФ 7 ч.
Шведские учёные обучили ИИ переводу с лошадиного 8 ч.
Представлен геймерский смартфон Nubia RedMagic 10 Air — со Snapdragon 8 Gen 3 и батареей на 6000 мА·ч за $475 52 мин.
Будущее OLED-мониторов за квантовыми точками — QD-OLED захватят 73 % рынка в этом году 59 мин.
GeForce RTX 5060 Ti поступили в продажу — в России карты за $429 оценили от 55 тыс. рублей 2 ч.
47 дней вместо 398: вскоре срок действия новых SSL/TLS-сертификатов заметно сократится 2 ч.
IBM развернула один из мощнейших в мире квантовых компьютеров — у него 156 кубитов 2 ч.
PQ.Domains от PQ.Hosting, выделенные серверы в Германии и 47-я локация со сверхскоростными VPS 4 ч.
Представлены доступные смартфоны Acer Super ZX и Super ZX Pro, которые на самом деле не Acer 4 ч.
atNorth отдаст тепло ЦОД финскому ретейл-гиганту Kesko 5 ч.
Уникальный суперкомпьютер Anton 3 для задач молекулярной динамики введён в эксплуатацию 6 ч.
Pure Storage анонсировала младшую All-Flash СХД FlashArray//RC20 для периферийных развёртываний 7 ч.
Включить темный режим