реклама
Новости Software

«Всего несколько десятков миллионов долларов»: Anthropic обучила рассуждающий ИИ в разы дешевле конкурентов

Обучение новейшей флагманской модели искусственного интеллекта Claude 3.7 Sonnet обошлось разработавшей её компании Anthropic всего лишь в «несколько десятков миллионов долларов» и потребовало менее 1014 Тфлопс вычислительной мощности.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Об этом рассказал профессор Уортонской школы бизнеса (США) Итан Моллик (Ethan Mollick), который процитировал разъяснение, данное отделом по связям с общественностью Anthropic. «Со мной связались представители Anthropic и сказали, что Sonnet 3.7 не следует рассматривать как модель на 1026 Флопс, и стоила она всего несколько десятков миллионов долларов», — сообщил учёный, добавив, что «будущие модели окажутся намного крупнее».

Если допустить, что обучение Anthropic Claude 3.7 Sonnet действительно стоило компании «всего несколько десятков миллионов долларов» без сопутствующих расходов, то стоимость разработки систем действительно начинает снижаться. Обучение её вышедшей в минувшем году предшественницы — модели среднего размера Claude 3.5 Sonnet — обошлось в схожую сумму, рассказал гендиректор Anthropic Дарио Амодеи (Dario Amodei). Для сравнения, у OpenAI на разработку GPT-4 ушли $100 млн, а Google потратила на обучение Gemini Ultra, по оценкам, около $200 млн.

Долгосрочного снижения стоимости на обучение ИИ господин Амодеи, однако, не ожидает — они будут обходиться уже в миллиарды долларов, и это если не считать расходов на тестирование безопасности и фундаментальные исследования. Сейчас в обращение входят «рассуждающие» модели, которые дольше отвечают за запросы, а значит, ИИ будет требовать всё больше вычислительных ресурсов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
«Станет тем, чем должна была быть The Callisto Protocol»: геймплейный трейлер Cronos: The New Dawn от авторов ремейка Silent Hill 2 заинтриговал игроков 53 мин.
Microsoft позволила Copilot Studio самостоятельно управлять компьютером по заданию пользователя 60 мин.
ИИ помог Google заблокировать более 39 млн подозрительных рекламных аккаунтов 3 ч.
В классическом Outlook обнаружилась ошибка — из-за неё нагрузка на процессор при наборе текста возрастает до 50 % 3 ч.
«Путешествие важнее конечной цели»: ведущий разработчик Skyblivion отреагировал на утечку The Elder Scrolls IV: Oblivion Remastered 5 ч.
Planescape: Torment могла получить сиквел — над ним работали бывшие сценаристы Dragon Age и Fallout: New Vegas 5 ч.
Opera Mini получила ИИ-помощника Aria AI 6 ч.
Orion soft уже заместила 15 % всей бывшей инсталляционной базы VMware на рынке РФ 6 ч.
Шведские учёные обучили ИИ переводу с лошадиного 7 ч.
Похищение Дракулы, интерактивные сны и 35 квестов: сооснователь Warhorse рассказал, что вырезали из Kingdom Come: Deliverance 2 7 ч.
GeForce RTX 5060 Ti поступили в продажу — в России карты за $429 оценили от 55 тыс. рублей 30 мин.
47 дней вместо 398: вскоре срок действия новых SSL/TLS-сертификатов заметно сократится 51 мин.
IBM развернула один из мощнейших в мире квантовых компьютеров — у него 156 кубитов 55 мин.
PQ.Domains от PQ.Hosting, выделенные серверы в Германии и 47-я локация со сверхскоростными VPS 3 ч.
Представлены доступные смартфоны Acer Super ZX и Super ZX Pro, которые на самом деле не Acer 3 ч.
atNorth отдаст тепло ЦОД финскому ретейл-гиганту Kesko 4 ч.
Уникальный суперкомпьютер Anton 3 для задач молекулярной динамики введён в эксплуатацию 5 ч.
Pure Storage анонсировала младшую All-Flash СХД FlashArray//RC20 для периферийных развёртываний 6 ч.
Nvidia раскрыла характеристики мобильной GeForce RTX 5060 — третья часть мобильной RTX 5090 6 ч.
Gigabyte представила первую низкопрофильную Blackwell для геймеров — GeForce RTX 5060 OC LP с тремя вентиляторами 7 ч.