реклама
Новости Software

Думающая ИИ-модель OpenAI о1 получила 83 балла на математической олимпиаде США

Искусственный интеллект вступил в новую эру благодаря ИИ-модели о1 компании OpenAI, которая значительно приблизилась к человеческому мышлению. Её впечатляющий результат на тесте AIME — 83 балла из ста — позволил включить её в число 500 лучших участников математической олимпиады США. Однако такие достижения сопровождаются серьёзными вызовами, включая риски манипуляции ИИ человеком и возможность его использования для создания биологического оружия.

 Источник изображения: Saad Ahmad / Unsplash

Источник изображения: Saad Ahmad / Unsplash

Долгое время отсутствие у ИИ способности обдумывать свои ответы являлось одним из его главных ограничений. Однако ИИ-модель о1 совершила прорыв в этом направлении и продемонстрировала способность к осмысленному анализу информации. Несмотря на то, что результаты её работы пока не опубликованы в полном объёме, научное сообщество уже активно обсуждает значимость такого достижения.

Современные нейронные сети в основном функционируют по принципу так называемой «системы 1», которая обеспечивает быструю и интуитивную обработку информации. Например, такие ИИ-модели успешно применяются для распознавания лиц и объектов. Однако человеческое мышление включает также «систему 2», связанную с глубоким анализом и последовательным размышлением над задачей. ИИ-модель о1 объединяет эти два подхода, добавляя к интуитивной обработке данных сложные рассуждения, характерные для человеческого интеллекта.

Одной из ключевых особенностей о1 стала её способность строить «цепочку размышлений» — процесс, при котором система анализирует задачу постепенно, уделяя больше времени поиску оптимального решения. Эта инновация позволила ИИ-модели достичь 83 балла на тесте Американской математической олимпиады (AIME), что значительно превосходит результат GPT-4o, набравшей лишь 13 баллов. Тем не менее такие успехи связаны с возросшими вычислительными затратами и высоким уровнем энергопотребления, что ставит под сомнение экологичность разработки.

 Источник изображения: Igor Omilaev / Unsplash

Источник изображения: Igor Omilaev / Unsplash

Вместе с достижениями ИИ-модели о1 растут и потенциальные риски. Улучшенные когнитивные способности сделали её способной вводить человека в заблуждение, что, возможно, несёт серьёзную угрозу в будущем. Кроме того, уровень риска её использования для разработки биологического оружия оценён как средний — высший допустимый показатель по шкале самой OpenAI. Эти факты подчёркивают необходимость внедрения строгих стандартов безопасности и регулирования подобных ИИ-моделей.

Несмотря на значительные успехи, ИИ-модель о1 всё же сталкивается с ограничениями в решении задач, требующих долгосрочного планирования. Её способности ограничиваются краткосрочным анализом и прогнозированием, что делает невозможным решение комплексных задач. Это свидетельствует о том, что создание полностью автономных ИИ-систем остаётся задачей будущего.

Развитие ИИ-моделей, подобных о1, подчёркивает острую необходимость регулирования данной области. Эти технологии открывают перед наукой, образованием и медициной новые горизонты, однако их неконтролируемое применение может привести к серьёзным последствиям, включая угрозы безопасности и неэтичное использование. Для минимизации этих рисков требуется обеспечить прозрачность разработок ИИ, соблюдение этических стандартов и внедрение строгого надзора со стороны регулирующих органов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Гигантские курицы, наследие The Witcher 3: Wild Hunt и выбор персонажа: инсайдер поделился впечатлениями от геймплея новой Fable 23 мин.
Apple экстренно закрыла две уязвимости нулевого дня в macOS, iOS и iPadOS 2 ч.
Bethesda похвасталась успехами Starfield и анонсировала подарки для игроков 2 ч.
Niantic обучит геопространственную ИИ-модель на данных игроков Pokémon Go 3 ч.
Минцифры хочет искать телефонных мошенников по голосу 3 ч.
Инсайдер: EA организовала для Battlefield 6 крупнейшее тестирование в истории серии, чтобы избежать провалов Battlefield 5 и Battlefield 2042 3 ч.
Российские банки запустят универсальный заменитель Apple Pay на базе Bluetooth во второй половине 2025 года 5 ч.
«Не хочу, чтобы это заканчивалось»: Netflix показала трейлер взрывного финала второго сезона «Аркейн» 5 ч.
Google научила Gemini запоминать личную информацию о пользователе — для его же удобства 14 ч.
Первый полноценный трейлер фильма «Minecraft в кино» приятно удивил фанатов 15 ч.
«Ростелеком» отложил IPO облачного подразделения «РТК-ЦОД» из-за высокой ставки ЦБ РФ 47 мин.
Xiaomi представила первый в мире смартфон на Snapdragon 4s Gen 2 — Redmi A4 5G за $100 48 мин.
Первое в мире серийное беспилотное такси по себестоимость оказалось дешевле $35 000, похвасталась Baidu 2 ч.
Общая теория относительности прошла самое сложное испытание за свою историю и осталась непоколебимой 2 ч.
Duke Energy выделит ЦОД сразу 2 ГВт — вероятным заказчиком считается Microsoft 2 ч.
Весенний дебют нового iPhone SE с собственным 5G-модемом Apple почти подтверждён 2 ч.
Скидки не помогли: Apple, Xiaomi и Honor столкнулись со спадом продаж в рамках ноябрьских распродаж в Китае 2 ч.
IBM и AMD расширяют сотрудничество: Instinct MI300X появится в облаке IBM Cloud в формате «ускоритель как услуга» 3 ч.
Starlink, подвинься: спутниковый интернет от китайской SpaceSail заработает за пределами Китая 3 ч.
ЕС планирует привлечь технологии из Китая в обмен на субсидии 3 ч.