реклама
Новости Software

Исследователи нашли способ масштабирования ИИ без дополнительного обучения, но это не точно

Группа исследователей из Google и Калифорнийского университета в Беркли предложила новый метод масштабирования искусственного интеллекта (ИИ). Речь идёт о так называемом «поиске во время вывода», который позволяет модели генерировать множество ответов на запрос и выбирать лучший из них. Этот подход может повысить производительность моделей без дополнительного обучения. Однако сторонние эксперты усомнились в правильности идеи.

 Источник изображения: сгенерировано AI

Источник изображения: сгенерировано AI

Ранее основным способом улучшения ИИ было обучение больших языковых моделей (LLM) на всё большем объёме данных и увеличение вычислительных мощностей при запуске (тестировании) модели. Это стало нормой, а точнее сказать, законом для большинства ведущих ИИ-лабораторий. Новый метод, предложенный исследователями, заключается в том, что модель генерирует множество возможных ответов на запрос пользователя и затем выбирает лучший. Как отмечает TechCrunch, это позволит значительно повысить точность ответов даже у не очень крупных и устаревших моделей.

В качестве примера учёные привели модель Gemini 1.5 Pro, выпущенную компанией Google в начале 2024 года. Утверждается, что, используя технику «поиска во время вывода» (inference-time search), эта модель обошла мощную o1-preview от OpenAI по математическим и научным тестам. Один из авторов работы, Эрик Чжао (Eric Zhao), подчеркнул: «Просто случайно выбирая 200 ответов и проверяя их, Gemini 1.5 однозначно обходит o1-preview и даже приближается к o1».

Тем не менее, эксперты посчитали эти результаты предсказуемыми и не увидели в методе революционного прорыва. Мэтью Гуздиал (Matthew Guzdial), исследователь ИИ из Университета Альберты, отметил, что метод работает только в тех случаях, когда можно чётко определить правильный ответ, а в большинстве задач это невозможно.

С ним согласен и Майк Кук (Mike Cook), исследователь из Королевского колледжа Лондона. По его словам, новый метод не улучшает способность ИИ к рассуждениям, а лишь помогает обходить существующие ограничения. Он пояснил: «Если модель ошибается в 5 % случаев, то, проверяя 200 вариантов, эти ошибки просто станут более заметны». Основная проблема состоит в том, что метод не делает модели умнее, а просто увеличивает количество вычислений для поиска наилучшего ответа. В реальных условиях такой подход может оказаться слишком затратным и малоэффективным.

Несмотря на это, поиск новых способов масштабирования ИИ продолжается, поскольку современные модели требуют огромных вычислительных ресурсов, а исследователи стремятся найти методы, которые позволят повысить уровень рассуждений ИИ без чрезмерных затрат.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
МТС объявила о закрытии своего заменителя YouTube и TikTok 3 ч.
Meta AI добрался до Европы, но с ограничениями и без обучения на данных пользователей 4 ч.
Hazelight спрятала в Split Fiction секретный уровень, за прохождение которого можно было выиграть бесплатную поездку в Швецию 4 ч.
Microsoft призвала пользователей утилизировать старые ПК и обновиться до Windows 11 13 ч.
Xbox упомянула Hollow Knight: Silksong в списке игр 2025 года — фанаты замерли в предвкушении 14 ч.
ЕС обязал Apple упростить подключение сторонних смарт-часов к iPhone — в компании заявили, что это «это плохо для пользователей» 14 ч.
Исследователи нашли способ масштабирования ИИ без дополнительного обучения, но это не точно 15 ч.
ЕС потребовал от Google прекратить ущемлять конкурентов в поисковой выдаче и пригрозил штрафом до $35 млрд 16 ч.
По мотивам творчества легендарной метал-группы Voivod выйдет «умопомрачительная» метроидвания Voivod: The Nuclear Warrior 17 ч.
Лошадь есть, ума не надо: сюжетный платформер Brute Horse отправит игроков в абсурдный мир, где даже конь может стать оружием 18 ч.
Tesla куда-то подевала $1,4 млрд, и объяснений этому пока нет 14 мин.
Micron, Samsung и SK Hynix представили компактные модули памяти SOCAMM для ИИ-серверов 23 мин.
«ИКС Холдинг» купил российского разработчика радиоэлектроники и телекомоборудования «Микран» 30 мин.
В США создали робота, вдохновлённого белкой — он может прыгать с ветки на ветку 35 мин.
Huawei представил широкоформатную раскладушку Pura X с экраном 16:10 за $1050 58 мин.
HP Inc отвертелась от компенсаций по иску о блокировке сторонних картриджей, но на уступки пошла 2 ч.
Провал Boeing Starliner не заставил NASA отказаться от этого корабля — он снова полетит на МКС 2 ч.
Nvidia перестала быть геймерской компанией, а стала «фабрикой ИИ» 3 ч.
Даже доступные SSD скоро подорожают: китайская YMTC анонсировала повышения цен на флеш-память на 10 % 4 ч.
Установлены самые строгие ограничения на квантовую гравитацию — это ключ для «теории всего» 4 ч.