реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
AMD выпустила драйвер с поддержкой открытой «беты» Call of Duty: Black Ops 6, Star Wars Outlaws, Final Fantasy XVI и других игр 53 мин.
OpenAI и Anthropic согласились сдавать новейшие ИИ-модели на проверку властям США 2 ч.
Selfloss выйдет на ПК раньше обещанного — это меланхоличное приключение в мире славянских и исландских сказочных образов 2 ч.
«Словами не передать, как сильно я жду эту игру»: геймеров покорила геймплейная демонстрация Clair Obscur: Expedition 33 2 ч.
Крупнейшие сайты интернета запретили Apple собирать их данные для обучения ИИ 3 ч.
Сценарий Kingdom Come: Deliverance 2 оказался даже больше, чем у Baldur’s Gate 3, и претендует на рекорд 3 ч.
Разработчики ремейка первой Gothic прояснили странности демоверсии с gamescom 2024 и пообещали оптимизировать игру «по максимуму» 4 ч.
Бразилия грозит заблокировать X, если Маск не назначит законного представителя соцсети в стране 6 ч.
ИИ — дело дорогое: OpenAI намерена привлечь новые миллиардные инвестиции 7 ч.
VK собрала видеоконтент всех своих платформ в одном облаке на 1,5 млрд Гбайт 8 ч.
Motorola представила смартфон Edge 50 Neo, а старший Edge 50 добрался до глобального рынка 31 мин.
Infinix представила смартфоны Zero 40 4G и Zero 40 5G с чипами MediaTek, 108-Мп камерами и быстрыми AMOLED 2 ч.
Квартальные результаты NVIDIA и прогноз превысили ожидания Уолл-стрит, но акции упали на 7 % 3 ч.
Акции Supermicro обрушились после обвинений Hindenburg Research 4 ч.
Власти Нидерландов запретят ASML обслуживать машины для выпуска чипов в Китае 5 ч.
Илон Маск показал ИИ-суперкластер Tesla Cortex из 50 тыс. ускорителей NVIDIA 5 ч.
Серверная мощь в настольном корпусе — HYPERPC построила мощнейшую рабочую станцию с 6 Тбайт оперативной памяти 6 ч.
CoreWeave развернёт в Швеции крупнейший в Европе ИИ-кластер NVIDIA Blackwell 7 ч.
SpaceX запретили запускать ракеты Falcon 9 из-за опрокинувшейся первой ступени 7 ч.
Huawei продолжает отбирать рынок смартфонов у Apple в Китае — это обеспечивает активный рост выручки 7 ч.