реклама
Новости Software

Google представила компактную языковую модель Gemma 2 2B, которая превосходит GPT 3.5 Turbo

Компания Google представила Gemma 2 2B — компактную, но мощную языковую модель искусственного интеллекта (LLM), которая может составить конкуренцию лидерам отрасли, несмотря на свой значительно меньший размер. Новая языковая модель, содержащая всего 2,6 миллиарда параметров, демонстрирует производительность не хуже гораздо более крупных аналогов, включая OpenAI GPT-3.5 и Mistral AI Mixtral 8x7B.

 Источник изображений: Google

Источник изображений: Google

В тесте LMSYS Chatbot Arena, популярной онлайн-платформы для сравнительного тестирования и оценки качества моделей искусственного интеллекта, Gemma 2 2B набрала 1130 баллов. Этот результат немного опережает результаты GPT-3.5-Turbo-0613 (1117 баллов) и Mixtral-8x7B (1114 баллов) — моделей, обладающих в десять раз большим количеством параметров.

Google сообщает, что Gemma 2 2B также набрала 56,1 балла в тесте MMLU (Massive Multitask Language Understanding) и 36,6 балла в тесте MBPP (Mostly Basic Python Programming), что является значительным улучшением по сравнению с предыдущей версией.

Gemma 2 2B бросает вызов общепринятому мнению, что более крупные языковые модели изначально работают лучше компактных. Производительность Gemma 2 2B показывает, что сложные методы обучения, эффективность архитектуры и высококачественные наборы данных могут компенсировать недостаток в числе параметров. Разработка Gemma 2 2B также подчеркивает растущую важность методов сжатия и дистилляции моделей ИИ. Возможность эффективно компилировать информацию из более крупных моделей в более мелкие открывает возможности к созданию более доступных инструментов ИИ, при этом не жертвуя их производительностью.

Google обучила Gemma 2 2B на огромном наборе данных из 2 триллионов токенов, используя системы на базе своих фирменных ИИ-ускорителей TPU v5e. Поддержка нескольких языков расширяют её потенциал для применения в глобальных приложениях. Модель Gemma 2 2B имеет открытый исходный код. Исследователи и разработчики могут получить доступ к модели через платформу Hugging Face. Она также поддерживает различные фреймворки, включая PyTorch и TensorFlow.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Microsoft отмела слухи о том, что устанавливает спорную ИИ-функцию Recall на ПК без ведома пользователей 3 ч.
BioWare: следующая Mass Effect не пойдёт по пути Dragon Age: The Veilguard со стилизованной графикой 4 ч.
Авторы «Смуты» раскрыли дату выхода переработанной озвучки — она станет частью «по-настоящему знакового» обновления игры 7 ч.
14 лет ожидания подошли к концу: Red Dead Redemption наконец вышла на ПК 8 ч.
«Яндекс» увеличил в III квартале выручку более чем на треть, сократив убытки 9 ч.
«Это лучше, чем Switch 2»: Nintendo шокировала фанатов анонсом Xenoblade Chronicles X: Definitive Edition 9 ч.
«Яндекс Браузер» стал популярнее Google Chrome в России 9 ч.
Дата выхода, ранний доступ и новая демоверсия: голливудская стратегия Hollywood Animal от авторов This is the Police получила геймплейный трейлер 10 ч.
ГК «Солар» приобрела 10 % долю в Luntry, специализирующейся на контейнерной безопасности 13 ч.
В веб-версии Gmail появился ИИ-помощник по написанию писем 13 ч.
OpenAI скоро начнёт использовать ускорители AMD и выпустит собственный ИИ-чип в 2026 году 2 ч.
Новая статья: Обзор наушников AirPods 4: классика Apple, но с шумоподавлением 3 ч.
Илон Маск удвоит, а после утроит мощность ИИ-суперкомпьютера xAI Colossus — там будет 300 тыс. Nvidia H100 и H200 5 ч.
Formula V Line представила в России корпусные вентиляторы Air Bridge Plus и Floe Plus, а также блоки питания APMM-BM и APMM-GM 5 ч.
Xiaomi представила мощный внешний аккумулятор 165W Power Bank 10000 со встроенным кабелем USB-C 6 ч.
Xiaomi представила Mesh-систему BE3600 Pro с поддержкой Wi-Fi 7 6 ч.
ИИ будет засорять Землю миллионами тонн электронного мусора каждый год 7 ч.
Раскрыты подробности архитектуры ИИ-кластера xAI Colossus со 100 тыс. ускорителей NVIDIA H100 7 ч.
Xiaomi представила телевизоры TV S Pro Mini LED 2025 — 4K, до 240 Гц и до 100 дюймов 7 ч.
«Убийца Porsche Taycan»: Xiaomi представила 1500-сильный электрический спорткар SU7 Ultra за $114 тысяч 7 ч.