реклама
Новости Software

Google представила рассуждающую ИИ-модель Gemini 2.5 Flash с высокой производительностью и эффективностью

Google выпустила новую ИИ-модель, призванную обеспечить высокую производительность с упором на эффективность. Она называется Gemini 2.5 Flash и вскоре станет доступна в составе платформы Vertex AI облака Google Cloud для развёртывания и управления моделями искусственного интеллекта (ИИ).

 Источник изображения: Google

Источник изображения: Google

Компания отмечает, что Gemini 2.5 Flash предлагает «динамические и контролируемые» вычисления, позволяя разработчикам регулировать время обработки запроса в зависимости от их сложности.

«Вы можете настроить скорость, точность и баланс затрат для ваших конкретных нужд. Эта гибкость является ключом к оптимизации производительности Flash в высоконагруженных и чувствительных к затратам приложениях», — написала компания в своём официальном блоге.

На фоне растущей стоимости использования флагманских ИИ-моделей Gemini 2.5 Flash может оказаться крайней полезной. Более дешёвые и производительные модели, такие как 2.5 Flash, представляют собой привлекательную альтернативу дорогостоящим флагманским вариантам, но ценой потери некоторой точности.

Gemini 2.5 Flash — это «рассуждающая» модель по типу o3-mini от OpenAI и R1 от DeepSeek. Это означает, что для проверки фактов ей требуется немного больше времени, чтобы ответить на запросы. Google утверждает, что 2.5 Flash идеально подходит для работы с большими объёмами данных и использования в реальном времени, в частности, для таких задач, как обслуживание клиентов и анализ документов.

«Эта рабочая модель оптимизирована специально для низкой задержки и снижения затрат. Это идеальный движок для отзывчивых виртуальных помощников и инструментов резюмирования в реальном времени, где эффективность при масштабировании является ключевым фактором», — описывает новую ИИ-модель компания.

Google не опубликовала отчёт по безопасности или техническим характеристикам для Gemini 2.5 Flash, что усложнило задачу определения её преимуществ и недостатков. Ранее компания говорила, что не публикует отчёты для моделей, которые она считает экспериментальными.

Google также объявила, что с третьего квартала планирует интегрировать модели Gemini, такие как 2.5 Flash в локальные среды. Они будут доступны в Google Distributed Cloud (GDC), локальном решении Google для клиентов со строгими требованиями к управлению данными. В компании добавили, что работают с Nvidia над установкой Gemini на совместимые с GDC системы Nvidia Blackwell, которые клиенты смогут приобрести через Google или по своим каналам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Объём экспорта российского ПО в 2024 году рухнул в полтора раза, но это не точно 6 ч.
Более трети российских компаний удаляют персональные данные вручную 8 ч.
ИИ-лаборатория Meta, создавшая модель Llama, постепенно угасает — в компании назвали это «новым началом» 9 ч.
Двухлетняя модель GPT-4 скоро исчезнет из ChatGPT, уступив место более свежей GPT-4o 16 ч.
ChatGPT обошёл Instagram и TikTok, став самым скачиваемым приложением в мире 16 ч.
Новая статья: inZOI — прощайте, симы. Предварительный обзор 21 ч.
Студия выходцев из Blizzard показала Causal Loop — вдохновлённую Portal и «Интерстеллар» головоломку, где нужно перезаписывать реальность 22 ч.
SaaS в России продолжает расти, однако не все направления показывают положительную динамику 23 ч.
В Ирландии проверят законность обучения ИИ-модели Grok на постах европейцев в X 23 ч.
«Я так долго об этом мечтал»: моддер добавил в Dark Souls Remastered бесшовный кооператив на шестерых 11-04 19:15
Недавно проснувшаяся чёрная дыра показала «дикий» аппетит, ошеломивший учёных 51 мин.
Подорожание iPhone, видеокарт и прочей электроники отменяется — Трамп вывел их из-под действия повышенных пошлин 58 мин.
В 2024 госзакупки ИИ-оборудования увеличились на 150 % до 2,4 млрд рублей 5 ч.
Разработчик оптических чипов-коммутаторов на основе кремниевой фотоники nEye Systems получил на развитие $58 млн 6 ч.
Разработчик охлаждения чипов с помощью лазеров наобещал с три короба и теперь ищет помощи у учёных 6 ч.
Asus представила бюджетную плату X870 MAX Gaming WiFi7 для Ryzen 9000 7 ч.
Asus представила первый в мире 610-Гц геймерский монитор — ROG XG248Q5G-P за $1100 7 ч.
Asus представила геймерский мини-ПК ROG NUC 2025 — Core Ultra 9 и GeForce RTX 5080 в трёхлитровом корпусе за $3335 8 ч.
PowerColor скоро выпустит видеокарту Radeon RX 9070 XT Red Devil с уникальными задними пластинами 8 ч.
Близкую к нам галактику Малое Магелланово Облако прямо сейчас разрывает на части, выяснили японские учёные 8 ч.