реклама
Новости Software

Apple, Microsoft, Meta✴ и Google сосредоточились на создании небольших ИИ-моделей с мощными возможностями из-за высокой стоимости LLM

Специализирующиеся в сфере ИИ компании, вложившие миллиарды долларов на создание больших языковых моделей (LLM), теперь делают ставку на «небольшие» языковые модели в качестве нового источника повышения доходов, пишет газета Financial Times. Затраты на создание и обучение таких ИИ-моделей гораздо меньше, чем на LLM.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Apple, Microsoft, Meta и Google недавно выпустили новые ИИ-модели с меньшим количеством параметров, но при этом с мощными возможностями. На этот шаг их толкнула высокая стоимость LLM, а также опасения по поводу использования собранных для обучения данных в связи с возможным нарушением авторских прав.

Такие компании, как Meta и Google, начали предлагать небольшие языковые модели всего с несколькими миллиардами параметров как более дешёвую, энергоэффективную, настраиваемую альтернативу большим языковым моделям. К тому же на обучение и запуск таких моделей требуется меньше энергии, и они способны обеспечить защиту конфиденциальных данных.

«Обладая таким высоким качеством при меньших затратах, вы фактически предоставляете клиентам возможность использовать гораздо больше приложений и выполнять такие действия, которые, по их мнению, не принесли бы им достаточной отдачи от этих инвестиций (в LLM), чтобы оправдать их реальное использование», — отметил Эрик Бойд (Eric Boyd), корпоративный вице-президент Microsoft Azure AI Platform.

Google, Meta, Microsoft и французский стартап Mistral также выпустили небольшие языковые модели с расширенными возможностями и более ориентированными на выполнение конкретных задач.

Преимущество небольших языковых моделей также заключается в том, что они могут выполнять задачи локально на устройстве, не отправляя информацию в облако, что подойдёт клиентам, заботящимся о конфиденциальности и не желающим отправлять информацию за пределы внутренних сетей. Также такие модели можно использовать на смартфонах. Например, модель Gemini Nano от Google установлена на смартфонах Pixel и Samsung S24. Apple тоже намекнула, что разрабатывает ИИ-модели для работы на смартфонах iPhone.

В свою очередь, глава OpenAI Сэм Альтман (Sam Altman) заявил, что его компания по-прежнему будет работать над созданием более крупных моделей ИИ с расширенными возможностями, способными рассуждать, планировать и выполнять задачи, и которые в конечном итоге смогут достичь такого же уровня интеллекта, как у человека.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
«Буду плакать слезами счастья»: датамайнеры Apex Legends заявили, что Titanfall 3 жива и выйдет в 2026 году 53 мин.
ИИ впервые стал студентом вуза — Венский университет прикладного искусства зачислил систему Flynn 2 ч.
Бенчмарк MLPerf показал, что ускорители AMD Instinct не уступают NVIDIA H200 2 ч.
Россия заняла четвёртое место по размеру аудитории в Kingdom Come: Deliverance 2, хотя игра в стране даже не продаётся 3 ч.
Трамп заявил, что сделка с TikTok близка к заключению, и тарифы могут пригодиться в переговорах с Китаем 6 ч.
Amazon добавила ИИ-функцию кратких обзоров книг Kindle, но предупредила о спойлерах 8 ч.
Инвесторы потребовали от Ubisoft пересмотреть условия сделки с Tencent и готовы добиваться своего через суд 13 ч.
Microsoft запустила собственный ИИ-поисковик Copilot Search 14 ч.
Спустя почти пять лет после дебюта на консолях The Last of Us Part II наконец вышла на ПК 14 ч.
ЕС оштрафует TikTok на €500 млн за передачу данных европейцев в Китай 15 ч.
Богатейшие люди мира за день потеряли $208 млрд из-за новых пошлин США 12 мин.
Cyclotech впервые подняла в воздух проворный летающий автомобиль с роторными «бочонками» вместо пропеллеров 16 мин.
NVIDIA может переключиться на выполнение заказов только из Китая в преддверии усиления санкций США 32 мин.
Zalman CNPS14X Duo Black — универсальный кулер для мощных процессоров 51 мин.
Вскоре SpaceX впервые запустит Starship на б/у ускорителе Super Heavy 2 ч.
Tenstorrent представила ИИ-ускорители Blackhole на архитектуре RISC-V 2 ч.
Один из крупнейших производителей серверов в мире анонсировал локализацию в США после повышения Трампом пошлин 2 ч.
Jabil представила оптические трансиверы для 1,6-Тбит/с сетей 3 ч.
Объем мирового рынка генеративного ИИ в 2024 году вырос более чем в четыре раза 4 ч.
Министр торговли США дал понять, что Трамп всё равно перетащит производство электроники с Тайваня 4 ч.