реклама
Новости Software

DeepSeek обновила открытую модель V3, улучшив её навыки программирования

DeepSeek выпустила обновление ИИ-модели V3, получившее название V3-0324, которое, как сообщается, предоставляет лучшие возможности для программирования, одновременно устанавливая новые стандарты точности и эффективности, пишет Bloomberg. Обновление было опубликовано на платформе Hugging Face без официального анонса.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Открытая ИИ-модель DeepSeek V3 была представлена в конце прошлого года. Модель построена на архитектуре Mixture of Experts (MoE, набор экспертов) с общим количеством параметров 671 млрд и 37 млрд параметров, активируемых на каждый токен.

Как сообщила тогда компания, на обучение DeepSeek V3 ушло $5,5 млн, что значительно ниже расходов других технологических компаний, таких как OpenAI, на обучение аналогичных моделей. Спустя несколько недель DeepSeek выпустила открытую рассуждающую модель R1, которая, несмотря на скромный бюджет на разработку, превзошла ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

В январе 2025 года приложение DeepSeek опередило ИИ-чат-бот ChatGPT и вышло на первое место в рейтинге самых популярных бесплатных приложений в интернет-магазине Apple App Store в США. Достижения китайского стартапа вызвали вопросы у инвесторов по поводу обоснованности громадных затрат американских компаний на разработку ИИ-технологий, что привело к обрушению ИИ-рынка, в результате которого его участники столкнулись со значительным падением акций. В частности, лидер рынка Nvidia потеряла за день $593 млрд рыночной стоимости, что было крупнейшим однодневным падением в истории фондового рынка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
CD Projekt зареклась использовать генеративный ИИ в The Witcher 4 и других новых играх 28 мин.
Инсайдер показал, как будет выглядеть iOS 19, но это не точно 42 мин.
Криптовалютный банк Трампа запустит свой стейблкоин, привязанный к доллару 2 ч.
Легендарный игровой журнал Game Informer вернулся из мёртвых благодаря студии Нила Бломкампа 4 ч.
CD Projekt подтвердила, когда выйдет The Witcher 4 — не раньше 2027 года 13 ч.
Правительство возьмёт объекты КИИ на карандаш и наведёт порядок в деле миграции на отечественное ПО 14 ч.
Новая компания сооснователя Blizzard анонсировала мультиплеерный шутер Wildgate, который выглядит как Sea of Thieves в космосе 14 ч.
Google представила Gemini 2.5 Pro — свою самую умную ИИ-модель, которая превзошла OpenAI o3 14 ч.
Инсайдер раскрыл план выпуска игр для Nintendo Switch 2 — консоль выйдет в июне 16 ч.
ЕС намерен «обуздать хищническую монетизацию» игр и запретить продажу внутриигровой валюты детям 17 ч.
Китай ударит по Nvidia новыми экологическими нормами — компания потеряет до $17 млрд выручки в год 7 мин.
Глава квантового подразделения Google пообещал настоящий прорыв в технологиях через пять лет 19 мин.
Выход Cerebras Systems на IPO откладывается из-за задержки рассмотрения американским регулятором CFIUS 27 мин.
Noctua показала жидкостный кулер, который работает без помпы, и обозначила сроки его дебюта 29 мин.
Российские производители электроники пожаловались на слабые продажи и попросили субсидий и ограничений импорта 2 ч.
BMW объединилась с Alibaba для совместной разработки автомобильного ИИ 2 ч.
Руководитель Alibaba предупредил о перегреве рынка ЦОД для искусственного интеллекта 2 ч.
SMART Modular представила энергонезависимые модули памяти CXL E3.S 3 ч.
Объём рынка корпоративного WLAN-оборудования в 2024 году сократился на 12,7 % 3 ч.
Учёные открыли чёрные дыры «на максималках» — сегодня таких уже нет 3 ч.