реклама
Теги → deepseek
Быстрый переход

Власти Тайваня запретили чиновникам использовать DeepSeek из соображений безопасности

С точки зрения властей КНР Тайвань является мятежным островом, над которым они хотели бы восстановить контроль. По этой причине власти Тайваня ждут от соседей какого-то подвоха, а потому использование разработок китайского стартапа DeepSeek государственными служащими и компаниями, имеющими стратегическое значение для Тайваня, было запрещено.

 Источник изображения: Unsplash, John Cameron

Источник изображения: Unsplash, John Cameron

Министерство цифровых технологий Тайваня, как сообщает Bloomberg, в пятницу заявило, что «работа DeepSeek вызывает озабоченность в сфере безопасности, связанные с трансграничной передачей информации и утечкой данных». Подобные опасения регулярно возникают в юрисдикции геополитических оппонентов КНР при распространении китайских информационных технологий по миру. Явным примером является попытка американских властей запретить деятельность китайской социальной сети TikTok в США из-за подобных опасений.

В Италии едва набравшую популярность ИИ-платформу DeepSeek уже запретили, власти Великобритании пока ограничились предупреждением в адрес своих граждан и представителей бизнеса, Министерство обороны США запретило сотрудникам использовать DeepSeek. Компании в различных странах по своей личной инициативе запретили сотрудникам пользоваться разработками DeepSeek. Подобная ситуация возникали и на заре распространения американского ChatGPT, когда прецедент с использованием сотрудником Samsung конфиденциальных корпоративных данных для содействия в разработках со стороны чат-бота привёл к запрету на подобные действия для всего штата компании.

По словам тайваньских чиновников, DeepSeek «угрожает национальной информационной безопасности», поскольку имеет китайские корни. Соответственно, запрещено вводить конфиденциальную или официальную информацию через интерфейс этой платформы. Это требование распространяется не только на тайваньских чиновников, но и на представителей компаний, формирующих критическую инфраструктуру острова.

Китайский ИИ-чат-бот DeepSeek лидирует по загрузкам во всём мире, больше всего скачиваний — в Индии

Чат-бот AI Assistant на основе искусственного интеллекта китайского стартапа DeepSeek возглавил список самых загружаемых мобильных приложений в 140 странах, причем наибольший процент новых пользователей приходится на Индию, пишет Bloomberg.

 Источник изображения: DeepSeek

Источник изображения: DeepSeek

По данным сервиса аналитики Appfigures, которые не включают сторонние магазины приложений в Китае, 26 января приложение AI Assistant вышло на первое место в интернет-магазине App Store компании Apple и с тех пор удерживает лидирующую позицию во всем мире. При это на Индию приходится 15,6 % всех загрузок на разных платформах с момента запуска чат-бота.

Согласно исследованию Sensor Tower, приложение AI Assistant также занимает первое место в магазине приложений Android Play Store компании Alphabet в США, которое оно удерживает с 28 января. Sensor Tower сообщила, что за первые 18 дней с момента запуска приложение стартапа DeepSeek было скачано 16 млн раз, что почти вдвое превышает 9 млн скачиваний, зафиксированных у ChatGPT компании OpenAI после выхода.

Вместе с тем число пользователей ChatGPT значительно превышает аудиторию AI Assistant, у которого могут возникнуть проблемы с дальнейшим ростом, поскольку правительства и компании обеспокоены потенциальными последствиями его использования для кибербезопасности. Сотни фирм и государственных подрядчиков заблокировали DeepSeek в качестве меры предосторожности, сообщило агентство Bloomberg News на этой неделе.

DeepSeek могла тайно получать ускорители Nvidia через Сингапур в обход санкций, заподозрили власти США

Сложно было отрицать, что успехи китайского ИИ-стартапа DeepSeek вызвали в США не только восхищение конкурентов, но и озабоченность чиновников. Microsoft заподозрила, что обучение языковых моделей DeepSeek могло происходить за счёт нелегального доступа к данным OpenAI, а ещё власти США подозревают, что китайская компания могла получить доступ к ускорителям Nvidia в обход санкций через посредников в Сингапуре.

 Источник изображения: Nvidia

Источник изображения: Nvidia

В прошлом году Сингапуру удалось избежать тотального запрета на получение и транзитную отгрузку ускорителей вычислений американского происхождения, но в начале этого года администрация Байдена успела ограничить подобные поставки через введение квот. Без экспортной лицензии США в Сингапур можно поставить не более 1700 ускорителей Nvidia, но даже такая партия потребует уведомления американских властей. Более крупную партию они могут просто заблокировать.

Nvidia регистрирует в Сингапуре до 20 % всей своей выручки, но поясняет, что фактически поставляет в крохотное государство гораздо меньше продукции, чем можно было подумать. Через сингапурские компании просто проходит оплата за поставку продукции Nvidia, а фактически отгрузка осуществляется во множество других стран, включая западные.

Считается, что DeepSeek для обучения своей модели V3, представленной в прошлом месяце, использовала 2048 ускорителей Nvidia серии H800. Их поставки в Китай были под запретом с конца 2023 года, но установить, каким образом DeepSeek получила доступ к этим ускорителям, затруднительно. Сейчас, по данным Bloomberg, американские чиновники предполагают, что китайские разработчики использовали посредников в Сингапуре для получения ускорителей вычислений, запрещённых к ввозу в Китай напрямую. Nvidia поспешила заявить, что контролирует поставки ускорителей и придерживается экспортных ограничений, наложенных США.

Как стало известно недавно, новая администрация США хочет включить ускорители Nvidia H20, которые пока можно ввозить в Китай легально, в расширенный список экспортного контроля. Потенциальный министр торговли США Ховард Лютник (Howard Lutnick) заявил, что не намерен поощрять использование китайской стороной «американских инструментов» для соперничества в сфере искусственного интеллекта. По его словам, доступ Китая к определённым категориям ускорителей вычислений американского происхождения нужно перекрыть.

Microsoft открыла доступ к DeepSeek R1 своим клиентам в GitHub и Azure

Компания Microsoft на удивление оперативно предоставила доступ своим клиентам к продвинутой ИИ-модели DeepSeek R1 со способностью к размышлению, пишет The Verge. Теперь она является частью каталога моделей на Azure AI Foundry и GitHub, что позволяет клиентам Microsoft интегрировать её в свои приложения ИИ.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

«Одним из ключевых преимуществ использования DeepSeek R1 или любой другой модели на Azure AI Foundry является скорость, с которой разработчики могут экспериментировать и интегрировать ИИ в свои рабочие процессы», — отметила Аша Шарма (Asha Sharma), корпоративный вице-президент Microsoft по ИИ. По её словам, DeepSeek R1, анонс которой привёл к резкому падению акций многих технологических компаний США на этой неделе из-за возможности обучения с гораздо меньшими затратами по сравнению с ведущими моделями OpenAI, прошла строгие проверки защищённости в формате Red Teaming и безопасности, включая автоматизированные оценки поведения модели и обширные проверки безопасности для снижения потенциальных рисков.

Microsoft также вскоре сделает уменьшенную версию R1 доступной для локального запуска на ПК Copilot Plus, и вполне возможно, что R1 появится в других сервисах на базе ИИ от Microsoft.

Ранее появились сообщения о том, что OpenAI и Microsoft проводят расследование по поводу возможного использования китайской компанией API OpenAI для обучения своих моделей.

Переписки с ИИ-ботом DeepSeek и другие конфиденциальные данные попали в открытый доступ

Американская компания Wiz, которая специализируется на вопросах кибербезопасности, рассказала, что обнаружила в открытом доступе базу данных ClickHouse китайской лаборатории искусственного интеллекта DeepSeek — среди имеющейся в ней информации оказалась переписка с чат-ботом и другая конфиденциальная информация.

 Источник изображения: wiz.io

Источник изображения: wiz.io

Эксперты Wiz провели сканирование ресурсов DeepSeek и выяснили, что китайская компания оставила незащищёнными несколько миллионов строк данных. В этом наборе оказались программные ключи API и журналы переписки — DeepSeek сохраняет запросы, которые пользователи отправляют чат-боту с ИИ. Также база содержала значительный объем истории чатов, внутренних данных и конфиденциальной информации, включая эксплуатационные данные, которые позволяли повышать привилегии пользователя без обхода механизмов защиты.

Wiz уведомила о своей находке китайскую компанию, и та оперативно закрыла незащищённую информацию. «Они убрали её менее чем за час. Но это было так просто обнаружить, что мы сочли себя не единственными, кто это нашёл», — рассказали в Wiz.

В Wiz уточнили, что ClickHouse — разработанная «Яндексом» система управления базами данных с открытым исходным кодом, предназначенная для быстрых аналитических запросов к большим наборам данных. Система широко используется для обработки данных в реальном времени, хранения журналов и аналитики больших данных.

Выпущенный DeepSeek виртуальный помощник с ИИ взволновал общественность в Китае и вызвал переполох в США. Китайской компании удалось добиться того же, чего и OpenAI, но при значительно более скромных затратах. Инвесторы в Америке поставили под сомнение устойчивость бизнес-моделей и рентабельность американских гигантов в области ИИ, в том числе Nvidia и Microsoft. К понедельнику приложение DeepSeek обогнало ChatGPT в Apple App Store, что спровоцировало масштабную распродажу акций технологических компаний.

Radeon RX 7900 XTX обогнала GeForce RTX 4090 в работе с ИИ-моделью DeepSeek R1

Компания AMD заявила, что её флагманская видеокарта Radeon RX 7900 XTX обеспечивает более высокую производительность по сравнению с GeForce RTX 4090 и RTX 4080 Super в работе с ИИ-моделью DeepSeek R1. По словам генерального менеджера подразделения клиентских процессоров AMD и графики Radeon Дэвида Макафи (David McAfee), их флагман на архитектуре RDNA 3 обходит RTX 4090 до 13 %, а модель RTX 4080 Super — до 34 % в этих задачах.

 Источник изображений: AMD

Источник изображений: AMD

AMD протестировала три видеокарты с несколькими конфигурациями DeepSeek R1. Модель Radeon RX 7900 XTX обеспечила наиболее значительное превосходство над RTX 4090 в работе с ИИ-моделью DeepSeek R1 Distill Qwen 7B (7 млрд параметров), где обошла представителя поколения Ada Lovelace на 13 %. В трёх других конфигурациях LLM карта AMD также оказалась эффективнее конкурента: в двух задачах Distill Llama 8B (8 млрд параметров) её превосходство составило 11 %, а в Distill Qwen 14B (14 млрд параметров) она была на 2 % быстрее. Модель GeForce RTX 4090 оказалась быстрее Radeon RX 7900 XTX лишь в одной конфигурации LLM — Distill Qwen 32B (32 млрд параметров), где её превосходство составило 4 %.

AMD также сравнила ИИ-производительность Radeon RX 7900 XTX с GeForce RTX 4080 Super. В работе с ИИ-моделью DeepSeek R1 Distill Qwen 7B (7 млрд параметров) «красная» карта показала 34-процентное превосходство над конкурентом. В задачах Distill Llama 8B и Distill Qwen 14B преимущество видеокарты AMD сократилось до 27 и 22 % соответственно.

Как пишет портал Tom’s Hardware, результаты тестов, предоставленных AMD, следует воспринимать с некоторой долей скепсиса. Во-первых, речь идёт о внутренних тестах компании, а не о независимых испытаниях. Во-вторых, неизвестно, как были настроены видеокарты Nvidia для этих тестов. В конце концов, не все рабочие нагрузки ИИ требуют использования всех вычислительных возможностей GPU. Например, Stable Diffusion может не задействовать вычисления FP8 или код TensorRT для обработки.

Карты Radeon RX 7900 XTX нечасто применяются в качестве специализированных ускорителей ИИ, однако их архитектура вполне позволяет это делать. RDNA 3 в составе Radeon RX 7900 XTX способна выполнять матричные операции, поддерживая вычисления BF16 и INT8. AMD даже официально использует словосочетание «ускоритель ИИ» в рекламных материалах об архитектуре RDNA 3, чтобы продемонстрировать её возможности в задачах искусственного интеллекта. В составе графического процессора Radeon RX 7900 XTX присутствуют 192 блока ускорения ИИ.

Ранее AMD также опубликовала инструкцию, как использовать новую ИИ-модель DeepSeek R1 на её потребительском аппаратном обеспечении, включая видеокарты Radeon RX 7900 XTX.

AMD показала, как запустить думающую ИИ-модель DeepSeek R1 на обычном ПК

Компания AMD опубликовала инструкции по локальному запуску продвинутой ИИ-модели DeepSeek R1 со способностью к размышлению на пользовательских ПК. Правда, необходима система на процессоре Ryzen с ИИ-ускорителем (NPU) XDNA, либо компьютер с настольной видеокартой Radeon RX 7000. Также для запуска требуется драйвер Adrenalin 25.1.1.

 Источник изображения: AMD

Источник изображения: AMD

Как утверждается, только недавно была представлена «высокоэффективная» малая версия ИИ-модели DeepSeek R1, достаточно компактная для работы на потребительском оборудовании. Стоит отметить, что в целом модели DeepSeek отличаются небольшими запросами к железу — например, модель DeepSeek-V3 изначально обучалась на кластере всего из 2048 ускорителей Nvidia H800.

В инструкции AMD описывается всё, что нужно для локального запуска DeepSeek R1 на пользовательской системе на базе аппаратного обеспечения AMD. В LM Studio есть установщик больших языковых моделей в один клик, специально разработанный для процессоров Ryzen AI. Его же пользователи AMD могут использовать для установки R1. В ролике компания также показывает, как приложение должно быть настроено для конкретного оборудования, а также объясняет, какое максимальное количество параметров LLM поддерживается тем или иным оборудованием.

Последнее в значительной степени зависит от объёма доступной памяти. Например, видеокарты Radeon RX 7600 XT, RX 7700 XT, RX 7800 XT, RX 7900 GRE и RX 7900 XT поддерживают модели до DeepSeek-R1-Distill-Qwen-14B с 14 млрд параметров. Флагманская карта Radeon RX 7900 XTX позволяет запускать модели до DeepSeek-R1-Distill-Qwen-32B с 32 млрд параметров. А модель Radeon RX 7600, имеющая на борту всего 8 Гбайт памяти, поддерживает запуск моделей до DeepSeek-R1-Distill-Llama-8B с 8 млрд параметров.

Ноутбуки на базе процессоров Ryzen 8040 и Ryzen 7040 с 32 Гбайт ОЗУ, а также системы на базе процессоров Ryzen AI 9 HX 370 и Ryzen AI 9 365, оснащённые 24 или 32 Гбайт оперативной памяти, могут запускать модели до DeepSeek-R1-Distill-Llama-14B. Ноутбуки на базе Ryzen AI Max+ 395 поддерживают модели до DeepSeek-R1-Distill-Llama-70B с 70 млрд параметров, но только при наличии 64 или 128 Гбайт ОЗУ. Версии лэптопов с 32 Гбайт памяти могут запускать модели до DeepSeek-R1-Distill-Qwen-32B с 32 млрд параметров.

Новая модель искусственного интеллекта DeepSeek R1 в одночасье покорила мир, поскольку затраты на её обучение оказались в 11 раз ниже, чем у передовых ИИ-моделей конкурентов. Два дня назад она стала причиной рекордной потери рыночной капитализации Nvidia в размере 589 миллиардов долларов. Модель DeepSeek R1 полагается на экстремальные уровни оптимизации, чтобы обеспечить 11-кратный рост эффективности. DeepSeek R1 работает не только на ускорителях Nvidia и AMD, но также сообщается о поддержке ускорителей Huawei Ascend.

DeepSeek пропал из App Store и Google Play в Италии — до этого власти решили выяснить, как сервис обрабатывает персональные данные

Китайская лаборатория DeepSeek, которая обрела популярность благодаря выпуску революционных моделей искусственного интеллекта, предлагающих возможности, аналогичные американским, но при более скромных затратах на обучение, привлекла внимание итальянских властей — они обеспокоены «возможной угрозой для данных миллионов людей» в стране. Приложение DeepSeek уже исчезло из итальянских разделов App Store и Google Play.

 Источник изображения: Solen Feyissa / unsplash.com

Источник изображения: Solen Feyissa / unsplash.com

Приложение DeepSeek стало самым популярным на платформе Apple App Store, и итальянское Управление по защите данных (Garante) обратилось к китайской компании с просьбой предоставить информацию о чат-боте, который может представлять угрозу конфиденциальности жителей страны. Надзорный орган отвечает за применение норм «Общего регламента по защите данных» (GDPR) в Италии.

Garante сообщило, что связалось с офисами DeepSeek в Ханчжоу и Пекине и запросило информацию о том, какие персональные данные собирает чат-бот с ИИ. Ведомство поинтересовалось, каковы цели сбора данных и хранятся ли они на серверах, физически расположенных на территории Китая. В «Политике конфиденциальности» DeepSeek действительно указано, что сервис передаёт персональные данные, связанные со страной проживания пользователя, и хранит их «на защищённых серверах, расположенных в Китайской Народной Республике». Однако отмечается, что «это будет делаться в соответствии с требованиями применимых законов о защите данных».

Итальянский регулятор также запросил, какие данные используются для обучения системы искусственного интеллекта DeepSeek. Если производится сканирование веб-страниц, то каким образом зарегистрированные и незарегистрированные пользователи информируются об обработке персональных данных. DeepSeek дали 20 дней на ответ Garante. Расследование в отношении китайской лаборатории уже проводят Microsoft и OpenAI; изучать вопрос начали и американские власти.

Любопытно, что спустя несколько часов после того, как Garante запросило у DeepSeek информацию об обработке персональных данных, приложение исчезло из итальянских разделов магазинов Apple App Store и Google Play. Официальных комментариев от Apple и Google по этому вопросу не последовало.

Microsoft заподозрила DeepSeek в обучении ИИ на данных, украденных у OpenAI

Компании Microsoft и OpenAI проведут расследование на предмет того, не совершила ли организация, связанная с китайской лабораторией искусственного интеллекта DeepSeek, кражу данных у OpenAI. Об этом сообщило агентство Bloomberg со ссылкой на собственные источники.

 Источник изображения: deepseek.com

Источник изображения: deepseek.com

Эксперты отдела безопасности Microsoft ещё осенью обратили внимание, что некие лица, которые, по мнению корпорации, могут быть связаны с DeepSeek, запрашивают большие объёмы данных через API OpenAI, рассказали источники Bloomberg. OpenAI продаёт доступ к API — этот инструмент позволяет сторонним разработчикам интегрировать модели искусственного интеллекта OpenAI в свои приложения. Microsoft как технологический партнёр и крупнейший инвестор OpenAI уведомила компанию о происходящем. Эта деятельность может нарушать условия обслуживания OpenAI или указывать, что связанная с китайской лабораторией компания пыталась обойти ограничения на объём данных, который могут получить клиенты OpenAI.

Ранее DeepSeek представила открытую модель ИИ R1, имитирующую ход мыслей человека. Проект всколыхнул рынок, на котором доминируют OpenAI и другие американские компании, в том числе Google и Meta. По словам создателей, модель может конкурировать или превосходит проекты ведущих американских разработчиков, а её обучение обошлось радикально дешевле. В результате возникла угроза американскому доминированию в отрасли ИИ, и в понедельник, 27 января, рыночная капитализация технологических компаний США, включая Microsoft, Nvidia, Oracle и Alphabet, просела почти на $1 трлн.

Накануне, 28 января, советник президента США Дональда Трампа (Donald Trump) по вопросам ИИ Дэвид Сакс (David Sacks) заявил, что есть «существенные доказательства» использования моделей OpenAI при разработке технологий DeepSeek. В интервью господин Сакс рассказал о методе дистилляции, позволяющий одной модели ИИ обучаться на данных другой для развития аналогичных возможностей. «Мы знаем, что компании из КНР — и прочие — постоянно пытаются произвести дистилляцию моделей ведущих американских компаний в области ИИ. Как ведущий разработчик ИИ мы принимаем контрмеры для защиты нашей интеллектуальной собственности, включая тщательный процесс развёртывания передовых возможностей у выпускаемых моделей, и уверены, что по мере движения вперёд критически важно тесно сотрудничать с правительством США, чтобы наиболее эффективным образом защитить самые функциональные модели от попыток неприятеля и конкурентов завладеть американскими технологиями», — прокомментировали заявление Сакса в OpenAI.

Акции Nvidia подскочили на 9 % после недавнего обрушения и потянули за собой остальной рынок

Успехи китайского стартапа DeepSeek в создании эффективной языковой модели с умеренными затратами на этой неделе были отмечены даже прямыми конкурентами как в сфере бизнеса, так и геополитической. Реакция западного фондового рынка, который первоначально обвалился, на второй день сменилась ростом. Акции Nvidia, например, во вторник успели подорожать почти на 9 %.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Конечно, в случае с Nvidia акциям компании не удалось отыграть всё падение понедельника, которое измерялось 17 %, но смена вектора движения определённо воодушевила инвесторов. В понедельник капитализация Nvidia упала на рекордные $595 млрд. Очевидно, это позволило кому-то приобрести акции компании по более низкой цене, и теперь возобновление роста позволяет рассчитывать на получение прибыли в будущем. Тем более, что по сравнению с началом недели акции Nvidia до сих пор более чем на 9 % дешевле. По сравнению с историческим максимумом, достигнутым в январе, акции Nvidia дешевле на 23 %. Объём торгов этими ценными бумагами в понедельник достиг $562,2 млрд. Количество заявок на покупку оказалось в два раза выше, чем на продажу.

Представители Barclays заявили, что доказательства возможности создания эффективных языковых моделей с меньшими затратами в действительности являются благоприятным фактором для эмитентов типа Nvidia, ведь распространение систем искусственного интеллекта за счёт этого только ускорится, а это значит, что продукция компании будет пользоваться стабильным спросом.

Как дополняет Reuters, фондовые индексы в целом вернулись к росту во вторник, переварив новости об успехах DeepSeek, но компенсировать недавнее падение они пока не смогли. Акции Oracle выросли в цене на 3,6 % после падения на 13,8 %, в случае с Marvell Technology отскок достиг 3,5 % после падения на 19 %. Ценные бумаги Broadcom подросли в цене на 2,6 % после снижения на 17,4 %. А вот акции ASML в Европе продолжили падение, хотя и ограничились 1 % снижения во вторник после 6 % по итогам понедельника.

Китайское ИИ-приложение DeepSeek попало в топы App Store и Google Play в России

Китайский чат-бот DeepSeek стремительно набирает популярность в России. Приложение вошло в топы App Store и Google Play, обогнав многие известные сервисы. Успех DeepSeek связан с его доступностью в России и хорошей функциональностью, что и привлекло внимание пользователей, но одновременно вызвало беспокойство у конкурентов в США.

 Источник изображения: Copilot

Источник изображения: Copilot

По данным РБК, 28 января DeepSeek возглавил рейтинг самых популярных приложений в российском App Store. В Google Play, который является наиболее востребованной платформой в России и мире, приложение поднялось со 115-го на 20-е место всего за сутки. При этом число загрузок приложения на территории РФ за неделю выросло в три раза и превысило 43 тысячи, свидетельствуя о растущем интересе к технологиям искусственного интеллекта.

DeepSeek представляет из себя чат-бот, созданный на основе большой языковой модели искусственного интеллекта (LLM). Его разработчиком является китайская компания, основанная в 2023 году Лян Вэньфэном (Liang Wenfeng), соучредителем хедж-фонда High-Flyer. ИИ-бот способен генерировать тексты, искать информацию в интернете, расшифровывать диаграммы, писать и форматировать код, а также решать сложные задачи по программированию на таких языках, как C++, Python, Java и других.

ИИ-Модель DeepSeek-V3, которая легла в основу чат-бота, была опубликована в конце прошлого года и, согласно технической документации, «продемонстрировала производительность, сопоставимую с ведущими американскими аналогами, но с той лишь разницей, что ресурсов для вычислений потребовалась значительно меньше». Компания использовала графические процессоры Nvidia H800, представляющие из себя менее передовую (замедленную) версию видеокарты H100, специально созданную для Китая в рамках ограничений США. Однако за счёт разработки инновационных алгоритмов удалось достигнуть впечатляющей функциональности. Стоимость аренды Nvidia H800 на обучение модели составила $2 за 1 час и в сумме обошлась компании менее чем в $10 млн.

Стоит сказать, что успех DeepSeek вызвал беспокойство у американских технологических гигантов, таких как Microsoft, Alphabet (владелец Google) и Meta, так как их затраты на разработку искусственного интеллекта исчисляются сотнями миллиардов долларов. На этом фоне инвесторы засомневались в необходимости высокотехнологичных чипов Nvidia, что даже привело к краткосрочному падению котировок компании почти на 18 % с частичным восстановлением на следующий день (8 %). При этом Nvidia назвала новую китайскую модель DeepSeek R1 существенным достижением в области ИИ, а Сэм Альтман (Sam Altman) признал, что DeepSeek теперь является конкурентом OpenAI.

Alibaba представила мощную ИИ-модель Qwen2.5-Max, которая лучше GPT-4o и DeepSeek V3

Alibaba Cloud, облачное подразделение китайской компании Alibaba, анонсировала выпуск обновлённой, крупномасштабной языковой модели Qwen2.5-Max. ИИ-модель основана на архитектуре Mixture-of-Experts (MoE) и обучена на более чем 20 триллионах токенов. Разработчики подчёркивают, что инструмент показал «значительный прогресс в интеллектуальных возможностях» и уже доступен для использования.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

Новая версия модели отличается улучшенной производительностью и точностью, способна лучше справляться с задачами, требующими глубокого понимания контекста, таких как анализ текста, перевод и генерация контента. «Qwen2.5-Max демонстрирует значительный прогресс в обработке сложных запросов и предоставлении релевантных ответов», — пишет компания на страницах своего блога.

Qwen2.5-Max была протестирована в ряде ключевых бенчмарков, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Модель показала превосходство над DeepSeek V3 в таких тестах, как Arena-Hard, LiveBench и LiveCodeBench, а также продемонстрировала конкурентоспособные результаты в MMLU-Pro. В сравнении с другими ведущими моделями, такими как GPT-4o и Claude-3.5-Sonnet, Qwen2.5-Max также подтвердила свои лидирующие позиции.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

Alibaba Cloud планирует интегрировать Qwen2.5-Max в свои облачные сервисы, что позволит клиентам использовать инструмент для решения широкого спектра задач, включая автоматизацию обработки данных, улучшение взаимодействия с клиентами через чат-ботов и оптимизацию бизнес-процессов.

ИИ-модель уже доступна через сервис Qwen Chat, в котором пользователи могут взаимодействовать с Qwen2.5-Max, тестировать её возможности и экспериментировать с различными функциями. Для разработчиков также открыт программный интерфейс API. Для доступа необходимо зарегистрироваться в Alibaba Cloud, активировать сервис Model Studio и создать API-ключ.

Успех DeepSeek ударил по акциям азиатских ИИ-компаний, а глава Nvidia вчера потерял $20 млрд

Китайская лаборатория DeepSeek, которая выпустила несколько обученных почти за бесценок моделей искусственного интеллекта, спровоцировала падение акций крупнейших в мире игроков, связанных с отраслью, сообщает Reuters. Досталось и владельцам этих компаний, чьи состояния также уменьшились.

 Гендиректор Nvidia Дженсен Хуанг. Источник изображения: nvidia.com

Гендиректор Nvidia Дженсен Хуанг. Источник изображения: nvidia.com

Падение акций Nvidia накануне завершилось на отметке 17 % — компания подешевела на $593 млрд, и это крупнейший однодневный спад в истории фондового рынка. Ко вторнику акции Nvidia на торгах во Франкфурте отыграли 6 %, Oracle подорожала на 3,4 %, а Palantir — на 2,97 %. В целом же европейский рынок оказался к технологическим компаниям отнюдь не благосклонным. Advantest, производитель оборудования для тестирования чипов и поставщик Nvidia, накануне потерял 9 % и сегодня ещё 10 %; японский финансовый конгломерат SoftBank Group, который активно инвестирует в технологическую отрасль, подешевел на 5 %.

Нидерландский производитель оборудования для выпуска чипов ASML потерял 7,1 % вчера и 1 % сегодня; снижение Schneider Electric, ASM International и Infineon составило от 1,2 % до 4,7 %. На торгах в США акции Broadcom рухнули на 17,4 %, Microsoft подешевела на 2,1 %, холдинг Alphabet к закрытию потерял 4,2 %. Филадельфийский фондовый индекс PHLX Semiconductor Sector упал на 9,2 %, и это антирекорд с марта 2020 года. До свершившегося накануне крупномасштабного падения Nvidia стоимость ценных бумаг компании в 60 раз превышала её прибыль — в индексе S&P 500 этот показатель в среднем равен 22.

Положение на рынке сложилось безрадостное: на волне бума ИИ капитализация компаний «великолепной семёрки» (Apple, Microsoft, Alphabet, Amazon, Nvidia, Tesla и Meta) выросла на $10 трлн. Сначала инвесторы занимали средства, чтобы покупать эти акции, теперь они продают другие активы, чтобы покрыть убытки. Усугубляет положение широкое присутствие «торговых роботов» — инвесторов, которые принимают решения, исходя из оценки алгоритмами.

 Динамика акций «великолепной семёрки» и других компаний индекса S&P 500 с начала 2025 года. Источник изображения: reuters.com

Динамика акций «великолепной семёрки» и других компаний индекса S&P 500 с начала 2025 года. Источник изображения: reuters.com

Успех DeepSeek губительно отозвался и на личных состояниях владельцев крупнейших технологических компаний: 500 самых богатых людей мира потеряли $108 млрд. Состояние главы Nvidia Дженсена Хуанга (Jensen Huang) сократилось на $20,1 млрд или на 20 %; соучредитель Oracle Ларри Эллисон (Larry Ellison) потерял 12 % своего состояния или $22,6 млрд; глава Dell Майкл Делл (Michael Dell) стал беднее на $13 млрд, а убыток создателя криптобиржи Binance Чанпэна Чжао (Changpeng Zhao) составил $12,1 млрд. Богатейшие люди технологического сектора потеряли $94 млрд, приняв на себя падение примерно 85 % общего падения индекса Bloomberg. Индекс Nasdaq Composite показал снижение на 3,1%, а S&P 500 — на 1,5%.

До этого состояния богатейших предпринимателей в технологической сфере на фоне бума ИИ показывали колоссальный рост. С начала 2023 года по минувшую пятницу, 24 января 2025 года, чистый капитал Дженсена Хуанга вырос в 8 раз до $121 млрд; состояние главы Meta Марка Цукерберга (Mark Zuckerberg) за тот же период показало рост на 385 % до $229 млрд; бывший глава Amazon Джефф Безос (Jeff Bezos) стал богаче на 133 % до $254 млрд. И не все они проиграли на фоне успеха DeepSeek: Meta восстановилась после падения в начале торговой сессии, а Марк Цукерберг увеличил состояние на $4,3 млрд; Джефф Безос положил в копилку ещё $632 млн.

Трамп и Альтман высоко оценили успехи китайского ИИ-стартапа DeepSeek и заявили, что США смогут лучше

Распространение новейшей языковой модели китайской компании DeepSeek зародило в умах инвесторов сомнения по поводу способности американских компаний и далее удерживать лидерство в сфере ИИ, а главное — доказало, что высокого быстродействия можно добиться при меньших затратах. Президент Дональд Трамп (Donald Trump) и глава OpenAI Сэм Альтман (Sam Altman) похвалили DeepSeek, но подчеркнули, что США способны на большее.

 Источник изображения: DeepSeek

Источник изображения: DeepSeek

По крайней мере, в своём выступлении во Флориде Дональд Трамп заявил, что много читал в последние дни о прогрессе китайской компании DeepSeek, которая продемонстрировала современную языковую модель, созданную со значительно меньшими аппаратными и материальными ресурсами по сравнению с американскими разработками. По мнению президента США, подобный прецедент идёт на пользу его стране, поскольку «мы сможем сделать то же самое, при этом не затрачивая так много средств и получая такой же результат, как хотелось бы надеяться». На встрече с политическим руководством Китая, по словам Трампа, он услышал признания заслуг американских учёных. По его мнению, если китайской стороне удалось создать более дешёвую технологию в сфере искусственного интеллекта, американские компании последуют за ней.

Один из основателей и глава OpenAI Сэм Альтман (Sam Altman) заявил со страниц социальной сети X, что «DeepSeek R1 является впечатляющей моделью, особенно с точки зрения соотношения результата и стоимости». Он тут же добавил: «Мы очевидно сможем предложить значительно лучшие модели. Иметь нового конкурента — это реально очень воодушевляет. Мы ускорим выпуск некоторых моделей».

Компания Nvidia также не удержалась от комментариев и накануне тоже выразила восхищение итогами работы DeepSeek, подчеркнув, что подобный высокий результат был достигнут в условиях экспортных ограничений США и относительно небольшого бюджета. «Работа DeepSeek показывает, как могут создаваться новые модели без нарушения экспортного контроля», — говорится в сообщении Nvidia. Рекордное падение капитализации самой Nvidia на фоне успехов DeepSeek представителей компании не расстроило. Напротив, они отметили, что создание искусственного интеллекта с возможностью рассуждения потребует значительных количеств GPU данной марки, а также высокоскоростных телекоммуникационных решений.

Попутно бывший генеральный директор Intel Патрик Гелсингер (Patrick Gelsinher) также положительно оценил достижения как китайской DeepSeek, так и всего ПО с открытым исходным кодом в сфере создания систем искусственного интеллекта. Он отметил, что хотя специфика работы китайских компаний и не позволяет судить об истинной величине затрат DeepSeek на создание своей модели R1, но имеющиеся доказательства говорят о том, что они оказались в 10 или 50 раз ниже, чем в случае с моделью o1 компании OpenAI. По словам Гелсингера, инженеры его собственного стартапа Gloo, создающего чат-бот Kallm, уже используют языковую модель DeepSeek R1, хотя технически у них есть возможность применять o1 компании OpenAI. В дальнейшем Gloo перейдёт на языковую модель с открытым исходным кодом собственной разработки. Как признался Гелсингер, «открытое побеждает, DeepSeek полностью изменит мир всё более закрытых моделей в сфере ИИ». Вычисления, по словам Гелсингера, подчиняются тем же законам, что и газы. Чем дешевле становится ПО, тем сильнее расширяется рынок для его применения.

Посещаемость ИИ-чат-бота DeepSeek взлетела с 300 000 до 6 млн человек, не обошлось и без DDoS

Китайский ИИ-стартап DeepSeek столкнулся с резким ростом интереса к своим продуктам. Согласно данным аналитического сервиса Similarweb, ежедневное количество посещений сайта компании увеличилось с 280 тысяч до 6,2 миллиона. Такой скачок произошёл после выпуска 26 декабря третьей версии их чат-бота V3. В последующие дни трафик начал стремительно расти, достигнув 2 миллионов посещений в день.

 Источник изображения: Unsplash, Faizi Sheikh

Источник изображения: Unsplash, Faizi Sheikh

К началу января ежедневный трафик на сайт DeepSeek достиг 3,1 млн посещений, а к концу недели пересёк отметку в 5 млн. Пик интереса пришёлся на 24 января, когда аналитический сервис Similarweb зафиксировал 6,2 миллиона посещений. Как пишет PCMag, этот рост совпал с распространением информации о том, что технологии DeepSeek могут составить серьёзную конкуренцию американским компаниям на рынке искусственного интеллекта (ИИ). Хотя цифры, касающиеся посещаемости, всё ещё значительно уступают OpenAI, чей чат-бот ежедневно привлекает более 100 миллионов человек, успех DeepSeek очевидно свидетельствует о растущем интересе к разработкам компании.

Отмечается, что одной из причин популярности DeepSeek стали их последние модели V3 и R1, которые требуют значительно меньше вычислительных ресурсов и снижают затраты на их использование. По мнению экспертов, компания использует такие технологии, которые способны нанести удар по бизнес-моделям американских технологических гигантов, таких как Nvidia, OpenAI и Microsoft. «Развёртывание замороженных атомных электростанций никогда не было решением. У нас есть огромные возможности для повышения эффективности ИИ», — выразил своё мнение в Twitter генеральный директор Cloudflare Мэттью Принс (Matthew Prince).

Однако рост популярности DeepSeek привлёк не только пользователей, но и хакеров. Вчера утром компания сообщила о «крупномасштабной злонамеренной атаке» на свой сайт, что даже вынудило её временно ограничить регистрацию новых пользователей.

При этом уже существующие пользователи сохранили доступ к сервису, а DeepSeek временно разрешила регистрацию только для пользователей с китайскими номерами телефонов (+86). Тем не менее, позднее ограничения были смягчены, так как удалось частично справится с техническими трудностями, которые были вызваны DDoS-атакой.

window-new
Soft
Hard
Тренды 🔥
Nival выложила в открытый доступ исходный код культовой российской стратегии «Блицкриг» 2 ч.
Apple предупредила владельцев iPhone в ста странах об атаке шпионского ПО 2 ч.
Ежемесячная аудитория WhatsApp превысила 3 миллиарда пользователей 2 ч.
Microsoft представила три новые малые ИИ-модели семейства Phi-4 2 ч.
Цукерберг похвастался, что месячная аудитория Threads превысила 350 млн — до X ещё далеко 4 ч.
В приложении Meta AI появится платная подписка — Meta хочет заработать $1,4 триллиона на ИИ к 2035 году 5 ч.
Google добавила в «Сообщения» кнопку «Отписаться», чтобы избавить пользователей от надоедливых рассылок 5 ч.
Ubisoft раскрыла планы на улучшения Assassin’s Creed Shadows, а в файлах игры обнаружили следы мультиплеера 5 ч.
Microsoft стала крупнейшим издателем в Sony PlayStation Store и зафиксировала 45-процентный рост PC Game Pass за год 6 ч.
Electronic Arts и Codemasters заморозили разработку симуляторов ралли — студия выпускала их с 1998 года 6 ч.
Microsoft анонсировала резкое подорожание Xbox Series X и S по всему миру — главные игры Xbox теперь будут стоить 80 долларов 2 ч.
Совет директоров Tesla утверждает, что не ищет замену Маску и верит в его «потрясающий план роста» 2 ч.
Qualcomm резко нарастила продажи чипов, но слабый прогноз на будущее разочаровал инвесторов 5 ч.
Показатели Microsoft четвёртый квартал кряду превзошли ожидания аналитиков благодаря ИИ и облакам 6 ч.
NASA рассказало, что нового зонд «Юнона» помог узнать о Юпитере и его вулканическом спутнике Ио 6 ч.
Ненастная метавселенная: Meta отчиталась об $4,2 млрд убытков в Reality Labs за первый квартал 6 ч.
Совет директоров Tesla начал искать замену Маску, но это не точно 8 ч.
Hobot представил новый флагманский робот-мойщик окон S7 Pro 9 ч.
Зонд «Психея» аварийно отключил двигатели — в NASA пока не знают, что случилось 9 ч.
Эрнст возглавил направление продаж и маркетинга в Intel 10 ч.
Включить темный режим