реклама
Теги → ии
Быстрый переход

Илон Маск померялся ИИ-амбициями с Сэмом Альтманом и пообещал, что xAI получит до 50 млн GPU за пять лет

Илон Маск (Elon Musk) раскрыл амбициозные планы своей компании xAI по наращиванию вычислительных мощностей — в течение пяти лет планируется достичь производительности, эквивалентной 50 миллионам Nvidia H100. Этот шаг, очевидно, стал ответом на заявление главы OpenAI Сэма Альтмана (Sam Altman), который на днях сообщил о намерении использовать более 1 миллиона GPU к концу года с последующим увеличением их количества в 100 раз.

 Источник изображения: Mariia Shalabaieva/Unsplash

Источник изображения: Mariia Shalabaieva/Unsplash

Как пишет PCMag, компания Маска xAI собирается в течение пяти лет развернуть инфраструктуру, эквивалентную 50 миллионам H100, но с более высокой энергоэффективностью. Реализация таких планов потребует колоссальных ресурсов, включая не только закупку оборудования, но и привлечение высококлассных специалистов. При этом Маск не обязательно будет приобретать именно 50 миллионов GPU, поскольку Nvidia уже выпустила более мощные модели, такие как GB200, обеспечивающие до 2,5-кратного прироста производительности.

Стремление к таким масштабам объясняется необходимостью постоянно быть впереди конкурентов в разработке следующих поколений ИИ. В настоящее время суперкомпьютер xAI Colossus в Мемфисе (Теннесси) насчитывает 230 тысяч GPU, включая 30 тысяч более мощных Nvidia GB200. Второй ЦОД планируется оснастить 550 тысячами GPU, в том числе новыми чипами GB300.

Однако для обеспечения работы таких мощностей требуются огромные объёмы электроэнергии. На объекте в Мемфисе используются газовые турбины, что вызывает обеспокоенность экологических организаций из-за ухудшения качества воздуха в регионе. В то же время рост инвестиций в ИИ-инфраструктуру демонстрирует, насколько затратным становится технологический прогресс в этой сфере.

Nvidia, в свою очередь, продолжает разрабатывать новые архитектуры GPU — Rubin и Feynman, которые должны повысить эффективность будущих решений, а глава Meta Марк Цукерберг (Mark Zuckerberg) также анонсировал масштабные инвестиции в дата-центры для разработки ИИ-систем следующего поколения.

ИИ-обзоры Google отобрали огромную долю трафика у сайтов, показало исследование

Внедрение ИИ-обзоров (AI Overviews) в поисковой выдаче Google привело к значительному снижению переходов на сайты. К такому выводу пришли аналитики Pew Research Center, изучив ситуацию. Хотя Google утверждает, что AI Overviews не отбирают трафик у издателей, исследования показывают обратное: при наличии ИИ-сводок количество кликов падает с 15 % до 8 % и только 1 % пользователей реально переходят по ссылкам, указанным в обзорах.

 Источник изображения: Google

Источник изображения: Google

Сервис начал тестировать технологию ИИ-сводок в мае 2023 года, а в мае 2024 года они стали постоянным элементом результатов поиска. С тех пор многие сайты отметили падение трафика. Эксперты в области SEO неоднократно выражали обеспокоенность по поводу влияния ИИ на поисковую выдачу, и данные Pew Research Center подтвердили эти опасения, пишет Ars Technica.

 Источник изображения: Pew Research Center

Источник изображения: Pew Research Center

Особую тревогу вызывает тот факт, что пользователи всё чаще завершают поиск сразу после просмотра ИИ-сводок, не переходя по ссылкам. Это может привести к распространению недостоверной информации, поскольку, как известно, генеративный ИИ склонен к «галлюцинациям». Кроме того, источники, на которые ссылается ИИ, в подавляющем большинстве представлены крупными платформами — Wikipedia, YouTube и Reddit, на которые приходятся 15 % всех ссылок в ответах.

Распространение AI Overviews продолжается: каждый пятый поисковой запрос теперь сопровождается ИИ-ответом. Особенно часто это происходит при поиске в форме вопросов — в 60 % случаев, и в 36 % случаев при полноформатных запросах. По оценкам аналитиков Pew, эта тенденция вряд ли изменится в ближайшее время. В то же время, несмотря на ухудшение условий для веб-изданий, прибыль Google остаётся рекордной.

Windows 11 получила обновлённый Copilot Vision и другие свежие ИИ-функции

Microsoft начала постепенный выпуск новых функций искусственного интеллекта для Windows 11, включая инструмент Copilot Vision, который может сканировать и анализировать содержимое экрана. Функции будут доступны всем, однако некоторые из них появятся только на компьютерах Copilot+PC, сообщает The Verge.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Copilot Vision теперь можно использовать через приложение Copilot. С его помощью можно задавать вопросы о том, что отображается на экране, включая открытые приложения и веб-страницы. Например, можно спросить, как улучшить освещение на фотографии или выполнить какие-либо другие задачи. Тестирование Copilot Vision Microsoft начала ещё в декабре 2024 года, когда функция была представлена как часть обновления Microsoft Edge, но теперь возможности инструмента значительно расширены.

 Функция сканирования экрана Copilot Vision. Источник изображения: Microsoft

Функция сканирования экрана Copilot Vision. Источник изображения: Microsoft

Владельцы Copilot+PC смогут воспользоваться ИИ-агентом в приложении «Параметры», который понимает голосовые команды. Достаточно сказать «включи тихий режим» или «подключи устройство Bluetooth», и система выполнит команду. Кроме того, на этих компьютерах появится улучшенная версия функции Click to Do: если зажать клавишу Windows и кликнуть левой кнопкой мыши на текст, приложение или другой элемент, можно быстро получить ИИ-сводку, создать черновик документа в Microsoft Word с помощью Copilot или запланировать встречу в Teams.

 Источник изображения: Microsoft

Функция Click to Do. Источник изображения: Microsoft

Также только для Copilot+PC разработчики добавили генератор стикеров в Paint и инструмент для выделения и редактирования отдельных объектов на изображениях. В приложении «Фотографии» появится ИИ-регулировка освещения, а в «Ножницах» появится функция «идеального скриншота», которая использует ИИ для точного захвата нужной области экрана.

Помимо новых ИИ-функций, Microsoft добавит и другие улучшения, доступные для всех пользователей Windows 11. Например, в «Ножницах» появится пипетка для выбора цвета, а операционная система сможет автоматически исправлять ошибки, приводящие к неожиданным перезагрузкам.

По заявлению компании, все перечисленные функции будут реализованы в течение следующего месяца. Однако некоторые из них уже доступны в предварительном обновлении Windows, а некоторые можно загрузить через Microsoft Store.

Возобновление поставок ускорителей Nvidia H20 в Китай таит в себе кучу рисков и неопределённости

Осведомлённые источники недавно уже предупреждали, что в случае необходимости возобновить выпуск чипов для ускорителей H20 на конвейере TSMC сделать это будет не так просто, да и сама Nvidia отмечала, что на нормализацию поставок может уйти до девяти месяцев. Тайваньские СМИ поясняют, что этим перечень возможных проблем не ограничивается.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Издание Commercial Times подчёркивает, что основная часть необходимых для обслуживания заказов по H20 кремниевых пластин уже была отгружена TSMC компании Nvidia и её прочим подрядчикам. Вероятность возобновления выпуска этих чипов на стороне TSMC сейчас не так велика, и она будет полностью зависеть от размера партии в составе вероятных новых заказов, если до них вообще дойдёт дело.

TSMC и без этого загружена заказами на выпуск чипов 5-нм класса, к которому относится и 4-нм техпроцесс, применяемый при производстве H20. Доля выручки TSMC от реализации 5-нм чипов держится на уроне около 35–36 % на протяжении примерно года, сейчас это самый востребованный класс техпроцессов среди клиентов тайваньского контрактного производителя. Более того, сохраняются проблемы с упаковкой чипов по методу CoWoS-S, который также используется при производстве ключевых компонентов для H20. Компании TSMC по-прежнему не хватает профильных мощностей для удовлетворения всего спроса. Она пытается наращивать производство, но делает это осторожно. Ситуация со спросом также непредсказуема.

Проблема с H20 усугубляется тем, что за пределами Китая ускорители типа H20 никому особо не нужны, поскольку Nvidia там может легально предлагать куда более производительные решения. Если компания окажется с излишками таких ускорителей для Китая в результате падения спроса, это создаст ей новые проблемы. По этой причине Nvidia пока не готова размещать заказы на выпуск дополнительных партий H20. Тем более, что на китайском рынке уже могут появиться достойные конкуренты для этих ускорителей в лице того же Huawei Ascend 910C. По объёму памяти типа HBM3 он уже достигает паритета с H20, поскольку располагает 96 Гбайт соответствующей памяти. Если санкции США продолжат требовать от Nvidia снижения производительности своих ускорителей для рынка КНР, то спрос на них может сократиться.

Для Nvidia, как считается, менее рискованной стратегией может оказаться выпуск решений, унифицированных с ускорителями для других рынков, типа модифицированных RTX Pro 6000, которые она собирается вывести на китайский рынок к сентябрю. Эта новинка довольствуется памятью типа GDDR7, которая уступает по быстродействию HBM3, но существенно дешевле. В случае, если такие ускорители просто не будут брать в Китае, компания сохранит возможность переориентировать их на другие географические направления. По мнению некоторых источников, H20 по данным причинам станет последним ускорителем для Китая, оснащаемым более дорогой памятью HBM.

Впрочем, на китайском рынке есть игроки, которые всё же выиграют от возобновления поставок H20 в краткосрочной перспективе. Компания DeepSeek, как считается, затормозила разработку своей языковой модели R2 из-за нехватки ускорителей данной модели. Если поставки возобновятся, это будет способствовать более заметному прогрессу DeepSeek в обучении R2. Модель R1 предыдущего поколения полагалась главным образом на ускорители H20, коих было задействовано 30 000 штук, а ещё компанию им составили 10 000 ускорителей H800 и 10 000 ускорителей H100. Поставки двух последних были запрещены в Китай ранее.

Илон Маск намерен привлечь ещё $12 млрд кредитов на закупку ускорителей Nvidia для Grok

Глядя, как щедро привлекает средства инвесторов на развитие своих вычислительных мощностей конкурирующая OpenAI, возглавляющий xAI Илон Маск (Elon Musk) наверняка не хочет отставать. Ему приписывали намерения направить на развитие xAI средства родственных компаний SpaceX и Tesla, но теперь сообщается о готовности увеличить долговую нагрузку на xAI на дополнительные $12 млрд.

 Источник изображения: Unsplash, Мария Шалабаева

Источник изображения: Unsplash, Мария Шалабаева

Как подчёркивает The Wall Street Journal, эта сумма не учитывает те $10 млрд, которые Маск, предположительно, привлёк несколько недель назад в виде кредитов и в результате продажи акций холдинга xAI. Теперь миллиардер якобы ведёт переговоры с проверенным кредитором по поводу предоставления xAI ещё $12 млрд на возвратной основе. Точнее говоря, аккумулировать средства кредиторов на эти нужды поручено Valor Equity Partners, чей основатель Антонио Грациас (Antonio Gracias) имеет с Маском тесные деловые контакты.

Как ожидается, кредитные средства будут направлены на закупку новой партии ускорителей Nvidia, которая потом будет передана xAI на условиях лизинга для обслуживания потребностей нового центра обработки данных. Новые вычислительные мощности будут введены для развития чат-бота Grok. Некоторые из потенциальных кредиторов стремятся ограничить риски, связанные с этой сделкой. Часть из них настаивает, чтобы долг был погашен в течение трёх лет, а сумма новых заимствований была ограничена.

Сам Илон Маск на этой неделе заявил, что для обучения Grok используются 230 000 ускорителей Nvidia, из которых 30 000 относятся к новому поколению GB200. Вычислительная нагрузка, связанная с формированием логических выводов (инференсом), передана облачным провайдерам. Маск пообещал в скором времени запустить новый суперкластер, состоящий из 550 000 ускорителей GB200 и GB300. По некоторым оценкам, xAI за текущий год потратит около $13 млрд на подобные нужды. Ранние слухи о намерениях Маска привлечь капитал на развитие стартапа он прокомментировал в духе опровержения, отметив, что у него и партнёров достаточно денег.

«Яндекс» выпустит «Нейроаналитика» — ИИ-агента для визуализации данных

В сентябре подразделение Yandex B2B Tech выпустит агента с искусственным интеллектом под названием «Нейроаналитик», предназначенного для анализа и визуализации данных, сообщили в компании.

 Источник изображения: yandex.ru/company

Источник изображения: yandex.ru/company

«Нейроаналитик» поможет находить важные закономерности и делать выводы по данным в таблицах и графиках, а также создавать и редактировать сложные визуальные представления данных. Это поможет снизить нагрузку на аналитиков, ускорить подготовку отчётов и проверку бизнес гипотез на 30 %, подсчитали в компании. Выход ИИ-агента запланирован на сентябрь, но уже сейчас заинтересованным лицам можно зарегистрироваться в листе ожидания.

Служба будет работать на платформе Yandex DataLens — её встроят в формате диалогового интерфейса. Чтобы создать или отредактировать визуализацию, достаточно будет отправить соответствующий запрос естественным языком. «Нейроаналитик» разработан на основе технологий Yandex Cloud AI Studio — ИИ-агент может быть востребован всеми, кто работает с большими объёмами данных.

Ранее «Яндекс» отменил плату за доступ к нейросети «Алиса» на базе передовой большой языковой модели YandexGPT 5 Pro, но сохранил и платный вариант интеллектуального помощника, включая возможность персонализированного общения — воспользоваться им могут подписчики «Яндекс Плюса» с опцией «Алиса Про» за 100 руб. в месяц.

Дикторов в московском метро дополнит ИИ — тестирование уже началось

На Сокольнической линии столичного метро стартовали испытания системы искусственного интеллекта, которая будет зачитывать аудиосообщения, сообщил заммэра Москвы Максим Ликсутов.

 Источник изображения: mosmetro.ru

Источник изображения: mosmetro.ru

ИИ-диктор будет применяться, чтобы оперативно доносить до пассажиров информацию «в едином стиле московского транспорта», рассказал чиновник. «После пилотного запуска технологии на Сокольнической линии примем решение о дальнейшем использовании её в метро и за его пределами. При этом будем учитывать пожелания пассажиров», — цитирует его московский дептранс.

Специалисты Московского метро создают аудиофайлы для оповещений в автономном режиме — требуется лишь подготовить текст, загрузить его в программу, задать тембр, интонацию и длину пауз. Обучение ИИ проводилось на основе записей дикторов метро.

Красная линия метро стала площадкой для тестирования нового решения, потому что здесь отмечается высокая загруженность, есть пересадки на другие линии метро, МЦК, МЦД, авто- и железнодорожные вокзалы. Здесь же находится и станция «Комсомольская», которая обслуживает Ленинградский, Ярославский и Казанский вокзалы, а сама ветка соединяется с МЦД и кольцевой линией.

В Spotify в профилях покойных музыкантов стали появляться песни, созданные ИИ — сервис «принимает меры»

В стриминговом сервисе Spotify на страницах ныне покойных музыкантов начали размещать музыкальные треки, созданные с помощью систем искусственного интеллекта, обнаружил ресурс 404 Media. Представитель Spotify заявил, что это является нарушением правил сервиса, и к нарушителям будут приняты меры.

 Источник изображения: Anna Keibalo/unsplash.com

Источник изображения: Anna Keibalo/unsplash.com

По данным 404 Media, на прошлой неделе на странице Блейза Фоли (Blaze Foley), кантри-музыканта, известного по треку «Clay Pigeons» и погибшего в 1989 году, появился новый сингл под названием «Together».

Эксперт 404 Media описал мелодию как «отдалённо» напоминающую «новую, медленную кантри-песню». При этом трек сопровождался сгенерированным ИИ изображением молодого мужчины, совершенно не похожего на Фоли.

Крейг Макдональд (Craig McDonald), владелец звукозаписывающей компании, которая распространяет музыку Фоли и управляет его страницей на Spotify, заявил, что песня появилась в профиле артиста без разрешения его администраторов. Он отметили, что эта песня совсем «не в стиле Блейза» и звучит так, будто её создал «бот с ИИ».

«Это наносит ущерб репутации Блейза», — заявил Макдональд, добавив, что сервис должен немедленно отреагировать на это нарушение.

Представитель стриминговой платформы уведомил 404 Media в электронном письме, что песня была «удалена за нарушение политики в отношении вводящего в заблуждение контента», возложив вину на музыкального дистрибьютора SoundOn, принадлежащего TikTok.

Представитель Spotify сообщил, что правила медиаплощадки запрещают выдавать себя за другое лицо с целью введения в заблуждение, например, используя копирование имени, изображения или описания другого автора, а также выдавать себя за другое лицо, бренд или организацию обманным путём. «Мы принимаем меры в отношении лицензиаров и дистрибьюторов, которые не отслеживают подобные случаи мошенничества, и те, кто совершает повторные или грубые нарушения, могут быть удалены из Spotify навсегда», — подчеркнул он.

Это лишь последний случай появления музыки, сгенерированной ИИ, на Spotify, пишет ресурс Consequence. Недавно группа The Velvet Sundown набрала на этой платформе более миллиона прослушиваний, прежде чем призналась, что музыка была полностью сгенерирована ИИ.

Два миллиона GPU и 4,5 ГВт: Oracle и OpenAI договорились построить в США дата-центры для ИИ

Аппетиты OpenAI в масштабировании вычислительной инфраструктуры не знают границ. Уже к концу года ChatGPT должен будет использовать ресурсы 1 млн GPU, как недавно заявил глава компании Сэм Альтман (Sam Altman). Сотрудничество с Oracle станет одним из важных условий обеспечения такого прогресса. Компании сообща возведут в США несколько ЦОД общей мощностью 4,5 ГВт.

Как поясняет Bloomberg, одного гигаватта электроэнергии хватило бы для повседневных нужд примерно 750 000 американских домохозяйств, так что амбиции компаньонов по проекту Stargate весьма обширны. Напомним, что эта инициатива подразумевает создание за четыре года ЦОД на территории США совокупной мощностью 10 ГВт. Получается, что Oracle и OpenAI совместными усилиями покроют до половины этой потребности. Тем более, что дополнительные 500 МВт обеспечит строящийся в Техасе ЦОД для нужд компании Oracle, который может быть арендован OpenAI.

Подобные площадки появятся в нескольких штатах, включая Техас, Мичиган, Висконсин и Вайоминг, хотя конкретная география пока не утверждена. В этих ЦОД общей мощностью 5 ГВт, по словам представителей OpenAI, будет работать более 2 млн GPU, ускоряющих работу систем искусственного интеллекта. Представители OpenAI также подчеркнули, что SoftBank в финансировании этого проекта не участвует, хотя они совместно должны участвовать в реализации инициативы Stargate, которая подразумевает направление около $500 млрд инвестиций на развитие вычислительной инфраструктуры в США за ближайшие несколько лет. Как отмечалось ранее, у руководства SoftBank и OpenAI могли возникнуть противоречия в этой сфере.

Вице-президент OpenAI по глобальной политике Крис Лехейн (Chris Lehane) заявил следующее: «Мы очень довольны возможностью быстро двигаться дальше, поскольку во многих смыслах проект в Абилине был для нас бета-тестом, позволяющим подтвердить нашу способность строить подобные центры быстро и в больших масштабах». По данным Oracle, компания начала получать первые стойки с ускорителями Nvidia GB200 в прошлом месяце, и на запуск первых блоков нового ЦОД в Техасе ушло всего несколько недель. Как отмечают в OpenAI, строительство ЦОД позволит создать более 100 000 рабочих мест в США, хотя основная их часть будет связана со строительством и будет подразумевать временную занятость специалистов.

«Т-Банк» выпустил ИИ-модель распознавания речи с открытым исходным кодом — T-one

Российская группа компаний «Т-Технологии», владеющая «Т-Банком», опубликовала собственную ИИ-модель распознавания речи с открытым исходным кодом. Речевая модель под названием T-one обещает новый уровень качества распознавания, по словам её разработчиков. Также обещаются прорывные решения, такие как распознавание речи в реальном времени, передаёт Forbes.

 Источник изображения: «Т-Технологии»

Источник изображения: «Т-Технологии»

Более подробно о T-one представители «Т-Технологий» рассказали 19 июля в Москве на Второй конференции по машинному обучению Turbo ML. А на официальном ресурсе компании на платформе GitHub объясняется, что T-one — это высокопроизводительная система автоматического распознавания речи (ASR) с акцентом на распознавание русского языка в телефонии. Кстати, на GitHub она уже доступна для скачивания. Также её можно загрузить с Hugging Face. Для разработчиков приведены инструкции по развёртыванию системы.

T-one — модель относительно небольшая, около 70 млн параметров. Для сравнения, речевая модель компании GigaAM от «Сбера» состоит из 240 млн параметров, а модель Whisper large-v3 от OpenAI — из 1,55 млрд. Однако, по утверждениям разработчиков T-One, это не мешает последней обгонять именитых конкурентов именно в распознавании русской речи в телефонных разговорах, под что она «заточена».

«Т-Технологии» позиционируют свою разработку как для бизнеса, так и для научного сообщества. Второму она будет интересна низкой стоимостью: эксплуатация на собственном сервере должна быть в десятки раз дешевле конкурирующих решений от облачных провайдеров. T-one хорошо адаптируется под нужды конкретной компании и разработку собственных решений.

«Это могут быть компании, разрабатывающие голосовых роботов и ассистентов, занимающиеся автоматизацией кол-центров, — пояснили представители «Т-Технологий» на конференции Turbo ML. — Они могут взять за основу эту модель и адаптировать её под свои решения. Это позволит сократить ресурсы на разработку с нуля».

Противоречия между OpenAI и SoftBank тормозят реализацию ИИ-мегапроекта Stargate в США

Почти сразу после вступления Дональда Трампа (Donald Trump) в должность президента США в январе этого года было объявлено, что группа инвесторов в ближайшие четыре года потратит $500 млрд на строительство вычислительной инфраструктуры для ИИ на территории страны в рамках проекта Stargate. По слухам, между участниками финансирования проекта в лице SoftBank и OpenAI возникли противоречия, которые тормозят его реализацию.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как сообщает The Wall Street Journal, компании не могут определиться с местами строительства центров обработки данных, которые будут формировать предусмотренную проектом Stargate вычислительную инфраструктуру. Первоначально на строительство таких центров обработки данных планировалось выделить $100 млрд только в этом году, но отсутствие консенсуса между компаньонами приведёт к тому, что один из первых ЦОД появится лишь к концу года и будет ограничен по своим масштабам, как отмечает источник. Место строительства этого ЦОД тоже пока не выбрано, но им вполне может стать штат Огайо.

Как отмечается, SoftBank планировала потратить на поддержку OpenAI около $30 млрд, и это не учитывая финансирования самого мегапроекта Stargate. При этом глава OpenAI Сэм Альтман (Sam Altman), как сообщается, соглашается на практически любые условия с другими инвесторами, и такое его поведение не нравится руководству SoftBank. Представители компаний заявили, что поиск мест для строительства одного из первых ЦОД ведётся в срочном порядке, и в целом для реализации проекта будут использоваться площадки в нескольких штатах. Эти компании готовы совместно построить ЦОД совокупной мощностью не менее 10 ГВт·ч, и на публике делают вид, что сотрудничество продвигается успешно. OpenAI уже договорилась с Oracle об аренде необходимых вычислительных мощностей (4,5 ГВт·ч) на сумму более $30 млрд, которая будет выплачена в течение ближайших трёх лет. Попутно была заключена сделка между OpenAI и CoreWeave. Такая активность компаньона может задевать интересы SoftBank, но руководство последней якобы не теряет готовности вкладывать в капитал OpenAI.

Компания Oracle, которая также вовлечена в реализацию этой инициативы, ранее уже сообщала, что отдаст под соответствующие нужды один из уже возводимых ею центров обработки данных в Техасе. В этом же штате у OpenAI есть и другие вычислительные мощности, которые она собирается использовать для нужд Stargate. По всей видимости, ещё один центр обработки данных будет возведён до конца года преимущественно силами OpenAI и SoftBank. Две последние компании первоначально планировали вложить в инфраструктуру по $18 млрд. При этом сама OpenAI в текущем году собирается выручить лишь около $10 млрд, поэтому масштабные инвестиции она вынуждена осуществлять при участии партнёров, а также рассчитывать на кратный рост своей выручки и окупаемость реализуемых проектов.

OpenAI раскрыла масштабы популярности ChatGPT: каждый день бот получает 2,5 млрд запросов

Чат-бот с искусственным интеллектом ChatGPT продолжает набирать популярность. По данным OpenAI, пользователи отправляют чат-боту более 2,5 миллиарда запросов ежедневно. В пересчёте на год это составляет около 912,5 миллиарда обращений. Как сообщает Axios, из этого числа 330 миллионов запросов ежедневно поступают от пользователей в США.

 Источник изображения: Dima Solomin/Unsplash

Источник изображения: Dima Solomin/Unsplash

Несмотря на то что ChatGPT пока уступает поисковику Google, который обрабатывает около 5 триллионов поисковых запросов в год, его стремительный рост, похоже, представляет серьёзную угрозу для поискового гиганта. Всего за несколько месяцев аудитория чат-бота увеличилась с 300 миллионов еженедельных пользователей в декабре 2024 года до более чем 500 миллионов в марте 2025 года.

Ранее в этом месяце агентство Reuters сообщило со ссылкой на источники, что OpenAI готовится запустить собственный веб-браузер на базе искусственного интеллекта в ближайшие недели — этот шаг эксперты расценивают как прямой вызов Google Chrome. К запуску компания подготовилась, представив неделю назад инструмент ChatGPT Agent, способный выполнять задачи за пользователя.

Сэм Альтман: к концу года ChatGPT будет работать на миллионе GPU, а в будущем — на ста миллионах

Глава OpenAI Сэм Альтман (Sam Altman) сообщил, что к концу 2025 года компания задействует более 1 миллиона ускорителей вычислений на базе GPU, а в перспективе рассматривает увеличение этого числа в 100 раз. Для сравнения, текущая инфраструктура xAI Илона Маска (Elon Musk), обеспечивающая работу модели Grok 4, использует около 200 тысяч чипов Nvidia H100 — в пять раз меньше, чем планирует развернуть OpenAI до конца года.

 Источник изображения: Levart_Photographer/Unsplash

Источник изображения: Levart_Photographer/Unsplash

Альтман отметил в своём посте в X, что гордится своей командой, но теперь стоит новая задача — найти способ увеличить вычислительные мощности в 100 раз. Хотя его комментарий сопровождался шутливым «лол», в OpenAI явно настроены серьёзно. Как пишет Tom's Hardware, ещё в феврале компания была вынуждена замедлить выпуск GPT-4.5 из-за нехватки GPU, и с тех пор масштабирование инфраструктуры стало одним из главных приоритетов. Достижение отметки в 1 миллион GPU сделает OpenAI крупнейшим потребителем вычислительных ресурсов для ИИ в мире.

 Источник изображения: TechCrunch/wikimedia.org (CC BY 2.0)

Источник изображения: TechCrunch/wikimedia.org (CC BY 2.0)

Стоимость реализации 100-кратного увеличения мощностей (при средней цене одного GPU в $30 000) оценивается примерно в 3 триллиона долларов — почти как ВВП Великобритании. И это без учёта затрат на электроэнергию и строительство дата-центров. Кроме того, Nvidia в ближайшие годы не сможет произвести такое количество GPU, не говоря уже о необходимости обеспечить их электропитанием. Однако, судя по всему, для Альтмана это не просто цифры, а часть стратегии по созданию искусственного общего интеллекта (AGI), который потребует принципиально новых решений — включая разработку собственных чипов и новых архитектур.

Ярким примером масштабного мышления OpenAI может служить их дата-центр в Техасе, уже ставший крупнейшим в мире. Сейчас он потребляет около 300 МВт, а к середине 2026 года этот показатель достигнет 1 ГВт. Однако такие «аппетиты» вызывают обеспокоенность у местных энергетиков: поддержание стабильного напряжения для объекта такого масштаба требует дорогостоящей модернизации сетей, с которой не всегда справляются даже государственные компании.

Чтобы диверсифицировать вычислительные мощности, OpenAI, помимо использования облачной платформы Microsoft Azure, строит собственные дата-центры совместно с Oracle и, по слухам, тестирует TPU от Google. Всё это, как отмечает Tom's Hardware, является частью технологической гонки, в которой также участвуют Meta, Amazon и другие крупные игроки.

По мнению экспертов, идея о 100 миллионах GPU на сегодняшний день выглядит нереалистичной, поскольку требует прорывов в области производства и энергоэффективности. Однако Альтман ориентируется не на текущие возможности, а на то, что может стать реальностью завтра.

AMD обучила ноутбуки на Ryzen AI безоблачной генерации изображений в Stable Diffusion

Компании AMD и Stability AI объявили о запуске оптимизированной версии ИИ-модели Stable Diffusion 3.0 Medium, адаптированной для работы на устройствах с нейропроцессорами (NPU). Это позволит владельцам таких устройств генерировать изображения и обрабатывать текст локально — прямо на ноутбуках с процессорами AMD Ryzen AI со встроенным нейропроцессором на архитектуре XDNA 2, без необходимости использования мощной видеокарты.

 Источник изображений: AMD

Источник изображений: AMD

Ранее, на выставке Computex 2024, AMD совместно со Stability AI представила первую версию Stable Diffusion, оперирующую числами в представлении Block FP16, с которым NPU хорошо справляется — SDXL Turbo. Она достигла уровня точности FP16 при производительности, будто работала с числами INT8. Новая версия SD 3.0 Medium также выполнена в этом формате и оптимизирована под NPU-архитектуру, обеспечивая высокое качество генерации изображений при относительно невысоких аппаратных требованиях, сообщает TechPowerUp.

Модель FP16 использует 9 Гбайт памяти и может работать на ноутбуках с 24 Гбайт оперативной памяти. Система использует двухэтапный процесс обработки на базе AMD XDNA 2 NPU, увеличивая разрешение выходного изображения с 2 Мп (1024 × 1024 пикселей) до 4 Мп (2048 × 2048 пикселей).

Ранее приложение Amuse — программный инструмент для ИИ-генерации изображений — использовало только GPU для запуска Stable Diffusion Medium, что ограничивало его доступность. Теперь пользователи могут выбирать между GPU и NPU в зависимости от задач и возможностей устройства. Для тестирования новой функции необходимо установить последнюю версию драйвера AMD Adrenalin, а также бета-версию Amuse 3.1 от Tensorstack (Amuse AI). После этого, в режиме EZ Mode, нужно перевести ползунок в положение HQ и активировать опцию XDNA 2 Stable Diffusion Offload.

В Китае назревает технологический перегрев: Си Цзиньпин предостерёг регионы от избыточных инвестиций в ИИ и электромобили

Проблема перепроизводства на китайском автомобильном рынке выражается не только в ценовый войнах, но и наличии складских запасов машин прошлых лет выпуска, которые так и не были распроданы. По некоторым данным, Си Цзиньпин (Xi Jinping) отчитал региональные власти в Китае за их слишком активное рвение вкладывать средства в выпуск электромобилей, а также в разработку ИИ.

 Источник изображения: CATL

Источник изображения: CATL

По данным Financial Times, китайский лидер сделал соответствующие замечания перед аудиторией чиновников на мероприятии, посвящённом проблемам развития городской инфраструктуры и экономики. «Что касается проектов, есть ряд вещей, а именно — искусственный интеллект, вычислительные мощности и транспортные средства с новыми типами силовых установок. Все ли провинции в нашей стране должны развивать свою промышленность в этом направлении?» — озадачился риторическим вопросом Си Цзиньпин, как утверждает источник.

Подобные заявления, как считают эксперты, могут указывать на готовность центральных властей Китая вмешиваться в субсидирование региональных проектов в указанных сферах деятельности, если они сочтут такое финансирование избыточным и неоправданным. Глава китайского государства, как отмечают источники, выражает озабоченность неконтролируемым финансированием однотипных проектов без оглядки на растущие долговые обязательства, рассчитываться по которым придётся будущим поколениям граждан Китая.

Как поясняет Financial Times, бум систем искусственного интеллекта привёл к тому, что крупные центры обработки данных создаются даже в не самых насыщенных с точки зрения экономической активности регионах Китая. При этом новенькие ЦОД нередко простаивают без работы, хотя деньги на их строительство были потрачены. Ориентироваться только на показатели роста ВВП и количество реализуемых проектов не нужно, как дал понять Си Цзиньпин, нельзя тратить деньги бездумно и оставлять проблемы для следующих поколений. По оценкам экономистов, сейчас КНР проходит через самый продолжительный период дефляционного давления с 90-х годов прошлого века. Дефлятор ВВП, показывающий динамику изменения цен на производимые страной товары, снижается уже девять кварталов подряд.

По оценкам аналитиков HSBC, в ряде отраслей китайской экономики уже начали приниматься меры, направленные на борьбу с дефляцией. Производители стекла для солнечных панелей, например, с июля объявили об организованном снижении объёмов выпуска продукции на 30 %, чтобы удержать цены от дальнейшего падения. Подобные меры принимаются и в сфере производства цемента, стали и строительных материалов. Впрочем, в сфере ИИ вмешательство государства в инвестиционную активность участников рынка будет избирательным, как убеждены эксперты. В частности, в Пекине и Шэньчжэне никто тормозить реализацию проектов не будет, поскольку это крупные технологические хабы, а вот тратить на периферийные с точки зрения географии проекты власти Китая наверняка станут меньше.

window-new
Soft
Hard
Тренды 🔥
«Алиса» стала ИИ-агентом в «Яндекс Браузере», но пока готова выполнять поручения не для всех 2 ч.
OpenAI решили засудить за самоубийство подростка — компания пообещала изменить ChatGPT 2 ч.
Anthropic увернулась от иска за обучение ИИ на электронных книгах с помощью «исторического соглашения» 3 ч.
Восставший из мёртвых легендарный издатель Acclaim анонсировал игровую презентацию, которую «вы не захотите пропускать» 3 ч.
Миллионные зарплаты не помогли: элитная лаборатория суперинтеллекта Meta стала терять сотрудников 3 ч.
Atari выкупила у Ubisoft права на пять игр, включая Cold Fear, I Am Alive и Grow Home 4 ч.
Google выпустила «ИИ-фотошоп» — в Gemini встроили модель nano-banana, которая может точно редактировать картинки 4 ч.
«Мы прислушиваемся к вашим отзывам»: Paradox ответила на критику платных вампирских кланов в Vampire: The Masquerade — Bloodlines 2 4 ч.
OpenAI рискует потерять миллиарды инвестиций: переговоры с Microsoft откладывают реструктуризацию 5 ч.
Google кардинально обновила дизайн мобильного приложения Gmail в стиле Material 3 Expressive 8 ч.
«Байкал Электроникс» готовит ИИ-чип BE-AI1000 с HBM3E и PCIe 5.0 17 мин.
Asus представила роутер TUF Gaming BE9400 с Wi-Fi 7 для геймеров и умного дома 19 мин.
Китай собрался утроить выпуск ИИ-чипов в следующем году, чтобы обеспечить развитие DeepSeek 28 мин.
Представлен вместительный корпус Eurocase M9 Plus с улучшенной вентиляцией 29 мин.
Учёные в США упростили 3D-печать сверхпроводников — новый шаг к квантовым технологиям и не только 55 мин.
В России может появиться больше Tesla Cybertruck — экстравагантный электромобиль дебютирует в Южной Корее 59 мин.
Humain начала строительство двух ИИ ЦОД в Саудовской Аравии 2 ч.
Летающие электромобили Alef получили базу для испытаний в Кремниевой долине — серийное производство не за горами 2 ч.
Проект одного из крупнейших в мире ЦОД Project Sale оказался под угрозой срыва 2 ч.
США теперь вряд ли позволят Intel избавиться от производства чипов 2 ч.