реклама
Теги → ии
Быстрый переход

Дорогущие ИИ-чипы страдают от быстрого износа — GPU от AMD и Nvidia выдерживают всего 1–3 года

Пока стремящиеся активно развивать сферу искусственного интеллекта разработчики озабочены преимущественно нехваткой компонентов, некоторые из них высказываются на тему ограниченности эксплуатационного ресурса тех самых дорогих и дефицитных чипов. По расчётам специалистов Alphabet, серверные GPU при уровне загрузки 70 % живут от одного до двух лет, в крайнем случае — три.

 Источник изображения: Nvidia

Источник изображения: Nvidia

На это мнение ссылается Tech Fund, поясняя, что высказывание принадлежит некоему высокопоставленному разработчику систем генеративного искусственного интеллекта Alphabet, который знаком с их спецификой эксплуатации. Даже если подходить к анализу проблемы с обывательской точки зрения, логика в таких заявлениях есть. Выделяя до 700 Вт, графические процессоры Nvidia, AMD и любого другого производителя для современных ускорителей вычислений имеют довольно скромную площадь кристалла, поэтому постоянное воздействие высоких температур способно достаточно быстро приводить к их физическому износу.

Продлить срок службы ускорителей вычислений можно, снизив их степень загрузки от типичных 60 или 70 %, но подобные меры натыкаются на экономические соображения разработчиков систем искусственного интеллекта. Недешёвые ускорители в условиях бурного развития отрасли должны максимально быстро приносить финансовую отдачу, а если недогружать их работой, то период амортизации затянется, а это уже не понравится инвесторам.

Израильские специалисты недавно предположили, что к концу десятилетия отрасль ИИ будет ежегодно генерировать до 5 млн тонн электронных отходов. Не все из них могут быть переработаны для повторного использования, поэтому проблема воздействия отрасли искусственного интеллекта на окружающую среду становится острее. Соответственно, быстрая выработка ресурса серверных GPU тоже усугубит ситуацию с утилизацией отходов.

Meta✴ отчиталась о слабом росте числа пользователей и предупредила об увеличении расходов на ИИ

Meta раскрыла финансовые результаты за III квартал 2024 года, отчитавшись о слабом росте числа пользователей и предупредив о резком увеличении расходов на ИИ-инфраструктуру в 2025 году. Выручка компании выросла на 19 %, достигнув $40,59 млрд, а чистая прибыль увеличилась на 35 % и составила $15,7 млрд, однако число активных пользователей оказалось ниже прогнозируемого уровня — 3,31 млрд.

 Источник изображения: about.fb.com

Источник изображения: about.fb.com

В среду, после публикации финансового отчёта, акции компании после закрытия торгов продемонстрировали незначительное снижение. Прибыль на акцию составила $6,03, что превысило прогноз аналитиков ($5,25), а выручка достигла $40,59 млрд, также превысив ожидания в $40,29 млрд. Тем не менее, компания продолжает сталкиваться с трудностями в наращивании пользовательской базы, что вызывает обеспокоенность у инвесторов.

За III квартал Meta зафиксировала 3,29 млрд ежедневных активных пользователей, что на 5 % выше уровня прошлого года, но всё же ниже ожидаемых 3,31 млрд. Рост чистой прибыли компании составил 35 %, что является минимальным приростом за год, начиная со II квартала 2023 года. Meta повысила прогноз по капитальным затратам на 2024 год: теперь ожидается, что они составят от $38 млрд до $40 млрд вместо прежних $37–40 млрд.

Генеральный директор Марк Цукерберг (Mark Zuckerberg) отметил, что компания намерена продолжать активные инвестиции в ИИ и техническую модернизацию инфраструктуры. В рамках этой стратегии Meta активно вкладывается в новые центры обработки данных и закупку графических процессоров (GPU) Nvidia, играющих важную роль в производительности ИИ-систем, используемых в рекламном бизнесе компании. Выручка Meta от рекламы составила $39,9 млрд, что составляет 98,3 % всех доходов компании за III квартал, с годовым приростом в 18,7 %. По словам Цукерберга, уже более миллиона рекламодателей воспользовались рекламными инструментами Meta, основанными на генеративном ИИ.

На фоне общего роста доходов на 19 % в III квартале выручка Meta в Азиатско-Тихоокеанском регионе увеличилась лишь на 15 %, что стало самым низким показателем среди всех регионов. Финансовый директор компании Сьюзан Ли (Susan Li) объяснила это снижением активности китайских рекламодателей, включая интернет-магазины Temu и Shein, что оказало влияние на темпы роста доходов по всему региону. Во II квартале годовые темпы роста доходов в этом регионе составляли 28 %. Meta прогнозирует, что её выручка в IV квартале этого года составит от $45 до $48 млрд, что выше консенсус-прогноза аналитиков в $46,3 млрд и отражает осторожный оптимизм компании.

Подразделение Reality Labs, занимающееся разработками в сфере виртуальной (VR) и дополненной реальности (AR), в III квартале зафиксировало операционный убыток в размере $4,4 млрд, что оказалось ниже ожидаемых $4,68 млрд. Продажи подразделения выросли на 29 %, достигнув $270 млн, хотя ожидания аналитиков составляли $310,4 млн. С момента основания в 2020 году Reality Labs накопило операционные убытки более $58 млрд, что ещё раз подчёркивает высокую стоимость разработок в сфере VR и AR.

Общая численность сотрудников Meta на 30 сентября достигла 72 404 человек, увеличившись на 9 % по сравнению с аналогичным периодом прошлого года. Рост штата компании отражает её стратегию по усилению позиций в области ИИ и развитию инфраструктуры.

Waymo и Gemini научат роботакси справляться со сложными дорожными ситуациями

Waymo, дочерняя компания Alphabet, представила новый подход к обучению своих беспилотных транспортных средств, используя модель Gemini — большую мультимодальную языковую модель (MLLM) от Google. Модель улучшит навигацию автономных автомобилей и позволит лучше справляться со сложными дорожными ситуациями.

 Источник изображения: waymo.com

Источник изображения: waymo.com

В новом исследовательском докладе Waymo дала определение своей разработке как «сквозной мультимодальной модели для автономного вождения» (EMMA), которая обрабатывает данные с сенсоров и помогает роботакси принимать решения о направлении движения, избегая препятствий. Как пишет The Verge, Waymo давно подчёркивала своё стратегическое преимущество благодаря доступу к научным исследованиям в области искусственного интеллекта (ИИ) Google DeepMind, ранее принадлежавшей британской компании DeepMind Technologies.

Новая система EMMA представляет собой принципиально иной подход к обучению автономных транспортных средств. Вместо традиционных модульных систем, которые разделяют функции на восприятие, планирование маршрута и другие задачи, EMMA предлагает единый подход, который позволит обрабатывать данные комплексно, поможет избежать ошибок, возникающих при передаче данных между модулями, и улучшит адаптацию к новым, незнакомым условиям на дороге в реальном масштабе времени.

Одним из ключевых преимуществ использования моделей MLLM, в частности Gemini, является их способность к обобщению знаний, почерпнутых из огромных объёмов данных, полученных из интернета. Это позволяет моделям лучше адаптироваться к нестандартным ситуациям на дороге, таким как неожиданное появление животных или ремонтные работы. Кроме того, модели, обученные на основе Gemini, способны к «цепочке рассуждений». Это метод, который помогает разбивать сложные задачи на последовательные логические шаги, улучшая процесс принятия решений.

Несмотря на успехи, Waymo признает, что EMMA имеет свои ограничения. Например, модель пока не поддерживает обработку 3D-данных с таких сенсоров, как лидар или радар, из-за высокой вычислительной сложности. Кроме того, EMMA способна обрабатывать лишь ограниченное количество кадров изображений одновременно. Подчёркивается, что потребуется дальнейшее исследование для преодоления всех этих ограничений перед полноценным внедрением модели в реальных условиях.

Waymo также осознает и риски, связанные с использованием MLLM в управлении автономными транспортными средствами. Модели, подобные Gemini, могут допускать ошибки или «галлюцинировать» в простых задачах, что конечно недопустимо на дороге. Тем не менее, есть надежда, что дальнейшие исследования и улучшения архитектуры ИИ-моделей для автономного вождения преодолеют эти проблемы.

VK защитит сервисы от ботов и DDoS-атак с помощью ИИ

VK запустит до конца года в большинстве сервисов собственную систему защиты от DDoS-атак и бот-активности на основе искусственного интеллекта (ИИ), которая сможет отличать вредоносный трафик от реальных всплесков активности, сообщил «Коммерсантъ» со ссылкой информацию компании. До этого защиту таких проектов, как «VK Видео», ОК, «Дзен», Mail и др., обеспечивал комплекс решений, включающий продукты вендоров информационной безопасности (ИБ).

 Источник изображения: Franz26/Pixabay

Источник изображения: Franz26/Pixabay

ИИ-модели, обученные на обезличенных и обобщенных данных о поведении пользователей каждого сервиса VK, будут уже на ранних стадиях выявлять вредоносный трафик, даже если он не отличается от органического. Система также будет выявлять и другую вредоносную активность, включая программы-парсеры (собирают открытые данные о пользователях), программы-брутфорсеры, которые автоматически перебирают пароли от аккаунтов.

Вице-президент по стратегии и инновациям МТС Евгений Черешнев отметил, что противодействие DDoS-атакам обычно не требует ИИ: «Это больше вопрос системной логики управления потоками данных и доступных серверных мощностей». Хотя в борьбе с ботами применение ИИ он назвал закономерным.

Для эффективной работы ИИ-моделей необходимо разнообразие трафика, так как атакующая сторона постоянно меняет свои методики, сообщили в DDoS-Guard. Преимущество специализированных провайдеров заключается в том, что они анализируют трафик тысяч различных доменов и их пользователей, что обеспечивает больше данных для обучения системы защиты.

По словам источника «Коммерсанта», в VK Tech (входит в группу VK) обсуждается вариант продажи системы внешним заказчикам в виде облачного решения. Однако заместитель гендиректора группы компаний «Гарда» Рустэм Хайретдинов считает, что такое решение вряд ли выйдет на рынок, «поскольку изначально разрабатывается для конкретной платформы, ее адаптация может стоить соизмеримо с разработкой новой».

В свою очередь, бизнес-консультант по информационной безопасности Positive Technologies Алексей Лукацкий отметил, что в России пока нет ни одного примера, чтобы компания, которая не специализируется в сфере ИБ, смогла не только разработать, но и развивать своё решение.

Помощник программиста GitHub Copilot получит ИИ-модели Google и Anthropic

GitHub Copilot, инструмент на базе ИИ для помощи в разработке программного обеспечения, отказался от использования исключительно ИИ-моделей OpenAI и переходит к мультимодельному подходу. В ближайшие недели GitHub добавит поддержку Claude 3.5 Sonnet компании Anthropic, позднее будет интегрирован Google Gemini 1.5 Pro, что даст разработчикам широкий выбор из ИИ-моделей, оптимизированных под различные задачи и языки программирования.

 Источник изображения: GitHub

Источник изображения: GitHub

Помимо ИИ-моделей Anthropic и Google, GitHub также добавит в Copilot новые модели OpenAI, включая «думающий» GPT o1-preview и o1-mini, разработанные для более сложных вычислительных задач. Благодаря расширению поддержки различных ИИ пользователи смогут переключаться между ИИ-моделями в ходе одного сеанса, что позволит им гибко настраивать Copilot под свои нужды. Это также даст организациям возможность управлять доступными ИИ-моделями для команд разработчиков, предлагая оптимальные решения для выполнения специфических задач.

Мультимодельный подход GitHub Copilot подчёркивает, что универсальной ИИ-модели, способной решать все задачи, не существует: различные языки программирования и специфические требования разработчиков требуют гибкости и возможности выбора. Как отметил генеральный директор GitHub Томас Домке (Thomas Dohmke), следующая эра генерации кода на основе ИИ будет определяться не только мультимодельной функциональностью, но и возможностью выбора ИИ-моделей. Первыми доступ к мультимоделям получат веб-версия Copilot и Visual Studio Code.

GitHub также анонсировал дополнительные обновления Copilot, включая возможность редактирования нескольких файлов одновременно и расширение функциональности Visual Studio Code. В будущем Copilot получит поддержку Xcode, что сделает его ещё более гибким и универсальным инструментом для разработки, оптимизируя рабочие процессы и облегчая управление проектами на базе различных платформ.

Одновременно с обновлениями Copilot GitHub представил Spark — инструмент для разработки приложений на основе естественного языка. В отличие от традиционных средств разработки, Spark ориентирован на пользователей без навыков программирования, которые смогут создавать приложения, используя текстовые запросы, а разработчики получат возможность их точной настройки. Spark также поддерживает мультимодельный подход и работает с ИИ-моделями компаний OpenAI, Google и Anthropic. Однако на данный момент инструмент доступен лишь ограниченному числу пользователей в рамках раннего тестирования, а все заинтересованные могут записаться в список ожидания.

Переход GitHub на мультимодельный подход вызывает интерес и в отношении Microsoft Copilot — другого мощного ИИ-инструмента, созданного на основе разработок OpenAI и используемого в продуктах компании Microsoft. GitHub, купленный Microsoft в 2018 году, по сей день сохраняет независимость, что и делает возможным переход GitHub Copilot к мультимодельному подходу. Однако остаётся вопрос, будет ли Microsoft адаптировать мультимодельный подход для своих продуктов, ориентированных на более широкую аудиторию, поскольку спрос на мультимодели в корпоративной и пользовательской сферах отличается от спроса в сфере разработки.

Более четверти кода в Google теперь пишет ИИ

ИИ становится неотъемлемым элементом разработки в Google. Более четверти нового кода компании создаётся с помощью ИИ, после чего проверяется инженерами, рассказал глава Google Сундар Пичаи (Sundar Pichai). Последние финансовые результаты подчёркивают, что ИИ играет центральную роль в успехах корпорации.

 Источник изображения: DWilliam / Pixabay

Источник изображения: DWilliam / Pixabay

Финансовые результаты за III квартал подтверждают, что ИИ оказывает значительное влияние не только на разработку продуктов, но и на рост доходов компании. Выручка Alphabet, материнской компании Google, достигла $88,3 млрд, из которых $76,5 млрд обеспечило подразделение Google Services, увеличив годовой доход на 13 %. Подразделение Google Cloud, предлагающее ИИ-инфраструктуру для корпоративных клиентов, заработало $11,4 млрд, что означает прирост на 35 % по сравнению с прошлым годом.

Операционные доходы компании также демонстрируют значительный рост. В частности, Google Services принёс компании $30,9 млрд, что значительно выше прошлогодних $23,9 млрд, а операционная прибыль Google Cloud достигла $1,95 млрд по сравнению с $270 млн годом ранее. Такое увеличение подтверждает, что внедрение ИИ позволило Google повысить доходность существующих направлений.

Сегодня Google активно продвигает ИИ-продукты, предлагая инновационные решения для пользователей и корпоративных клиентов. Среди этих нововведений — персонализированные ИИ-чат-боты, разработанные на основе ИИ-модели Gemini (так называемые Gems), функция автоматического создания ИИ-заметок в Google Meet, а также инструменты генеративного ИИ для создателей контента на YouTube. Линейка смартфонов Pixel 9, получившая положительные отзывы, также обзавелась ИИ.

По словам Сундара Пичаи (Sundar Pichai), новые ИИ-функции расширяют возможности поиска и позволяют более эффективно находить информацию. В Google Cloud ИИ-продукты помогают привлекать новых клиентов и укреплять партнёрские отношения с уже существующими. Впервые за последние четыре квартала доходы YouTube превысили $50 млрд, включая доходы от рекламы и подписок. Это подчёркивает, что ИИ помогает компании укреплять позиции и расширять охват аудитории, оказывая прямое влияние на её доходность.

Тем не менее, Google сталкивается с серьёзными юридическими вызовами. В августе этого года компанию признали монополистом на рынках поиска и рекламы в рамках иска, поданного Министерством юстиции (DOJ) США. Судебное разбирательство вступило в стадию обсуждения возможных мер, и одним из предложений является разделение компании. Эти события могут повлиять на стратегические планы Google, что может заставить её пересмотреть подход к монетизации и методам удержания своих рыночных позиций.

AMD упускает возможности в сфере ИИ, решили инвесторы после квартального отчёта

Накануне вечером AMD отчиталась о росте выручки на 18 % до $6,82 млрд, что оказалось выше ожиданий аналитиков, а удельный доход в размере 92 центов на одну акцию в точности совпал с их ранним прогнозом. Тем не менее, от текущего квартала AMD ожидает выручки в размере $7,5 млрд, который оказался чуть хуже ожиданий рынка, но соответствует росту на 22 % в годовом сравнении.

 Источник изображений: AMD

Источник изображений: AMD

Несоответствие динамики финансовых показателей AMD ожиданиям инвестора и стало главным толчком для снижения курса акций AMD на 7,6 % после закрытия основной торговой сессии. Проблема заключается в том, что в условиях ИИ-бума AMD наращивает выручку значительно медленнее, чем Nvidia. В сегменте ускорителей вычислений первая собирается выручить по итогам года только $5 млрд, а всего по итогам года AMD выручит $25,6 млрд, что соответствует росту на 13 % по сравнению с прошлым годом. Тогда как акции Nvidia с начала года увеличили свою стоимость в три раза, ценные бумаги AMD подорожали всего на 20 %.

Не помогли даже заявления генерального директора Лизы Су (Lisa Su) о том, что выручка в сегменте центров обработки данных удваивается уже второй квартал подряд. Если быть точнее, в минувшем квартале она выросла на 122 % в годовом сравнении до $3,55 млрд. Соответственно, в данном сегменте AMD получает более половины своей выручки. Операционная прибыль AMD в серверном сегменте год к году выросла на 240 % до $1,04 млрд. Норма операционной прибыли увеличилась с 19 до 29 %. Глава компании пообещала, что поставки серийных ускорителей вычислений Instinct MI325X начнутся в текущем квартале, интерес клиентов и партнёров к ним достаточно высок. Анонс ускорителей семейства Instinct MI350 намечен на вторую половину 2025 года, а дебют Instinct MI400 с архитектурой CDNA Next намечен на 2026 года. Как отметила в беседе с аналитиками глава AMD, сейчас компания наблюдает, как выручка от реализации серверных GPU достигает паритета с выручкой от реализации серверных CPU. Динамика роста первой при этом превосходит собственные ожидания компании.

Чистая прибыль AMD по итогам третьего квартала выросла более чем в два раза до $771 млн. Норма прибыли компании выросла в годовом сравнении с 47 до 50 %. Операционные расходы выросли на 15 % до $1,96 млрд. Другим «лучиком света» в квартальном отчёте AMD, если не считать серверный сегмент, стал клиентский. На данном направлении компании удалось увеличить выручку на 29 % до $1,9 млрд. Процессоры Ryzen с архитектурой Zen 5 пользовались хорошим спросом, как отмечается в презентации AMD. Операционная прибыль в клиентском сегменте выросла почти в два раза до $276 млн, а норма операционной прибыли поднялась с 10 до 15 %. Как отмечается в документации компании, процессоры Ryzen 9000 X3D следующего поколения она рассчитывает представить в четвёртом квартале текущего года, до конца ноября. Выход на рынок процессоров Ryzen 9000 позволил компании в третьем квартале увеличить выручку на двузначное количество процентов. По итогам следующего года, как ожидает Лиза Су, рынок ПК в целом вырастет на 4–6 %, не только из-за появления спроса на процессоры с функцией ускорения ИИ, но и из-за необходимости перехода с Windows 10. При этом спрос на новые ПК в первом полугодии будет традиционно слабее, чем во втором.

Игровой сегмент не порадовал своей динамикой, поскольку спрос на компоненты для игровых консолей Sony и Microsoft текущего поколения закономерно снижался, а продажи видеокарт Radeon не показывают оживления. В итоге выручка AMD на данном направлении по итогам третьего квартала снизилась на 69 % до $500 млн, операционная прибыль сжалась с $208 до $12 млн, а норма операционной прибыли просела с 14 до 2 %. Как пояснила Лиза Су, в сегменте видеокарт Radeon выручка снизилась в третьем квартале в ожидании выхода новых графических процессоров с архитектурой RDNA 4, которые будут представлены в начале 2025 года.

Сегмент встраиваемых решений сократил свою квартальную выручку на 25 % в годовом сравнении до $927 млн. Компания отмечает, что её клиенты продолжают осваивать накопленные ранее складские запасы продукции. Операционная прибыль AMD в этом сегменте снизилась с $612 до $372 млн, а норма операционной прибыли просела с 49 до 40 %.

Важно, что руководство AMD повысило прогноз по величие выручки в сегменте систем искусственного интеллекта с $4,5 до $5 млрд по итогам всего 2024 года. Оборот всей отрасли к 2028 году вырастет до $500 млрд, ежегодно прибавляя в среднем по 60 % с лишним. Спрос на ускорители вычислений не только двигал вверх выручку в серверном сегменте, но и поднимал норму прибыли компании. В текущем квартале AMD рассчитывает выручить от $7,2 до $7,8 млрд и удержать норму прибыли на уровне 54 %.

OpenAI скоро начнёт использовать ускорители AMD и выпустит собственный ИИ-чип в 2026 году

OpenAI, прославившаяся ИИ-чат-ботом ChatGPT, уже несколько месяцев работает с Broadcom над созданием своего первого ИИ-ускорителя, пишет агентство Reuters со ссылкой на собственные источники. По их данным, для этого OpenAI сформировала команду разработчиков чипов из примерно 20 человек, включая ведущих специалистов, ранее участвовавших в создании тензорных процессоров (TPU) в Google, в том числе Томаса Норри (Thomas Norrie) и Ричарда Хо (Richard Ho).

 Источник изображения: Growtika/unsplash.com

Источник изображения: Growtika/unsplash.com

Особое внимание уделяется способности ускорителя запускать ранее обученные нейросети, инференсу, поскольку аналитики прогнозируют, что потребность в чипах для инференса может превзойти спрос на ИИ-ускорители для обучения моделей по мере развёртывания большего количества приложений ИИ. Как ожидается, производство нового чипа на мощностях тайваньского производителя TSMC начнётся в 2026 году.

Также источникам агентства стало известно о планах OpenAI начать использовать наряду с ускорителями Nvidia ИИ-чипы AMD через облачную платформу Microsoft Azure, чтобы удовлетворить растущие потребности в ИИ-инфраструктуре. Речь идёт об ускорителях AMD Instinct MI300.

В настоящее время ускорители Nvidia занимают более 80 % доли рынка ИИ-ускорителей. Но дефицит и рост затрат вынуждают крупных клиентов, таких как Microsoft, Meta, а теперь и OpenAI, заняться поиском альтернатив, как внутренних, так и внешних. Тем не менее, в обозримом будущем OpenAI продолжит полагаться главным образом на решения Nvidia как для обучения моделей, так и для инференса.

OpenAI получает 75 % выручки от платных пользователей

Стартап OpenAI, создавший ChatGPT, остаётся частной компанией, а потому его финансовая отчётность не публикуется открыто. Тем не менее, финансовый директор OpenAI Сара Фрайар (Sarah Friar) недавно призналась, что 75 % выручки компания получает от клиентов на платных направлениях услуг. Подписка платного уровня требует как минимум $20 в месяц.

 Источник изображения: OpenAI

Источник изображения: OpenAI

По словам Сары Фрайар, руководство OpenAI удивлено темпами роста пользовательской базы, особенно в потребительском секторе. В корпоративном сегменте, как она поясняет, где аудитория достаточно «молода», формируется существенная часть годовой выручки компании. В сентябре OpenAI отчиталась о достижении аудиторией коммерческих подписчиков ChatGPT отметки в 1 млн человек. Она охватывает не только корпоративных пользователей, но и академических клиентов.

Еженедельно ChatGPT сейчас используют 250 млн человек, примерно 5 или 6 % бесплатных клиентов со временем становятся платными. «Для нас самым важным является необходимость оставаться на переднем крае: создавать передовые модели, добиваясь того, что в конечном итоге мы предоставим человечеству сильный искусственный интеллект (AGI) во имя его блага», — цитирует финансового директора OpenAI агентство Bloomberg.

Сара Фрайар не скрывает, что OpenAI участвует в глобальной инициативе по созданию вычислительной инфраструктуры, которую питали бы электростанции мощностью 5 гигаватт. Инвестировать в этот проект компания призывает своих партнёров и конкурентов, а также власти отдельных стран, которые хотели бы занять выгодные позиции на стремительно формирующемся рынке систем искусственного интеллекта. Для самой OpenAI создание инфраструктуры является новой территорией, по признанию представительницы компании, и ей приходится многому учиться.

Мощнейший ИИ-суперкомпьютер Илона Маска xAI Colossus на 100 тысяч Nvidia H100 показали изнутри

Новый дорогой проект Илона Маска (Elon Musk) — суперкомпьютер xAI Colossus для систем искусственного интеллекта, — впервые приоткрыл двери для общественности. На объект были допущены журналисты ресурса ServeTheHome. Они в подробностях рассказали о кластере на серверах Supermicro, сборка которого заняла 122 дня, — он работает уже без малого два месяца.

 Источник изображения: servethehome.com

Источник изображения: servethehome.com

Серверы с графическими процессорами построены на платформе Nvidia HGX H100. Каждый из них включает восемь ускорителей Nvidia H100 и универсальную систему жидкостного охлаждения Supermicro 4U с поддержкой горячей замены компонентов для каждого графического процессора в отдельности. Серверы установлены в стойках по восемь штук — получаются 64 ускорителя на стойку. В нижней части каждой стойки находится ещё один блок Supermicro 4U с резервной насосной системой и системой мониторинга стойки.

Стойки сгруппированы по восемь штук, что даёт 512 графических процессоров на массив. Каждый сервер имеет четыре дублирующих блока питания; в задней части стоек можно разглядеть трёхфазные блоки питания, коммутаторы Ethernet; есть также коллекторы размером со стойки, которые обеспечивают работу жидкостного охлаждения. Кластер Colossus содержит более 1500 стоек или около 200 массивов. Ускорители на эти массивы были установлены всего за три недели, рассказал ранее глава Nvidia Дженсен Хуанг (Jensen Huang).

Из-за высоких требований к пропускной способности суперкластера ИИ, который непрерывно производит обучение моделей, инженерам xAI пришлось приложить усилия в плане сетевого взаимодействия. Каждая графическая карта оборудована выделенным сетевым контроллером на 400 GbE с дополнительным 400-Гбит сетевым адаптером на сервер. То есть у каждого сервера Nvidia HGX H100 есть Ethernet со скоростью 3,6 Тбит/с — да, весь кластер работает на Ethernet, а не на InfiniBand или других экзотических интерфейсах, стандартных для суперкомпьютеров.

Суперкомпьютеру для обучения моделей ИИ, включая Grok 3, требуются не только графические процессоры, но и накопители, а также центральные процессоры, однако информацию о них компания xAI разглашает лишь частично. На видео, подвергнутых цензуре, видно, что за это отвечают серверы на чипах x86 в корпусах Supermicro — они также оборудованы жидкостным охлаждением и предназначены либо для работы в качестве хранилищ данных, либо для рабочих нагрузок, ориентированных на центральные процессоры.

На объекте установлены также аккумуляторы Tesla Megapack. При работе кластера возможны резкие перепады в потребляемой энергии, поэтому эти батареи ёмкостью до 3,9 МВт·ч каждая пришлось установить между электросетью и суперкомпьютером в качестве энергетического буфера.

OSI ввела строгие стандарты открытости для Meta✴ Llama и других ИИ-моделей

Open Source Initiative (OSI), десятилетиями определяющая стандарты открытого программного обеспечения (ПО), ввела определение для понятия «открытый ИИ». Теперь, чтобы модель ИИ считалась действительно открытой, OSI требует предоставления доступа к данным, использованным для её обучения, полному исходному коду, а также ко всем параметрам и весам, определяющим её поведение. Эти новые условия могут существенно повлиять на технологическую индустрию, поскольку такие ИИ-модели, как Llama компании Meta не соответствуют этим стандартам.

 Источник изображения: BrianPenny / Pixabay

Источник изображения: BrianPenny / Pixabay

Неудивительно, что Meta придерживается иной точки зрения, считая, что подход OSI не учитывает особенностей современных ИИ-систем. Представитель компании Фейт Айшен (Faith Eischen) подчеркнула, что Meta, хотя и поддерживает многие инициативы OSI, не согласна с предложенным определением, поскольку, по её словам, «единого стандарта для открытого ИИ не существует». Она также добавила, что Meta продолжит работать с OSI и другими организациями, чтобы обеспечить «ответственное расширение доступа к ИИ» вне зависимости от формальных критериев. При этом Meta подчёркивает, что её модель Llama ограничена в коммерческом применении в приложениях с аудиторией более 700 млн пользователей, что противоречит стандартам OSI, подразумевающим полную свободу её использования и модификации.

Принципы OSI, определяющие стандарты открытого ПО, на протяжении 25 лет признаются сообществом разработчиков и активно им используются. Благодаря этим принципам разработчики могут свободно использовать чужие наработки, не опасаясь юридических претензий. Новое определение OSI для ИИ-моделей предполагает аналогичное применение принципов открытости, однако для техногигантов, таких как Meta, это может стать серьёзным вызовом. Недавно некоммерческая организация Linux Foundation также вступила в обсуждение, предложив свою трактовку «открытого ИИ», что подчёркивает возрастающую значимость данной темы для всей ИТ-индустрии.

Исполнительный директор OSI Стефано Маффулли (Stefano Maffulli) отметил, что разработка нового определения «открытого ИИ» заняла два года и включала консультации с экспертами в области машинного обучения (ML) и обработки естественного языка (NLP), философами, представителями Creative Commons и другими специалистами. Этот процесс позволил OSI создать определение, которое может стать основой для борьбы с так называемым «open washing», когда компании заявляют о своей открытости, но фактически ограничивают возможности использования и модификации своих продуктов.

Meta объясняет своё нежелание раскрывать данные обучения ИИ вопросами безопасности, однако критики указывают на иные мотивы, среди которых минимизация юридических рисков и сохранение конкурентного преимущества. Многие ИИ-модели, вероятно, обучены на материалах, защищённых авторским правом. Так, весной The New York Times сообщила, что Meta признала наличие такого контента в своих данных для обучения, поскольку его фильтрация практически невозможна. В то время как Meta и другие компании, включая OpenAI и Perplexity, сталкиваются с судебными исками за возможное нарушение авторских прав, ИИ-модель Stable Diffusion остаётся одним из немногих примеров открытого доступа к данным обучения ИИ.

Маффулли видит в действиях Meta параллели с позицией Microsoft 1990-х годов, когда та рассматривала открытое ПО как угрозу своему бизнесу. Meta, по словам Маффулли, подчёркивает объём своих инвестиций в модель Llama, предполагая, что такие ресурсоёмкие разработки по силам немногим. Использование Meta данных обучения в закрытом формате, по мнению Маффулли, стало своего рода «секретным ингредиентом», который позволяет корпорации удерживать конкурентное преимущество и защищать свою интеллектуальную собственность.

Meta✴ создаст свой ИИ-поисковик и откажется от Google и Microsoft Bing

Meta уже восемь месяцев активно работает над собственной поисковой системой на основе ИИ, чтобы снизить свою зависимость от Google и Microsoft Bing. Новый поиск позволит интегрировать ИИ-сводки событий прямо в приложения компании, такие как Instagram и Facebook, и в будущем заменит внешние поисковики, используемые в настоящее время.

 Источник изображения: Placidplace / Pixabay

Источник изображения: Placidplace / Pixabay

В данный момент для обработки запросов о текущих событиях в Instagram и Facebook ИИ-боты корпорации Meta полагаются на данные Google и Bing. Однако Meta намерена прекратить эту практику, внедрив внутреннюю поисковую систему, которая будет работать исключительно на основе собственной базы данных. Планируется интеграция с уже существующими ИИ-инструментами Meta, что позволит её ИИ-ботам более автономно и эффективно обрабатывать запросы пользователей.

Одним из важнейших этапов в создании новой поисковой системы Meta стало внедрение собственного поискового робота, который уже несколько месяцев активно индексирует информацию из открытых источников в Сети. Это даёт возможность формировать собственную обширную базу данных, которая станет основой для ИИ-бота и обеспечит Meta независимость от внешних платформ. Примечательно, что сбор данных начался ещё до заключения соглашений с новостными агентствами.

Помимо разработки поисковых алгоритмов, Meta также собирает данные о геолокации, что в перспективе позволит компании конкурировать с Google Maps. В сентябре также стало известно о том, что Apple развивает собственные поисковые инструменты для улучшения работы в App Store, что демонстрирует общее стремление техногигантов создавать независимые поисковые сервисы на основе ИИ. В результате борьба за контроль над пользовательскими данными усиливается, и Meta стремится стать важным игроком в этом процессе.

Недавно Meta заключила многолетнее соглашение с международным новостным агентством Reuters, что обеспечит её ИИ-бота доступом к проверенной информации. Это партнёрство, вероятно, повысит доверие пользователей к корпорации, и станет важным этапом на пути к созданию надёжной и актуальной базы данных для ИИ-поиска.

Meta — не единственная компания, стремящаяся к созданию собственного ИИ-поиска. OpenAI также подтвердила разработку системы под названием SearchGPT. В то же время Perplexity, ещё один ИИ-поисковик, сталкивается с исками от News Corp и угрозами со стороны других издателей, включая The New York Times. Эти юридические трудности подчёркивают важность правового регулирования для компаний, разрабатывающих независимые ИИ-поисковики, особенно если они используют контент крупных медиакомпаний.

ИИ-поиск Google теперь доступен в 100 странах, в том числе Узбекистане и Кыргызстане — России в списке не оказалось

Компания Google объявила о запуске поисковых ИИ-обзоров в более чем 100 странах. Сгенерированные сводки (AI Overviews) будут отображаться для пользователей в Канаде, Австралии, Южной Африке, Нигерии, Узбекистане, Туркменистане, Кыргызстане и многих других странах. Полный список добавленных стран доступен на официальном сайте Google.

 Источник изображения: Copilot

Источник изображения: Copilot

По информации The Verge, ИИ-обзоры будут отображаться на всех поддерживаемых языках, включая английский, хинди, индонезийский, японский, португальский и испанский. Это означает, что пользователи в таких странах, как США, смогут выполнять поиск, например, на испанском языке и получать результаты суммирования информации на том же языке.

Кроме того, ссылки на цитируемые источники в ИИ-обзорах стали более заметными, что сделано для удобства пользователей, если они захотят получить больше информации, перейдя на первоисточник, а также чтобы не лишать сайты трафика.

Ранее сообщалось, что в октябре Google добавила рекламу в ИИ-обзоры на мобильных устройствах, но пока только для пользователей в США. В других странах реклама будет продолжать показываться в специальных слотах на странице, а не внутри самих сводок.

Напомним, функция AI Overviews была впервые запущена в США в мае, а затем в августе стала доступна пользователям в Великобритании, Индии, Японии, Индонезии, Мексике и Бразилии.

Apple Intelligence появится в ЕС только в апреле 2025 года

Компания Apple не будет торопиться с расширением географии своего ИИ-сервиса. После сегодняшнего запуска в США Apple Intelligence сначала дебютируют в декабре в других англоязычных странах, а в странах Евросоюза он появится только будущей весной. Сервис будет поддерживать локальные языки стран и предложит почти полный набор функций, улучшенную Siri и интеграцию с ChatGPT.

 Источник изображения: BoliviaInteligente/Unsplash

Источник изображения: BoliviaInteligente/Unsplash

Apple официально объявила, что её сервис Apple Intelligence станет доступен пользователям в Европейском союзе с апреля 2025 года, сообщает издание TechCrunch. Ранее предполагалось, что технические правила ЕС, а именно закон «О цифровых рынках» Европейского союза (DMA), ограничит запуск технологии в регионе. «Этой весной функции Apple Intelligence начнут развёртываться для пользователей iPhone и iPad в ЕС. В их числе будут Writing Tools, Genmoji, обновлённая Siri с улучшенным пониманием языка, интеграция с ChatGPT и многое другое», — заявляется в пресс-релизе компании.

На данный момент, с выходом iOS 18.1, Apple начала постепенно внедрять функции искусственного интеллекта для последних моделей iPhone, iPad и Mac. Когда Apple Intelligence впервые был представлен на конференции разработчиков WWDC в июне, компания предупреждала, что функции будут внедряться медленно и на первом этапе будут доступны только на американском английском языке. Это всё ещё остаётся актуальным, и для использования сервиса пользовательские устройства должны быть настроены именно на этот язык. Если же Apple ID привязан к европейскому адресу, доступ к сервису на iPhone сейчас невозможен.

При этом владельцы Mac в Европе уже могут опробовать некоторые функции Apple Intelligence. Если у пользователя есть Mac с чипом M1 или новее, достаточно изменить язык системы на американский вариант английского языка, чтобы активировать сервис. Предположительно, эта возможность связана с тем, что Apple признана среди прочих крупных платформ «привратником» (gatekeeper) — основным посредником между бизнес-пользователями и потребителями в рамках DMA, но только в отношении устройств iOS, iPadOS, App Store и Safari. macOS под действие этих правил не попадает.

Apple также подтвердила, что в ближайшее время планирует расширить языковую поддержку. Уже в декабре 2024 года будет добавлена локализованная английская версия для Австралии, Канады, Ирландии, Новой Зеландии, Южной Африкт и Великобритании, а в течение 2025 года сервис станет доступен ещё на двенадцати языках, включая французский, немецкий, итальянский, португальский и испанский.

Единственной функцией, которая, по предварительным данным, не будет доступна в ЕС, окажется «Сводки уведомлений». Более детальных комментариев по этому поводу Apple пока не дала.

Apple Intelligence вышел на iPhone, iPad и Mac в урезанном виде и только в одной стране

Apple сообщила, что первые функции платформы искусственного интеллекта Apple Intelligence стали доступен для пользователей iPhone, iPad и Mac с выходом бесплатного обновления программного обеспечения вместе с релизом iOS 18.1, iPadOS 18.1 и macOS Sequoia 15.1.

 Источник изображения: Apple

Источник изображения: Apple

Речь идёт о функции «Инструменты письма», которая поможет обобщать заметки, изменять тон сообщений, делая их более дружелюбными или более профессиональными, и превращать текст в список или таблицу. Также доступны сводки ИИ в уведомлениях и электронных письмах, и был добавлен новый режим для фильтрацию неважных оповещений.

Обновлённый голосовой ассистент Siri теперь обозначен светящейся рамкой вокруг экрана, и позволяет вводить текст не только голосом, но и набирать на клавиатуре после нажатия на нижнюю часть экрана. Также Siri теперь может отвечать на множество вопросов о функциях и настройках продуктов Apple.

В приложении «Фото» пользователи теперь смогут выполнять поиск, просто описывая то, что они ищут. В случае появления в кадре нежелательного объекта, инструмент «Очистка» позволит его удалить. А функция «Воспоминания» поможет создавать ролики на основе описания.

Apple заявила, что Apple Intelligence пополнится следующим набором функций в декабре. В частности, в Siri станет доступен ChatGPT, функция «Инструменты письма» позволит пользователю описывать изменения, которые должен внести ИИ Apple, а функция ИИ-камеры — Visual Intelligence — сможет рассказать вам об объектах вокруг вас.

Apple Intelligence будет сначала доступна в США на американском английском, а в следующем году появится поддержка других языков. В декабре ИИ-функции Apple Intelligence станут доступны для пользователей в Австралии, Канаде, Ирландии, Новой Зеландии, Южной Африке и Великобритании, а поддержка дополнительных языков появится в апреле.

window-new
Soft
Hard
Тренды 🔥
Итоги Golden Joystick Awards 2024 — Final Fantasy VII Rebirth и Helldivers 2 забрали больше всех наград, а Black Myth: Wukong стала игрой года 2 ч.
В программу сохранения классических игр от GOG вошли S.T.A.L.K.E.R. Shadow of Chernobyl и Call of Pripyat, а Clear Sky — на подходе 3 ч.
Star Wars Outlaws вышла в Steam с крупным обновлением и дополнением про Лэндо Калриссиана 4 ч.
Рекордная скидка и PvP-режим Versus обернулись для Warhammer: Vermintide 2 полумиллионом новых игроков за неделю 6 ч.
Новый трейлер раскрыл дату выхода Mandragora — метроидвании с элементами Dark Souls и нелинейной историей от соавтора Vampire: The Masquerade — Bloodlines 7 ч.
В Японии порекомендовали добавить в завещания свои логины и пароли 8 ч.
Обновления Windows 11 больше не будут перезагружать ПК, но обычных пользователей это не касается 9 ч.
VK похвасталась успехами «VK Видео» на фоне замедления YouTube 10 ч.
GTA наоборот: полицейская песочница The Precinct с «дозой нуара 80-х» не выйдет в 2024 году 12 ч.
D-Link предложила устранить уязвимость маршрутизаторов покупкой новых 13 ч.
Представлен внешний SSD SanDisk Extreme на 8 Тбайт за $800 и скоростной SanDisk Extreme PRO с USB4 2 ч.
Представлен безбуферный SSD WD_Black SN7100 со скоростью до 7250 Мбайт/с и внешний SSD WD_Black C50 для Xbox 2 ч.
Новая статья: Обзор ноутбука ASUS Zenbook S 16 (UM5606W): Ryzen AI в естественной среде 2 ч.
Redmi показала флагманский смартфон K80 Pro и объявила дату его премьеры 4 ч.
SpaceX рассказала, почему затопила ракету Super Heavy во время последнего запуска Starship 5 ч.
Астрономы впервые сфотографировали умирающую звезду за пределами нашей галактики — она выглядит не так, как ожидалось 7 ч.
Представлена технология охлаждения чипов светом — секретная и только по предварительной записи 7 ч.
Японская Hokkaido Electric Power намерена перезапустить ядерный реактор для удовлетворения потребности ЦОД в энергии 8 ч.
Грузовик «Прогресс МС-29» улетел к МКС с новогодними подарками и мандаринами для космонавтов 8 ч.
Meta планирует построить за $5 млрд кампус ЦОД в Луизиане 9 ч.