реклама
Теги → ant group

Ant Group придумала, как эффективно обучать ИИ на китайских чипах вместо Nvidia

Ant Group представила новый метод обучения ИИ-моделей, позволяющий использовать китайские полупроводники, включая чипы Huawei и Alibaba. Компания применила архитектуру Mixture of Experts и уже достигла результатов, сопоставимых с использованием графических процессоров (GPU) Nvidia H800, что укрепляет позиции Китая на фоне ограничений, введённых США.

 Источник изображений: Ant Group CO

Источник изображений: Ant Group CO

Это достижение знаменует собой важный этап в технологическом противостоянии между китайскими и американскими компаниями, которое резко обострилось после того, как DeepSeek доказала возможность создания современных больших языковых моделей (LLM) без миллиардных вливаний, аналогичных тем, которые делают OpenAI и Google. Хотя Ant Group по-прежнему использует решения Nvidia в ряде проектов, в новых разработках компания отдаёт предпочтение альтернативным поставщикам, включая AMD, а также местным китайским производителям полупроводников, особенно в условиях нарастающего давления со стороны экспортных ограничений США. Это позволяет китайским компаниям сохранять темп технологического прогресса и снижать зависимость от иностранных поставщиков, прежде всего от Nvidia.

Согласно опубликованной в марте научной статье, Ant Group утверждает, что её ИИ-модели в отдельных тестах превзошли разработки компании Meta. Однако эти заявления пока не получили независимого подтверждения. При этом важно отметить, что модель H800, хотя и не относится к передовому классу ускорителей Nvidia, остаётся мощным инструментом, способным справляться с ресурсоёмкими задачами обучения ИИ. Благодаря собственной оптимизированной стратегии Ant Group удалось сократить расходы на обучение ИИ-модели объёмом в 1 трлн токенов с 6,35 млн юаней ($880 000) до 5,1 млн юаней ($707 000). В данном контексте токены — это минимальные единицы текста, на которых обучаются LLM, чтобы впоследствии генерировать осмысленные ответы на запросы пользователей.

 Источник изображений: Ant Group CO

В компании заявили о намерении внедрить свои новые языковые модели — Ling-Plus и Ling-Lite — в решения, ориентированные на промышленное применение, включая здравоохранение и финансовую сферу. Ant Group уже приобрела китайскую платформу Haodf.com, специализирующуюся на медицинских онлайн-сервисах, чтобы расширить возможности своей ИИ-инфраструктуры в области здравоохранения. Кроме того, компания развивает мобильное приложение Zhixiaobao, позиционируемое как ИИ-ассистент для повседневной жизни, а также Maxiaocai — сервис на основе ИИ, предоставляющий финансовые рекомендации.

В опубликованной научной работе подчёркивается, что модель Ling-Lite показала лучшие результаты в одном из ключевых англоязычных тестов по сравнению с одной из версий Llama компании Meta. При этом обе модели — Ling-Lite и Ling-Plus — превзошли аналоги DeepSeek в бенчмарках на китайском языке. Ling-Lite содержит 16,8 млрд параметров — это настраиваемые элементы модели, определяющие её поведение при генерации текста. Модель Ling-Plus насчитывает 290 млрд параметров и по масштабности относится к категории больших языковых систем. Обе модели были представлены сообществу разработчиков в виде решений с открытым исходным кодом. По оценке MIT Technology Review, GPT-4.5 компании OpenAI содержит около 1,8 трлн параметров, а DeepSeek-R1 — 671 млрд.

Архитектура Mixture of Experts, использованная в Ling-моделях, предполагает активацию отдельных подсетей внутри модели в зависимости от типа задачи, тем самым обеспечивая оптимальное распределение вычислительных ресурсов. Эта система напоминает команду специалистов, в которой каждый элемент ИИ-модели отвечает за строго определённую, узкоспециализированную функцию. Однако в процессе обучения возникли сложности: как сообщается в научной статье, даже незначительные изменения в аппаратной конфигурации или в структуре модели приводили к резкому росту числа ошибок. Такая нестабильность делает процесс обучения чувствительным к параметрам окружения и требует дополнительной адаптации на каждом этапе.

Китай закончил кампанию против IT-гигантов, оштрафовав Ant Group на $984 млн и Tencent на $414 млн

Кажется, что развёрнутая властями Китая кампания по усмирению местных IT-гигантов Alibaba и Tencent подошла к концу. Регулирующие органы решили, что обе компании должны будут уплатить штраф в сумме на 1,4 миллиарда долларов в качестве компенсации за прошлые проступки, в то время как Пекин переходит к «нормализованному» надзору.

Китайский финансовый регулятор в прошлую пятницу объявил о штрафе в размере 7,123 миллиарда юаней (984 миллиона долларов) для финтех-подразделения Alibaba, компании Ant Group, и постановила прекратить работу его службы медицинского страхования, Xianghubao. В свою очередь Tencent признала, что получила уведомление о штрафе в размере 2,9 миллиарда юаней (414 миллионов долларов) от Народного банка Китая.

Было установлено, что Ant Group нарушила законы, регулирующие страхование, инвестиции, отмывание денег и многое другое. Alibaba уже решила закрыть Xianghubao. Tencent была оштрафована за недостаточно должное управление некоторыми аспектами своей услуги Tencent Pay.

В своё время Пекин ополчился на Ant Group за слова основателя Alibaba Джека Ма (Jack Ma), который раскритиковал власти Китая. В итоге в последний момент компанию вынудили отменить планировавшийся дебют Ant Group на фондовом рынке в 2020 году ­— на тот момент времени он должен был стать одним из самых высокооцененных IPO в мире. Официальной причиной для отмены выхода на биржу стало беспокойство властей Китая о некоторых кредитных продуктах, которые предлагала Ant Group.

После объявления о штрафе на прошлой неделе, Ant предложила новый план, чтобы помочь инвесторам превратить их акции в наличные: выкуп акций 7,6 % акций. Однако выкуп акций не является хорошей новостью, поскольку он оценивает Ant Group на 70 % ниже суммы, указанные при ценообразовании отмененного IPO 2020 года.

Китайские власти ранее заявляли, что их кампания по корректировке в отношении 14 платформенных бизнесов «по сути, завершена», оставив всего несколько вопросов для решения. Объявление Пекина о штрафах вместе с подробным объяснением причин их наложения, а также упоминанием о возвращении к нормализованной регулировке, намекает на то, что Китай теперь решил эти вопросы и завершил свое многолетнее расследование поведения своих веб-гигантов.

Действия властей оставили значительный след на Alibaba, которая, в свою очередь, приняла решение разделиться на шесть компаний и перестроила структуру своего исполнительного руководства.

window-new
Soft
Hard
Тренды 🔥
Вернулись к тому, с чего начинали: похоже, Blizzard готовится переименовать Overwatch 2 в Overwatch 36 мин.
Apple выпустила iOS 18.4 с «Приоритетными уведомлениями» от ИИ и другими улучшениями 2 ч.
«Софтлайн» опубликовал аудированные итоги 2024 года, подтвердив увеличение прогноза на 2025 год 3 ч.
«Жестокая, энергичная и без компромиссов»: впечатления журналистов и 14 минут нового геймплея Doom: The Dark Ages 4 ч.
В «Google Презентациях» появился ИИ для генерации изображений Imagen 3 и другие инструменты для «потрясающих презентаций» 4 ч.
Amazon представила ИИ-агента Nova Act, который заменит человека в интернет-серфинге 6 ч.
Слухи: четыре известные корейские компании устроили борьбу за право создавать новые игры по StarCraft 6 ч.
Голливудские студии перенаправили монетизацию фейковых трейлеров на YouTube себе в карман 7 ч.
Франция оштрафовала Apple на €150 млн за ограничение таргетинга в iOS 7 ч.
«Самое брутальное зрелище в галактике»: новый геймплейный трейлер подтвердил дату выхода безжалостного боевика Kiborg от российских разработчиков 8 ч.
Micron предупредила о дальнейшем росте цен на DRAM и NAND, и обвинила в этом ИИ 2 ч.
AMD теперь сможет «продавать больше GPU» — компания поглотила ZT Systems за $5 млрд 2 ч.
Стартовали продажи игровых ноутбуков с Nvidia Blackwell — за мобильную RTX 5090 просят как минимум $4299 4 ч.
На рынке комплектующих для игровых ПК появился новый крупный игрок — HP расширила ассортимент геймерского бренда Omen 6 ч.
Acer представила 240-Гц игровые QD-OLED-мониторы Predator X27U X1 и Predator X32 X2 по цене от $600 6 ч.
Meta подписала соглашение с Sembcorp о поставке энергии плавучих солнечных генераторов в Сингапуре 6 ч.
Возврат к корням: Vantage Towers разместила базовые станции на деревянных столбах 7 ч.
Arm собралась руками Nvidia захватить половину рынка процессоров для дата-центров 8 ч.
Доступная раскладушка Samsung Galaxy Z Flip 7 FE будет выглядеть точно как прошлогодний Z Flip 6 10 ч.
На заводе «ЦТС» в Калининградской области начали выпускать серверные платы 10 ч.