реклама
Теги → avx10

Intel заменит AVX-512 на AVX10 — набор инструкций, который сможет работать везде

Вместе с расширениями архитектуры APX, компания Intel представила сегодня новый набор команд AVX10 (Advanced Vector Extensions 10). Он является дальнейшим развитием AVX-512 и будет поддерживаться в перспективных гибридных процессорах не только производительными, но и энергоэффективными ядрами.

Основная цель внедрения AVX10 — подведение векторных инструкций, которые могут выполняться разными типами ядер Intel, под единый стандарт. Актуальный набор векторных инструкций AVX-512 позволяет работать с 512-битными операндами, однако поддерживается исключительно большими P-ядрами. Маленькие E-ядра имеют лишь 256-битные регистры, поэтому AVX-512 в них не работает. Это приводит к тому, что в гибридных процессорах вроде Alder Lake или Raptor Lake поддержку AVX-512 приходится отключать.

Набор AVX10 должен решить эту проблему, однако несколько своеобразным способом. Регистры шириной 512 бит в E-ядрах не появятся, но он позволит выполнять одни и те же векторные инструкции набора AVX-512 как P-, так и E-ядрами, но применительно к регистрам разной размерности: в первом случае – 512, а во втором — 256 бит. Вопрос совместимости результатов операций Intel собирается решить добавлением в AVX10 флага размерности AVX512VL и специальных 256-битных инструкций со встроенным округлением.

По утверждению Intel, все имеющиеся программы с поддержкой AVX-512 сохранят работоспособность и тот же уровень производительности при исполнении на ядрах с поддержкой 512-битных регистров и инструкций AVX10. Однако перекомпиляция под AVX10 программ, использующих набор AVX2, позволит получить прирост производительности за счёт задействования более эффективных команд и дополнительных 16 регистров. Кроме того, общая производительность программ, использующих AVX10, при их исполнении на гибридных процессорах, будет выше за счёт того, что часть нагрузки сможет перенаправляться на E-ядра.

Первая версия AVX10, обозначенная в документации Intel как AVX10.1, появится в серверных процессорах Granite Rapids, которые должны выйти в 2024 году. Однако в них работа с 256-битными регистрами реализована пока не будет, а совместимость с AVX10 будет обеспечиваться лишь на уровне P-ядер. Иными словами, речь идёт лишь о первом переходном этапе к внедрению нового набора. Полноценная же реализация AVX10 в виде версии AVX10.2, работающей как с 512-, так и с 256-битными регистрами, намечена на более поздний срок.

С переходом на AVX10 дальнейшее развитие AVX-512 замораживается, а все вызовы 512-инструкций в перспективных процессорах будут происходить через AVX10. Что же касается ещё одного продвигаемого Intel набора команд, AMX (Advanced Matrix Extensions), то он сохранит свою актуальность и после перехода к AVX10.

window-new
Soft
Hard
Тренды 🔥
Визг шин, рёв двигателей и атмосфера 90-х: гоночная игра #Drive Rally устремилась к выходу из раннего доступа 4 мин.
Inzoi установила новый рекорд скорости продаж для Krafton— игру раскупают быстрее, чем PUBG 58 мин.
«Буду плакать слезами счастья»: датамайнеры Apex Legends заявили, что Titanfall 3 жива и выйдет в 2026 году 3 ч.
ИИ впервые стал студентом вуза — Венский университет прикладного искусства зачислил систему Flynn 3 ч.
Бенчмарк MLPerf показал, что ускорители AMD Instinct не уступают NVIDIA H200 3 ч.
Россия заняла четвёртое место по размеру аудитории в Kingdom Come: Deliverance 2, хотя игра в стране даже не продаётся 4 ч.
Трамп заявил, что сделка с TikTok близка к заключению, и тарифы могут пригодиться в переговорах с Китаем 7 ч.
Amazon добавила ИИ-функцию кратких обзоров книг Kindle, но предупредила о спойлерах 9 ч.
Инвесторы потребовали от Ubisoft пересмотреть условия сделки с Tencent и готовы добиваться своего через суд 14 ч.
Microsoft запустила собственный ИИ-поисковик Copilot Search 15 ч.
Parasail привлекла $10 млн стартового капитала и выступила «агрегатором ускорителей» с парком чипов больше, чем у Oracle 36 мин.
Богатейшие люди мира за день потеряли $208 млрд из-за новых пошлин США 2 ч.
Cyclotech начала тесты проворного летающего автомобиля с роторными «бочонками» вместо пропеллеров 2 ч.
NVIDIA может переключиться на выполнение заказов только из Китая в преддверии усиления санкций США 2 ч.
Zalman CNPS14X Duo Black — универсальный кулер для мощных процессоров 3 ч.
Вскоре SpaceX впервые запустит Starship на б/у ускорителе Super Heavy 3 ч.
Tenstorrent представила ИИ-ускорители Blackhole на архитектуре RISC-V 4 ч.
Один из крупнейших производителей серверов в мире анонсировал локализацию в США после повышения Трампом пошлин 4 ч.
Jabil представила оптические трансиверы для 1,6-Тбит/с сетей 4 ч.
Объем мирового рынка генеративного ИИ в 2024 году вырос более чем в четыре раза 5 ч.