реклама
Теги → закон хуанга

От Мура к Хуангу: новый взгляд NVIDIA на развитие вычислительных технологий

Сегодня актуальность закона Мура вызывает всё больше вопросов, поэтому учёные компании NVIDIA предложили новый взгляд на будущее вычислительной техники: закон Хуанга. Названный в честь основателя и руководителя NVIDIA Дженсена Хуанга (Jensen Huang), этот закон предполагает, что динамика роста производительности процессоров, которую мы наблюдаем, не иссякнет в будущем и будет продолжаться, опираясь в основном на человеческую изобретательность.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

Основное отличие закона Хуанга от закона Мура заключается в акценте на архитектурных и алгоритмических инновациях, а не на простом удвоении числа транзисторов на кристалле каждые два года благодаря уменьшению размеров технологического процесса. Главный научный сотрудник NVIDIA Билл Дэйли (Bill Dally) на недавней конференции Hot Chips 2023 подчеркнул, что переход от 28-нм к 5-нм технологическим процессам в течение десятилетия принёс лишь 2,5-кратный прирост производительности, в то время как основной рост был достигнут благодаря ключевым инновациям в архитектуре и обработке чисел.

Основной вклад в 1000-кратное увеличение производительности принесло упрощение представления чисел, используемых компьютерами для расчётов. Внедрение архитектуры NVIDIA Hopper с движком Transformer позволило сделать значительный шаг в ускорении процесса обучения ИИ-моделей. Тензорные ядра Hopper, способные смешивать форматы 8-битных и 16-битных вычислений с плавающей точкой, стали ключевым моментом для ускорения ИИ-вычислений в процессе обучения трансформеров (определённый тип глубоких нейронных сетей), не уменьшив при этом требуемую точность. Это нововведение позволило достичь высшего уровня эффективности в вычислениях, что критически важно для современных задач в области ИИ.

Более того, производительность операций с плавающей точкой в 32-битном, 64-битном, 16-битном форматах, а также 8-битных целочисленных вычислений утроилась, что также внесло вклад в общее ускорение вычислительных процессов. В сочетании с движком Transformer и технологией NVIDIA NVLink четвёртого поколения тензорные ядра Hopper позволили ускорить рабочие нагрузки на порядок в области высокопроизводительных вычислений (HPC) и задач ИИ.

Кроме того, команда из более чем 300 человек, возглавляемая Дэйли в NVIDIA Research, разработала продвинутые инструкции, которые позволяют GPU более эффективно организовывать свою работу, сэкономив энергию и увеличив производительность в 12,5 раза. Такие инновации, как структурная разреженность в архитектуре NVIDIA Ampere, позволили дополнительно увеличить производительность в 2 раза, не ущемляя точность моделей ИИ.

Эта смена акцентов открывает дорогу к созданию новых, более эффективных архитектур и алгоритмов, что делает текущее время чрезвычайно захватывающим для специалистов в области компьютерной инженерии и проектирования микросхем. Судя по всему, перед индустрией информационных технологий открывается новая эра возможностей, где человеческий гений и инновационный подход становятся ключевыми факторами прогресса.

window-new
Soft
Hard
Тренды 🔥
Microsoft наконец начала готовиться к запуску скандальной ИИ-функции Recall 57 мин.
Разработчики Mafia: The Old Country случайно «слили» дату выхода игры — утечка произошла в Steam 2 ч.
OpenAI готовится запустить ИИ-модель GPT-4.1, но возможны задержки 7 ч.
Исследование Microsoft показало, что ИИ пока «так себе» исправляет ошибки в программном коде 7 ч.
OpenAI прокачала память ChatGPT, чтобы бот мог ссылаться на прошлые диалоги 12 ч.
«То, что я ждал от The Movies 2»: голливудская стратегия Hollywood Animal от авторов This is the Police вышла в прокат раннего доступа Steam 13 ч.
Масштабное дополнение к Katana Zero вернулось из небытия с новым трейлером — оно всё ещё бесплатное и почти готово 13 ч.
В графическом онлайн-редакторе Canva появился ИИ для генерации изображений и создания приложений 13 ч.
Новый геймплейный трейлер раскрыл дату выхода философского выживания The Alters от создателей Frostpunk 2 16 ч.
Журналисты раскопали причины провала Apple с внедрением ИИ в Siri 16 ч.
Tesla остановила приём заказов на дорогие модели в Китае и Японии, а в США её электромобили хлынули на вторичный рынок 16 мин.
NTT представила ИИ-чип для обработки видео на периферии 37 мин.
Нейтрино экспериментально ограничили по массе — неуловимая частица близка к раскрытию секретов Вселенной 41 мин.
Samsung опровергла слухи о прекращении выпуска чипов для китайских компаний 3 ч.
Конец «зелёной повестки»: Трамп поддержал угольный сектор в США ради удовлетворения спроса ИИ ЦОД на энергию 3 ч.
Tesla начала предлагать заднеприводный пикап Cybertruck, но он оказался дороже обещанного 4 ч.
Нынешний глава Intel вложил сотни миллионов долларов в китайские компании, включая конкурирующую SMIC 5 ч.
Новая статья: Обзор Nothing Phone (3a) Pro: самый нескучный смартфон 2025 года 10 ч.
Новая статья: Обзор блока питания Ocypus Iota P1000 12 ч.
Акции Apple, Tesla и Meta рухнули вслед за Nasdaq после взлёта в среду — инвесторы обеспокоены пошлинами 12 ч.