реклама
Новости Hardware

Энергопотребление ИИ удалось снизить на 95 % без потерь, но Nvidia новый алгоритм вряд ли одобрит

В условиях растущей популярности искусственного интеллекта высокое энергопотребление ИИ-моделей становится всё более актуальной проблемой. Несмотря на то, что такие техногиганты, как Nvidia, Microsoft и OpenAI, пока не говорят об этой проблеме громко, явно преуменьшая её значение, специалисты из BitEnergy AI разработали технологию, способную значительно снизить энергопотребление без существенных потерь в качестве и скорости работы ИИ.

 Источник изображения: Copilot

Источник изображения: Copilot

Согласно исследованию, новый метод может сократить использование энергии вплоть до 95 %. Команда называет своё открытие «Умножением линейной сложности» (Linear-Complexity Multiplication) или сокращённо L-Mul. Как пишет TechSpot, этот вычислительный процесс основан на сложении целых чисел и требует значительно меньше энергии и операций по сравнению с умножением чисел с плавающей запятой, которое широко применяется в задачах, связанных с ИИ.

На сегодняшний день числа с плавающей запятой активно используются в ИИ для обработки очень больших или очень малых чисел. Они напоминают запись в бинарной форме, что позволяет алгоритмам точно выполнять сложные вычисления. Однако такая точность требует крайне больших ресурсов и уже вызывает определённые опасения, так как некоторым ИИ-моделям нужны огромные объёмы электроэнергии. Например, для работы ChatGPT требуется столько электроэнергии, сколько потребляют 18 000 домохозяйств в США — 564 МВт·ч ежедневно. По оценкам аналитиков из Кембриджского центра альтернативных финансов, к 2027 году ИИ-индустрия может потреблять от 85 до 134 ТВт·ч ежегодно.

Алгоритм L-Mul решает эту проблему за счёт замены сложных операций умножения с плавающей запятой на более простые сложения целых чисел. В ходе тестирования ИИ-модели сохранили точность, при этом энергопотребление для операций с тензорами сократилось на 95 %, а для скалярных операций на 80 %.

L-Mul также улучшает и производительность. Оказалось, что алгоритм превосходит текущие стандарты вычислений с 8-битной точностью, обеспечивая более высокую точность с меньшим количеством операций на уровне битов. В ходе тестов, охватывающих различные задачи ИИ, включая обработку естественного языка и машинное зрение, снижение производительности составило всего 0,07 %, что специалисты сочли незначительной потерей на фоне огромной экономии энергии.

При этом модели на основе трансформеров, такие как GPT, могут получить наибольшую выгоду от использования L-Mul, поскольку алгоритм легко интегрируется во все ключевые компоненты этих систем. А тесты на популярных моделях ИИ, таких как Llama и Mistral, показали даже улучшение точности в некоторых задачах.

Плохая новость заключается в том, что L-Mul требует специализированного оборудования и современные ускорители для ИИ не оптимизированы для использования этого метода. Хорошая новость заключается в том, что уже ведутся работы по созданию такого оборудования и программных интерфейсов (API).

Одной из возможных преград может стать сопротивление со стороны крупных производителей чипов вроде Nvidia, которые могут замедлить внедрение новой технологии. Так как, например, Nvidia является лидером в производстве оборудования для искусственного интеллекта и маловероятно, что она так просто уступит позиции более энергоэффективным решениям.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Илон Маск намерен удвоить стоимость ИИ-стартапа xAI до $45 млрд благодаря ближневосточным инвесторам 51 мин.
Превращение OpenAI в коммерческую компанию может застопориться — оно привлекло внимание генпрокурора Делавэра 59 мин.
МТС запустит публичную облачную платформу 2 ч.
PC Gaming Show: Most Wanted вернётся 5 декабря — с бессменной ведущей и 25 ожидаемыми играми 2 ч.
Ubisoft прокомментировала слухи о ещё одном переносе Assassin’s Creed Shadows 4 ч.
Минцифры РФ подготовит единый прайс-лист на ПО для государственных структур 4 ч.
В Windows обнаружена опасная уязвимость нулевого дня, которую закрыл сторонний разработчик 5 ч.
Call of Duty: Black Ops 6 показала крупнейший запуск в истории серии и помогла Game Pass установить новый рекорд 5 ч.
Microsoft переманила ведущего разработчика Marvel’s Wolverine — он возглавил команду Perfect Dark 6 ч.
Поражённый зомби-вирусом Сеул в трейлере PvPvE-экшена Nakwon: Last Paradise 6 ч.
В Австралии запустили опытное производство гибких солнечных панелей из перовскита, но КПД разочаровал 2 ч.
DIGITIMES Research: в 2024 году Google увеличит долю на рынке кастомных ИИ ASIC до 74 % 3 ч.
Asus выпустила 27-дюймовый профессиональный монитор ProArt Display 5K PA27JCV за $799 3 ч.
Avride, выделившаяся из «Яндекса», показала четырёхколёсного робота-курьера на чипе Nvidia 4 ч.
Несостоявшиеся звёзды могут иметь собственные планеты, подсказывает «Джеймс Уэбб» 4 ч.
Ученые вычислили скрытый океан на спутнике Урана — там есть потенциал для зарождения жизни 4 ч.
Рынок смартфонов показал рекордный рост с 2021 года: сильнее всех поднялись Vivo и Apple, а Samsung теряет рынок 4 ч.
ИИ-гонка очень дорого обходится Microsoft, Google и другим IT-гигантам — инвесторы обеспокоены 5 ч.
KKR подписала соглашение о партнёрстве с ECP для строительства ЦОД и реализации энергетических проектов на $50 млрд 6 ч.
Cisco представила ИИ-сервер UCS C885A M8 на базе NVIDIA H100/H200 или AMD Instinct MI300X 6 ч.