Meta✴ Platforms вчера поделилась новыми подробностями о своих проектах по модернизации своих центров обработки данных для более эффективной поддержки работы систем искусственного интеллекта. Помимо прочего было рассказано о семействе ИИ-чипов MTIA, разрабатываемом собственными силами компании.
Владелец Facebook✴ и Instagram✴ рассказал в серии сообщений в блоге, что он разработал чип первого поколения в 2020 году в рамках программы Meta✴ Training and Inference Accelerator (MTIA). Цель заключалась в повышении эффективности работы моделей рекомендаций, которые компания использует для предложения рекламы и другого контента в новостных лентах. Однако Meta✴ передумала широко внедрять свой первый собственный чип ИИ и теперь работает над его преемником. В блоге компания описывает первый чип MTIA как «возможность для обучения».
Первый чип MTIA был ориентирован исключительно на работу уже обученных нейросетей, например, для работы алгоритмов, которые решают, показывать ли, скажем, танцевальное видео или мем про кота в качестве следующего сообщения в ленте пользователя, говорится в блоге. Джоэл Кобурн (Joel Coburn), инженер-программист в Meta✴, сказал во время презентации нового чипа, что Meta✴ изначально обращалась к графическим процессорам (GPU), для запуска нейросетей, но обнаружила, что они не очень хорошо подходят для такой работы. «Их эффективность низка для реальных моделей, несмотря на значительную оптимизацию программного обеспечения. Это делает их применение на практике сложным и дорогим. Вот почему нам нужна MTIA», — сказал Кобурн.
В прошлом году Meta✴ занималась масштабным проектом по модернизации своей инфраструктуры ИИ, после того как руководство компании осознало, что ей не хватает аппаратного и программного обеспечения для поддержки спроса со стороны команд, создающих функции, основанные на ИИ. В результате компания отказалась от планов масштабного внедрения собственного чипа для запуска ИИ, и начала работу над более амбициозным чипом, способным выполнять ещё и обучение нейросетей.
Meta✴ признала, что её первый чип MTIA не справляется с высокосложными моделями ИИ, но отметила, что он обрабатывает модели низкой и средней сложности более эффективно, чем чипы конкурентов. Чип MTIA потребляет всего 25 ватт энергии, что в разы меньше, чем потребляют лидирующие на рынке чипы от таких поставщиков, как NVIDIA, и использовал архитектуру чипа с открытым исходным кодом под названием RISC-V. Процессор MTIA v1 выполнен по 7-нм техпроцессу, имеет размеры 19,34 × 19,1 мм, содержит 64 вычислительных блока, каждый из которых включает два ядра RISC-V, то есть всего 128 ядер. Тактовая частота составляет всего 800 МГц. Поддерживается до 64 Гбайт ОЗУ, подключённой по 16 каналам.
В дополнение к MTIA, Meta✴ разрабатывает ещё один чип для обработки определённых типов вычислительных нагрузок, о чем компания сообщила на сегодняшнем мероприятии. Названный Meta✴ Scalable Video Processor или MSVP, чип является первым ASIC-решением собственной разработки Meta✴, предназначенным для обработки видео по запросу и потокового видео. Напомним, что компания Meta✴ начала разрабатывать серверные видеочипы несколько лет назад, анонсировав в 2019 году ASIC для транскодирования видео и проведения конференций. MSVP — это плод некоторых из этих усилий, а также возобновление попыток получить конкурентное преимущество в области потовых видеороликов.
«Только в Facebook✴ люди проводят 50 % своего времени в приложении за просмотром видео. Чтобы обслуживать широкий спектр устройств по всему миру, видео, загруженное, например, на Facebook✴ или Instagram✴, транскодируется в несколько битовых потоков, с различными форматами кодирования, разрешениями и качеством. MSVP является программируемым и масштабируемым чипом, и может быть настроен для эффективной поддержки как высококачественного транскодирования, необходимого как для VOD, так и низкой задержки и более быстрого времени обработки, которое требуется для потокового вещания», — написали в соавторстве руководители Meta✴ Харикришна Редди (Harikrishna Reddy) и Юнцин Чен (Yunqing Chen).
Компания добавила, что у неё есть система на основе искусственного интеллекта, помогающая её инженерам создавать компьютерный код, подобно инструментам, предлагаемым Microsoft Corp, Amazon.com Inc и Alphabet Inc.