реклама
Видеокарты

Процессорозависимость видеосистемы. Часть I - Анализ

⇣ Содержание

Как правильно оценивать производительность видеокарты

Вопрос может показаться надуманным, Казалось бы, чего сложного - взяли стенд покруче, установили видеокарту и давай гонять во всех режимах. Ну, в общем-то, так обычно и делается. Собственно, вопрос состоит в трактовке полученных результатов. Все не так просто, как кажется. Давайте еще раз посмотрим на наш график и поищем подводные камни. Чтобы излишне не загружать картинку, в этот раз мы оставили линии только для трех режимов.


График 3

Красная линия показывает результаты тестирования видеокарты в режиме 1024х768 NO AA/AF. Что в этом случае мы измеряем? Производительность видеокарты? Вряд ли. Посмотрите, как сильно меняются результаты при изменении частоты CPU, но ведь видеокарта у нас осталась та же самая, и производительность у нее не могла измениться! Вывод – в этом режиме мы, по сути, измеряем производительность центрального процессора в скорости генерации кадров, ведь результаты практически линейно зависят от частоты CPU.

Теперь посмотрим на коричневую линию, которая соответствует режиму 1600х1200 NO AA/AF. Нагрузка на видеокарту заметно возросла и о прямой линии речь уже не идет. Тем не менее, разброс результатов остается значительным. Какое именно значение отражает производительность видеокарты? Как мы видим, корректный ответ обязательно должен включать условия тестирования, и если не целиком, то производительность (частоту) CPU, при которой получен результат – обязательно.

И, наконец, третья линия зеленого цвета, соответствующая режиму 1600х1200 4AA/16AF. Смотрите, начиная с частоты CPU 1600 МГц результаты, показываемые видеокартой, перестали зависеть от мощности CPU. Поэтому мы можем с полной уверенностью утверждать, что тот уровень FPS, на котором находится горизонтальная «полочка», как раз и характеризует производительность видеокарты! Отсюда следует:

Критерий корректного сравнения производительности видеокарт (при прочих равных условиях) – допустимо сравнивать лишь те значения производительности (FPS), показываемые видеокартами, которые соответствуют горизонтальным уровням на графике процессорозависимости.

Для этого необходимо использовать тестовый стенд с достаточно мощным центральным процессором и выбирать режим тестирования так, чтобы получилась горизонтальная «полочка» результатов. Получившаяся «полочка» - и есть уровень производительности видеокарты в данном режиме.

Трактовка результатов, показываемых multi-GPU системами

Вы уже знакомы со способами объединения производительности видеокарт – SLI и CrossFire, и знаете, что смысл этих технологий состоит в увеличении производительности видеосистемы. Если говорить простыми словами (снова обращаясь к рисунку 1), то две видеокарты гораздо быстрее «раскрашивают» «каркас» кадра, чем одиночная видеокарта. Мы умышленно не говорим «вдвое быстрее», потому что обычная арифметика здесь не работает, и «два» не всегда вдвое быстрее, чем «один». Сказываются накладные расходы на распределение нагрузки между двумя видеокартами, время на синхронизацию и т.д. Поэтому двукратный прирост производительности от объединения двух видеокарт существует лишь в теории, а на практике максимальный прирост ограничен величиной примерно в 80-90%, то есть в 1,8-1,9 раз. Однако и 80% прироста от установки второй видеокарты удается увидеть далеко не всегда. Используя вышеприведенные графики, мы теперь можем объяснить, почему так происходит.
Возьмем график 3 и, добавив несколько линий, покажем как это можно сделать.


График 4

Как и прежде, зеленая, коричневая и красная линии соответствуют результатам, показываемым видеокартой, в разных графических режимах в зависимости от частоты центрального процессора. Прямая линия синего цвета обозначает «линию максимальных результатов», которая является следствием ограничения производительности со стороны центрального процессора. Серые двухсторонние стрелки показывают теоретически возможный прирост при наращивании производительности видеоподсистемы. Как легко заметить, для красной линии «запас прироста» минимален, поскольку она и так практически совпадает с синей прямой. Поэтому, при увеличении мощности видеоподсистемы с помощью технологий SLI или CrossFire, мы увидим минимальное увеличение производительности или не увидим его. Для коричневой линии, соответствующей более тяжелому графическому режиму, «запас прироста» несколько больше, но все равно меньше, чем теоретический предел 80-90% ( 120 fps + 80% ~ 220 fps, а мы получаем примерно лишь 150 fps). Наиболее благоприятная ситуация складывается для самого тяжелого графического режима – 4AA/16AF в разрешении 1600х1200. В этом случае «запас прироста» еще больше и связка из двух видеокарт может проявить себя в полную силу. Как видите, для полноценного раскрытия потенциала технологий SLI и CrossFire требуется мощный центральный процессор (при движении вправо по оси Х «запас прироста» увеличивается), а также тестирование в тяжелых графических режимах.

Конечно, все эти выводы были интуитивно понятны еще в момент анонса технологий объединения производительности видеокарт, мы лишь наглядно показали, где искать этот прирост.

Наверное, у вас возник вопрос – а что на графике делают оранжевые пунктирные линии? Предположим, что нижняя из двух пунктирных линий - это результаты, показанные в еще более тяжелом графическом режиме (скажем, 4AA/16AF в разрешении 2048x1536). Верхняя пунктирная линия проведена на уровне, который на 80% выше, то есть соответствует производительности двух видеокарт в SLI или CrossFire (нижняя пунктирная стрелка). А что же тогда показывает верхняя пунктирная стрелка? Разумеется, она показывает оставшийся «запас прироста», который может быть реализован, например, с помощью… Quad SLI. Как видите, поиски реального прироста производительности в этом случае требуют еще более тяжелого графического режима и, конечно же, мощного центрального процессора. (Замечание – приведенный для Quad SLI пример не отражает реальных значений производительности данной связки видеокарт и лишь иллюстрирует то, что подходы, рассматриваемые в статье, с успехом могут быть применены и к таким видеорешениям).

Проверка полученных выводов на других 3D-приложениях

До сих пор мы проводили все наши рассуждения на примере лишь одного 3D-приложения, а именно – игры Half-Life 2 с демо-сценой «d1_canals_09 3dnews02». Насколько выводы, полученные нами, справедливы в других приложениях? Давайте проверим. Ниже мы приведем еще два сводных графика, подобных графику 2, но для игр DOOM 3 и F.E.A.R., с использованием встроенных в эти игры демок.


График 5

Как видите, общая картина очень напоминает ту, что мы видели в Half-Life 2. Разумеется, абсолютные значения FPS другие, но общий характер поведения линий сохраняется.


График 6

Игра F.E.A.R. настолько «тяжела», что даже при использовании довольно мощной видеокарты 7800GTX, мы практически сразу получаем горизонтальные «полочки», причем в режимах NO AA/AF, то есть без включения полноэкранного сглаживания и анизотропной фильтрации. Поэтому, для поиска «линии максимально возможных результатов» пришлось использовать самое низкое из доступных разрешений – 640х480 (темно-зеленая линия на графике). Что касается более высоких разрешений, то некоторая «корявость» линий связана с тем, что встроенный в игру F.E.A.R. тест выдает целочисленные значения, что при небольших абсолютных значениях дает заметную относительную погрешность.

Ну и наконец – популярнейшие синтетические тесты семейства 3DMark. Для примера мы взяли 3DMark’05.


График 7

Как оказалось, с ростом частоты центрального процессора, результаты видеокарты GeForce 7800GTX (зеленая линия) при стандартных настройках 3DMark’05 превращаются в «полочку». Согласно полученному нами «критерию корректного сравнения производительности видеокарт» это означает, что производительность GeForce 7800GTX в этом тесте определена верно. А значит, корректно будет сравнивать и более «слабые» видеокарты с помощью 3DMark’05.

Думаю, теперь понятно, почему мы не стали приводить здесь результаты, полученные в 3DMark’06. Поскольку в этот бенчмарк включены тесты CPU, то мы не сможем получить горизонтальную «полочку» результатов на графике процессорозависимости, а значит корректное сравнение производительности видеокарт остается под вопросом.

Возвращаемся к графику 7. Для того, чтобы найти «линию максимальных результатов» в этом тесте мы использовали видеокарту Radeon X1900XTX (поскольку 3DMark’05 благоволит Radeon’ам), и тестировали в разрешении 320х240 (прочие настройки теста не менялись). Получившаяся красная линия хотя и не является геометрической прямой, тем не менее вполне подходит на роль «линии максимальных результатов». Как видите, с использованием процессора Athlon 64 4000+, работающего на частоте 2400 МГц, максимальное количество «марков» находится на уровне около 12000, или 12500, если следовать аппроксимирующей кривой. До сих пор ни одна протестированная нами система (7900GTX-SLI, CrossFire, Quad-SLI) не преодолела рубеж в 12000 «марков» в тесте 3DMark’05 на используемом нами стенде, что подтверждает сделаные нами выводы.

Следующая страница → ← Предыдущая страница
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
window-new
Soft
Hard
Тренды 🔥
В программу сохранения классических игр от GOG вошли S.T.A.L.K.E.R. Shadow of Chernobyl и Call of Pripyat, а Clear Sky — на подходе 39 мин.
Star Wars Outlaws вышла в Steam с крупным обновлением и дополнением про Лэндо Калриссиана 2 ч.
Миллионер с зарплатой сантехника: выяснилось, сколько зарабатывает глава OpenAI 4 ч.
Рекордная скидка и PvP-режим Versus обернулись для Warhammer: Vermintide 2 полумиллионом новых игроков за неделю 4 ч.
Роскомнадзор с декабря начнёт блокировать сайты за публикацию научной информации о VPN 4 ч.
Новый трейлер раскрыл дату выхода Mandragora — метроидвании с элементами Dark Souls и нелинейной историей от соавтора Vampire: The Masquerade — Bloodlines 5 ч.
В Японии порекомендовали добавить в завещания свои логины и пароли 7 ч.
Обновления Windows 11 больше не будут перезагружать ПК, но обычных пользователей это не касается 7 ч.
VK похвасталась успехами «VK Видео» на фоне замедления YouTube 9 ч.
GTA наоборот: полицейская песочница The Precinct с «дозой нуара 80-х» не выйдет в 2024 году 10 ч.
Redmi показала флагманский смартфон K80 Pro и объявила дату его премьеры 2 ч.
SpaceX рассказала, почему затопила ракету Super Heavy во время последнего запуска Starship 3 ч.
Астрономы впервые сфотографировали умирающую звезду за пределами нашей галактики — она выглядит не так, как ожидалось 5 ч.
Японская Hokkaido Electric Power намерена перезапустить ядерный реактор для удовлетворения потребности ЦОД в энергии 6 ч.
Meta планирует построить за $5 млрд кампус ЦОД в Луизиане 7 ч.
Arm задаёт новый стандарт для ПК, чтобы навязать конкуренцию x86 7 ч.
HPE готова ответить на любые вопросы Минюста США по расследованию покупки Juniper за $14 млрд 7 ч.
Thermaltake представила компактный, но вместительный корпус The Tower 250 для игровых систем на Mini-ITX 8 ч.
Флагманы Oppo Find X8 и X8 Pro на Dimensity 9400 стали доступны не только в Китае — старший оценили в €1149 9 ч.
«ВКонтакте» выросла до 88,1 млн пользователей — выручка VK взлетела на 21,4 % на рекламе 9 ч.