С самого Нового года мы предвкушали появление новых чипов от nVidia. ATi, главный конкурент nVidia, смогла сравниться с технологией GeForce3, и сейчас настало время следующего рывка вперед для разработчика GPU из Санта-Клары.
nVidia довольно сильно везет, поскольку ситуация на рынке 3D графики отличается от положения дел на рынке процессоров. Покупателя все труднее убедить в покупке нового процессора, поскольку даже купленный год назад "камень" до сих пор прекрасно работает. На самом деле вряд ли кому сейчас нужны 2+ ГГц монстры от AMD и Intel.
Но если вы обратите свой взор на рынок 3D графики, то заметите явное отличие, поскольку на этом рынке есть куда развиваться. И хотя 3D карты сейчас могут работать в играх на высоком разрешении с нормальной частотой кадров, им еще далеко до реалистичности фильма.
По этой причине nVidia еще немножко приподнимает планку 3D реализма с выпуском GeForce4 Ti. Нам предстоит насладиться более реалистичным сценами и более жизненными движениями в демах последнего продукта от nVidia.
Однако большинство людей вряд ли захочет выкладывать кругленькую сумму за новый уровень 3D реализма. Сегодня люди с удовольствием играют в игры, изданные даже год назад. Для таких людей nVidia анонсировала GeForce4 MX, дальнейшее развитие линейки GeForce2 MX, характеризующееся отсутствием многих приятных возможностей GeForce3 и GeForce4 Ti.
Как видите, сейчас на многих картах nVidia будет устанавливаться новая эталонная система охлаждения.
Кроме GeForce4 Ti4600 в линейке присутствуют GeForce4 Ti4400 и GeForce4 Ti4200. В следующей таблице вы сможете сравнить характеристики всех карт линейки GeForce4 Ti между собой и с бывшим флагманом nVidia - GeForce3 Ti500. Кстати, третья модель, GeForce4 Ti4200 будет объявлена примерно через 8 недель, дабы совсем не удавить GeForce3 Ti500.
GeForce4 Ti4600 | GeForce4 Ti4400 | GeForce4 Ti4200 | GeForce3 Ti500 | |
Частота чипа | 300 МГц | 275 МГц | 225 МГц | 240 МГц |
Частота памяти | 650 МГц (DDR) | 550 МГц | 500 МГц | 500 МГц |
Объем памяти | 128 Мб | 128 Мб | 128 Мб | 64 Мб |
Пропускная способность | 10,400 Мбайт/с | 8,800 Мбайт/с | 8,000 Мбайт/с | 8,000 Мбайт/с |
Теоретическая скорость заполнения | 1,200 Мпиксель/с | 1,100 Мпиксель/с | 900 Мпиксель/с | 960 Мпиксель/с |
Цена | $399 | $299 | $199 | $299 |
Перед тем, как мы погрузимся в новые технологии GeForce4 Ti, давайте пробежимся по основным спецификациям NV25.
Для видеовыхода все еще используется сторонний чип.
По проведенному тестированию GeForce4 Ti4600 оказывается ощутимо быстрее GeForce3 Ti500. Такой впечатляющий отрыв в производительности NV25 был достигнут не благодаря какой-то принципиально новой технологии, а по причине дальнейшей отладки и настройки существующих в GeForce3 (NV20) технологий. Имейте в виду, что ядро GeForce4 всего на 5% больше ядра NV20 при равном техпроцессе (0,15 мкм).
Читайте так же: Пиксельное затенение и вершинные эффекты на GeForce3 Технология T&L Что такое T&L. Часть 1 Что такое T&L. Часть 2 |
Если вы не знаете, что такое "вершинные шейдеры", то вы можете почитать эту статью.
Если GeForce3 имела только один модуль вершинных шейдеров, то в GeForce4 Ti их уже два. Впрочем, вряд ли вас это удивит, поскольку в чипе nVidia для Microsoft Xbox также присутствует два модуля вершинных шейдеров. Разве что в NV25 модули были улучшены.
Очевидно, что два параллельно работающих модуля вершинных шейдеров могут обработать больше вершин в единицу времени. Для этого чип сам раскладывает вершины на два потока, поэтому новый механизм прозрачен для приложений и API. Диспетчеризация инструкций осуществляется NV25, при этом чип должен убедиться, что каждый модуль вершинных шейдеров работает над своей вершиной. Улучшение модулей вершинных шейдеров со времен GeForce3 привело к уменьшению задержек при обработке инструкций.
В итоге GeForce4 Ti4600 может обработать примерно в 3 раза больше вершин, чем GeForce3 Ti500 по причине наличия двух модулей вершинных шейдеров, их улучшения и работе на более высокой тактовой частоте.
nVidia смогла улучшить функциональность пиксельных шейдеров в GeForce4 Ti.
Новый чип поддерживает пиксельные шейдеры 1.2 и 1.3, но не расширение ATi 1.4.
Ниже приведены новые режимы пиксельных шейдеров.
OFFSET_PROJECTIVE_TEXTURE_2D_NV
OFFSET_PROJECTIVE_TEXTURE_2D_SCALE_NV
OFFSET_PROJECTIVE_TEXTURE_RECTANGLE_NV
OFFSET_PROJECTIVE_TEXTURE_RECTANGLE_SCALE_NV
OFFSET_HILO_TEXTURE_2D_NV
OFFSET_HILO_TEXTURE_RECTANGLE_NV
OFFSET_HILO_PROJECTIVE_TEXTURE_2D_NV
OFFSET_HILO_PROJECTIVE_TEXTURE_RECTANGLE_NV
DEPENDENT_HILO_TEXTURE_2D_NV
DEPENDENT_RGB_TEXTURE_3D_NV
DEPENDENT_RGB_TEXTURE_CUBE_MAP_NV
DOT_PRODUCT_TEXTURE_1D_NV
DOT_PRODUCT_PASS_THROUGH_NV
DOT_PRODUCT_AFFINE_DEPTH_REPLACE_NV
Мы не будем описывать каждый новый режим, но следует отметить появившуюся в GeForce4 Ti поддержку скорректированного по z наложения неровностей (z-correct bump mapping), что позволяет устранить артефакты, появляющиеся при соприкосновении bump-текстуры с другой геометрией (например, когда вода в озере или реке соприкасается с землей).
Еще одно важное улучшение касается качества текстур, сжатых по DXT1, как вы сможете убедиться на скриншотах ниже.
nVidia в конце концов смогла улучшить конвейер пиксельных шейдеров, что ощутимо отразилось на скорости рендеринга сцен с 3-4 текстурами на пиксель.
В GeForce4 реализовано сглаживание Accuview, по сути являющееся улучшенным многосэмпловым сглаживанием, как в отношении качества, так и производительности.
nVidia сместила позиции сэмплов, что должно улучшить качество сглаживания по причине накопления меньшего количества ошибок, особенно при использовании сглаживания Quincunx. nVidia выпустила документацию по этой процедуре, но вряд ли имеет смысл ее читать, поскольку она мало что объясняет.
Новая технология фильтрации включается каждый раз, когда сэмплы совмещаются на финальном сглаженном кадре, причем технология позволяет экономить одну полную запись в кадровый буфер, что в свою очередь значительно сказывается на производительности сглаживания.
Новое сглаживание 4xS
Как мы уже говорили, Accuview предназначена для улучшения скорости и качества сглаживания. GeForce4 работает с фирменным nVidia Quincunx так же быстро, как и с обычным 2x сглаживанием. Кроме всего прочего, nVidia добавила еще один режим сглаживания, названный 4xS. Он призван улучшить режим сглаживания 4x с помощью 50% увеличения числа суб-сэмплов на пиксель. К сожалению, этот режим работает только в Direct3D, оставляя OpenGL в стороне.
Accuview поддерживает анизотропную фильтрацию, что улучшает вид текстур, простирающихся с заднего плана на передний.
Вкратце упомянем, что в GeForce3/GeForce4 контроллер памяти разделяется на четыре независимых контроллера, каждый из которых использует выделенную 32-битную DDR шину. Все запросы к памяти разделяются между этими контроллерами.
В LMA II практически каждый компонент подвергся улучшениям. Обратите внимание на четыре кэша. Но не думайте, что кэширование - исключительная черта GeForce, поскольку в Radeon 8500 также присутствуют аналогичные кэши. Вообще кэшированию в графических чипах уделяется намного меньше внимания, чем кэшам в процессорах, поскольку их размер не столь велик. Причина этого понятна: графические чипы работают сейчас медленнее шин памяти, в то время как центральные процессоры работают в 2-16 раз быстрее, поэтому кэш играет там намного более важную роль.
Перекрестный контроллер памяти (crossbar memory controller)
В GeForce3 уже присутствует этот контроллер, позволяющий осуществлять 64-битную, 128-битную и обычную 256-битную передачу, что значительно улучшает пропускную способность. В LMA II nVidia улучшила алгоритмы балансировки нагрузки для различных разделов памяти и модернизировала схему приоритетов.Визуальная подсистема (visibility subsystem) - отбрасывание перекрытых пикселей
Эта технология уже существовала в GeForce3, но в NV25 она была улучшена для более точной отбраковки пикселей с использованием меньшей пропускной способности памяти. Отбраковка сейчас производится с помощью специального кэша на чипе, что позволяет уменьшить обращение к внешней памяти видеокарты. Как показало исследование Anandtech, GeForce4 на 25% лучше отбраковывает пиксели, чем GeForce3 при равной тактовой частоте.Компрессия Z-буфера без потерь
И опять же, эта возможность существовала в GeForce3, но благодаря новому алгоритму сжатия в LMA II чаще достигается успешная компрессия 4:1.Кэш вершин
Сохраняет вершины после того как они были посланы по AGP. Благодаря кэшу улучшается использование AGP, поскольку он позволяет избежать передачи одинаковых вершин (например, если примитивы имеют общие границы).Кэш примитивов
Накапливает примитивы после их обработки (после вершинного шейдера) в фундаментальные примитивы для передачи на модуль установки треугольников.Двойной кэш текстур
Уже существовал на GeForce3. Новые алгоритмы лучше работают при использовании мультитекстурирования или высококачественной фильтрации. Благодаря этому в GeForce4 Ti значительно улучшена производительность при наложении 3-4 текстур.Пиксельный кэш
Кэш используется в конце конвейера рендеринга для накопления, очень похожего на функцию <комбинирования записи/write combining> в процессорах Intel/AMD. Кэш накапливает некоторое количество пикселей и потом в пакетном режиме записывает их в память.Автоматическая предварительная зарядка (pre-charge)
Перед чтением из банка памяти необходимо сделать его предварительную зарядку, что приводит к задержкам. GeForce4 Ti может упреждающе проводить зарядку, используя специальный алгоритм предсказания.Быстрая Z-очистка (Z-clear)
Эта возможность уже некоторое время известна и используется в других чипах. Первый раз быстрая Z-очистка была задействована в чипе ATi Radeon. Она попросту устанавливает флаг для определенного участка кадрового буфера, так что сейчас вместо заполнения этого участка нулями, можно всего лишь выставить флаг, что позволяет экономить пропускную способность памяти.
Настройка nView чрезвычайно проста
С точки зрения ПО, nVidia виртуально идентичен Hydravision ATi по возможностям, но nVidia смогла улучшить настройку, добавив очень простую установку в 11 шагов. За 11 щелчков мышью любой пользователь сможет настроить что ему надо.
nView позволяет делать окна прозрачными при их переноске с места на место,
хотя с большими окнами эта функция заметно <подтормаживает>
nVidia интегрирует навигацию между рабочими столами в Explorer
Помимо улучшенного процесса установки и настройки, nVidia добавила к nView несколько приятных черт по сравнению с ATi Hydravision. Например, в nView существует возможность, позволяющая вам открывать ссылку в Internet Explorer в новом окне на втором мониторе. Нам очень понравилась эта функция.
Расширения nView появляются практически во всех меню, вызываемых правой клавишей мыши
Конечно, по возможностям nView и Hydravision уступают Matrox, но после использования nView и Hydravision в течение нескольких недель, мы честно можем сказать, что nVidia провела с nView прекрасную работу.
К сожалению, имя GeForce4 здесь все же не совсем уместно, и оно еще внесет свою долю путаницы. Если все карты GeForce3 поддерживают вершинные шейдеры (nfiniteFX), то с линейкой GeForce4 не все так просто. Получается, что GeForce3 - более современные карты, нежели GeForce4 MX. Знайте об этом!
Если GeForce4 Ti есть кульминация современных 3D технологий, то GeForce4 MX - всего лишь улучшение линейки GeForce2 MX. GeForce4 MX не содержит движка nfiniteFX, поэтому она не полностью поддерживает DX 8.x. Чип поддерживает только NSR (nVidia Shading Rasterizer), что, согласитесь, отличается от программируемой природы шейдеров в GeForce3.
С точки зрения разработчиков в отсутствии поддержки шейдеров в GeForce4 MX нет ничего хорошего. 80% рынка видеокарт составляют платы ниже $200, куда и нацелена GeForce4 MX. Поэтому у 80% рынка не будет полной поддержки DX8, что весьма досадно. Разработчики будут не столь заинтересованы в скорейшем задействовании шейдеров в играх.
В любом случае, в GeForce4 MX произошло много изменений по сравнению с GeForce2 MX. Перечислим основные характеристики.
Интересно заметить, что если GeForce3 и GeForce4 Ti оснащены четырехканальным контроллером памяти (4x32 бита), то котроллер в GeForce4 MX - 2x64 бита. Разница в производительности между ними довольно туманна, но обратите внимание на чипсет nForce, использующий двухканальный 64-битный DDR интерфейс. Вспомните, что в nForce в качестве видеоядра используется GeForce2 MX и немного пофантазируйте. Так что наверняка нам следует ожидать появления видеоядра GeForce4 MX в следующем поколении nForce, поскольку контроллер памяти не нужно будет модифицировать.
Еще одно отличие GeForce4 MX от GeForce4 Ti заключается в наличии двух встроенных TMDS передатчиков для двух DVI выходов с разрешением до 1280x1024 на монитор.
Давайте сравним основные характеристики трех карт GeForce4 MX и старшей модели GeForce2 MX400.
GeForce4 MX460 | GeForce4 MX440 | GeForce4 MX420 | GeForce2 MX400 | |
Частота чипа | 300 МГц | 270 МГц | 250 МГц | 200 МГц |
Частота памяти | 550 МГц (DDR) | 400 МГц | 166 МГц | 166 МГц |
Объем памяти | 64 Мб | 64 Мб | 64 Мб | 64 Мб |
Пропускная способность памяти | 8,800 Мб/с | 6,400 Мб/с | 2,656 Мб/с | 2,656 Мб/с |
Теоретическая скорость заполнения | 600 Мпиксель/с | 540 Мпиксель/с | 500 Мпиксель/с | 400 Мпиксель/с |
Цена | $179 | $149 | $99 | $50 |
Карты выполнены по 6-ти слойному дизайну, на GeForce4 MX460 установлена 3,8 нс память Samsung (4Mx32) в micro-BGA упаковке.
Наконец-то в GeForce4 MX встроен видеокодер для видеовыхода. До сих пор качество видеовыхода у карт nVidia было не очень приличным. У GeForce4 MX дела должны обстоять лучше, хотя по нашим тестам мы этого не заметили. Качество видеовыхода у чипа для ноутбуков S3 Savage IX куда лучше.
Из-за временных ограничений в тестировании Anandtech не приняли участие GeForce4 Ti 4200, Kyro II и Radeon 7500.
Хотя ни одна из сегодняшних архитектур не может быть определена как архитектура отложенного рендеринга (deferred rendering), в них все же используется несколько усовершенствованных технологий, взятых из мира отложенного рендеринга. По этому тесту мы сможем посмотреть, насколько большие улучшения произошли в LMA II по сравнению с первоначальной архитектурой памяти Lightspeed.
Первое, что следует отметить - падение производительности Radeon 8500 с последними драйверами от ATi. С прошлой версией Radeon 8500 показывал здесь 113 fps, сейчас же - всего 92 fps. Впрочем, последняя версия драйверов исправляет некоторые досадные ошибки в играх, поэтому мы все же будем использовать именно ее.
Если сравнить GeForce4 и GeForce3 Ti 500 на равных частотах (240/500), то мы заметим существенное улучшение в технологии отбраковки перекрытых пикселей. Хотя улучшение и не 50% (как рекламирует nVidia), 25% - все же приятный прогресс. Увеличенная тактовая частота GeForce4 только добавляет производительности.
Итак, новая архитектура LMA II - это не просто рыночная уловка.
Score | Game1 - Car Chase - LD | Game1 - Car Chase - HD | Game2 - Dragothic - LD | Game2 - Dragothic - HD | Game3 - Lobby - LD | Game3 - Lobby - HD | Game4 - Nature | FillRate (Single Textured) | |
NVIDIAGeForce4 Ti 4600 | 9814 | 146 | 51,2 | 182,6 | 105,4 | 132,6 | 60,2 | 43,4 | 1038,8 |
NVIDIAGeForce4 Ti 4400 | 9369 | 144,4 | 51,2 | 167,5 | 98,1 | 130,9 | 59,8 | 38,1 | 912,4 |
NVIDIAGeForce4 240/500 | 8733 | 137,9 | 50,3 | 153,1 | 85,3 | 127,8 | 59,4 | 32,2 | 802,2 |
ATIRadeon 8500 | 8526 | 132,6 | 47,9 | 133,2 | 79,5 | 128,3 | 57,7 | 44,2 | 819 |
NVIDIAGeForce3 Ti 500 | 8095 | 126,5 | 50,5 | 120,3 | 67,2 | 126,1 | 59,5 | 41,1 | 739,7 |
ATIRadeon 8500LE | 8088 | 126,9 | 49,6 | 121,4 | 71,9 | 123,8 | 57 | 39,9 | 743,2 |
NVIDIAGeForce3 | 7139 | 113 | 48,8 | 109 | 57,7 | 117,6 | 56,8 | 23,8 | 640 |
NVIDIAGeForce3 Ti 200 | 6565 | 101,8 | 47,2 | 100,1 | 50,4 | 109,6 | 54,1 | 20,8 | 558,4 |
NVIDIAGeForce4 MX 460 | 6091 | 112,5 | 45,4 | 99,2 | 50,3 | 103 | 51,5 | N/A | 546,2 |
NVIDIAGeForce4 MX 440 | 5480 | 95,5 | 43,7 | 87,2 | 45,1 | 91,5 | 48,1 | N/A | 397,3 |
NVIDIAGeForce2 Ti 200 | 4941 | 85 | 38,1 | 82,4 | 38,5 | 85,5 | 44 | N/A | 326 |
FillRate (Multi Textured) | HighPoly Count (1 light) | HighPoly Count (8 lights) | EMBM | DOT3 | Вершинный шейдер | Пиксельный шейдер | Точечные спрайты | |
NVIDIAGeForce4 Ti 4600 | 2299 | 50 | 12,6 | 174,2 | 151,2 | 101,9 | 122 | 30,3 |
NVIDIAGeForce4 Ti 4400 | 2077,7 | 46,5 | 11,5 | 160,7 | 132,2 | 92,3 | 110,5 | 26 |
NVIDIAGeForce4 240/500 | 1817,2 | 38,4 | 8,1 | 146,1 | 117,4 | 80,9 | 97,6 | 19,8 |
ATIRadeon 8500 | 1807 | 36 | 9,7 | 112,6 | 87,6 | 87,4 | 101,5 | 28,1 |
NVIDIAGeForce3 Ti 500 | 1556,6 | 26,1 | 5,6 | 122,2 | 119,8 | 55,3 | 90,6 | 17,6 |
ATIRadeon 8500LE | 1644,3 | 35,6 | 8,8 | 103,5 | 79,2 | 79,2 | 91,6 | 25,4 |
NVIDIAGeForce3 | 1326,5 | 23,7 | 5,1 | 109,9 | 105,2 | 42,3 | 77 | 14,8 |
NVIDIAGeForce3 Ti 200 | 1156,4 | 21,5 | 4,5 | 99,8 | 91,7 | 36,9 | 67,6 | 12,9 |
NVIDIAGeForce4 MX 460 | 601,4 | 31,2 | 7,3 | N/A | 77,8 | 48,2 | N/A | 10,3 |
NVIDIAGeForce4 MX 440 | 550,5 | 27,8 | 6,6 | N/A | 58,7 | 44,1 | N/A | 7,4 |
NVIDIAGeForce2 Ti 200 | 623,7 | 26,9 | 6 | N/A | 50,8 | 54,7 | N/A | 8,6 |
Мы уже видели, что GeForce4 показывает сильный отрыв от предшественника даже на равных с GeForce3 Ti 500 частотах (240/500). Это служит еще одним доказательством существенных архитектурных улучшений, достаточных для изменения имени карты на GeForce4. Если посмотреть на результат производительности вершинных шейдеров, то при равных частотах GeForce4 Ti (240/500) на 46% обходит GeForce3 Ti 500 благодаря наличию двух модулей шейдеров. Что интересно, модуль вершинных шейдеров прекрасно работает, и только GeForce4 Ti4400 смогла его обойти.
Также заметно возросло и количество обрабатываемых в единицу времени полигонов, что должно положительно казаться на играх следующего поколения типа Unreal Tournament II и Unreal II.
GeForce4 MX не смогла пройти все тесты в силу отсутствия DX8 совместимости.
Начнем с довольно примитивной (по сегодняшним стандартам) игры. В наиболее типичном разрешении мы не видим прироста производительности от новой GeForce4s. К счастью для nVidia, запуск Quake III Arena на 1024x768 не является целью NV25, что будет заметно далее. Производительность всех карт очень и очень достойная, самая <медленная> показывает около 130 fps.
Карты GeForce4 MX показывают себя здесь довольно хорошо, они превосходят не только GeForce2, но и GeForce3 Ti 200 в некоторых случаях. Мы также видим, что Radeon 8500 LE работает почти на уровне GeForce4 MX460, к тому же она обладает полной поддержкой DX8 вершинных и пиксельных шейдеров при равной цене.
Ситуация немного меняется при переходе на разрешение 1280x1024, сейчас GeForce4 Ti4400 почти на 11% быстрее GeForce3 Ti500. Ti4600 уже на 18% быстрее Ti500.
Ну и напоследок мы провели классический тест 1600x1200. Когда только появилась GeForce2 Ultra, мы радовались ее возможности запускать Quake III на 60 fps при 1600x1200. Сегодня же карты обеспечивают уже более 160 fps.
В этом тесте уже явно видно отличие GeForce4 Ti от GeForce3 Ti 500. Но самое приятное нас ждет дальше.
В качестве прелюдии к игровому тесту мы посмотрели на результаты встроенного синтетического теста, который измеряет скорость заполнения. Мы видим, что GeForce4 Ti4600 обладает на 36% большей скоростью заполнения, чем GeForce3 Ti500, что явно скажется на реальной производительности, особенно в ситуациях, ограниченных пропускной способностью памяти.
С последними драйверами для Radeon 8500 явно какие-то проблемы. Мы знаем, что эти карты способны на большее, нежели чем они демонстрируют в Serious Sam.
Что интересно, Ti4600 не только обеспечивает на 36% большую скорость заполнения по сравнению с GeForce3 Ti500, но также прокачивает на 39% большее количество полигонов. Таким образом, в независимости от ситуации, ограничена она пропускной способность памяти/скоростью заполнения или геометрией, Ti4600 всегда будет показывать ощутимо лучший результат по сравнению с Ti500.
Обратите внимание на Radeon 8500. Последние бета-драйверы от ATi, хотя и исправляют некоторое число проблем (скажем, в UPT2002), в то же время отличаются значительно пониженной производительностью под Serious Sam. Как вы видите по результатам, Radeon 8500 упал с того места, где мы привыкли его видеть (между GeForce3 Ti200 и GeForce3) вниз до уровня GeForce2 Ti200. У ATi еще есть месяц до выхода сертифицированной WHQL версии драйверов (v7.66), так что будем надеяться, что в ней все будет работать как надо.
Перейдем к GeForce4. Теперь мы видим эту карту во всей красе. Ti4600 показывает на 39% лучший результат, чем GeForce3 Ti500, в то время как Ti4400 на 26% быстрее Ti500.
Производительность GeForce4 MX не больно впечатляет, она смогла обогнать только GeForce3 Ti200. По всей видимости, причина кроется в двухпиксельном ограничении конвейера MX.
При переходе к 1280x1024 Ti4600 на 50% быстрее GeForce3 Ti500. Обычно при последовательных выпусках видеочипов мы наблюдаем небольшие улучшения, но вот вам доказательства всей силы, вложенной nVidia в GeForce4.
GeForce4 MX460 оказывается ниже уровня GeForce3 Ti200, а еще ниже - Radeon 8500. С улучшенными драйверами Radeon 8500 может потенциально выйти на уровень GeForce3, однако, не будем предсказывать.
GeForce4 Ti4200 должна показывать производительность где-то между GeForce3 Ti500 и GeForce4 Ti4400, однако у нас не было времени протестировать карту на частотах 225/500.
Ну и закончим мы 1600x1200, где Ti4600 так и не достигла 60 fps, впрочем, старый флагман GeForce3 Ti500 не дотягивает и до 40 fps. Остальные карты явно не предназначены для высоких разрешений, поскольку для этого нужна высокая скорость заполнения и пропускная способность памяти. GeForce4 Ti4400 и GeForce4 Ti4600 работают в 1600x1200 довольно приятно, хотя мы все же рекомендуем выбирать меньшее разрешение.
Как и в случае с Quake III Arena, в 1024x768 мы не наблюдаем значительной разницы между картами. GeForce4 сильно не отрывается от GeForce3, а GeForce4 MX показывает вполне приемлемые результаты, обгоняя GeForce3 Ti200.
Увеличение разрешения приводит к более заметному разграничению карт. Две GeForce4 Ti карты отрываются от GeForce3 Ti500 на хорошие 24-29%.
Чистая пропускная способность памяти GeForce4 MX460 позволяет ей обеспечивать производительность почти на уровне Radeon8500 и даже немного обгонять GeForce3 Ti200. В отличие от Serious Sam, двухпиксельное ограничение конвейера архитектуры MX не приводит к сильному отставанию в RtCW. Не следует забывать, что игра основана на движке Quake III, который был выпущен, когда карты оснащались не более чем двумя конвейерами рендеринга. Serious Sam построен на более свежем движке.
В 1600x1200 мы наблюдаем практически аналогичную раскладку производительности. MX460 продолжает показывать достойные результаты.
После публикации нашей статьи мы спросили основателя Epic Games и ведущего программиста Тима Свини о его понимании результатов Unreal Performance Test 2002:
"Этот тест помог сфокусироваться nVidia и ATi на производительности игр следующего поколения и отойти от упора на игры 1999 года типа Unreal Tournament и Quake III при оценке новых 3D карт. Близкое сотрудничество между нашей командой и производителями чипов привело к существенному улучшению производительности, которое не произошло бы без этого теста".
Сегодняшний обзор дает хорошую возможность продолжить наше использование Unreal Performance Test 2002. Даниель Вогель/Daniel Vogel, еще один талантливый программист из Epic, накладывает сейчас последние штрихи на новый билд теста, который будет содержать как сцены внутри помещений, так и снаружи. К сожалению, мы не можем опубликовать скриншоты по просьбе Epic, впрочем, некоторое их количество доступно на сайте Epic, так что вы сами можете посмотреть.
В первой статье мы подчеркнули новые тип нагрузки на систему, который не могли осуществить предыдущие тесты.
Первое, что следует здесь отметить - ошибка с мигающим туманом с Radeon 8500, на которую мы пожаловались в первой статье была успешно исправлена с последними бета драйверами (v7.66) от ATi. В то же время, производительность с последним драйвером существенно снизилась, в результате чего GeForce3 Ti500 обогнала Radeon 8500. Связано это с мигающим туманом или нет - мы пока не уверены.
Здесь мы также протестировали GeForce4, работающую на аналогичных GeForce3 Ti500 частотах - 240/500. Благодаря этому вы можете посмотреть на прирост производительности GeForce4, связанный с архитектурными улучшениями, который равен 15%.
Добавив к этим 15% увеличенную тактовую частоту чипа и памяти, мы получаем 31% прирост производительности Ti500 над GeForce4 Ti4600. В следующем поколении стрелялок от первого лица GeForce4 будет работать на 90 fps даже без всякой оптимизации под игру.
GeForce4 MX разочаровывает, поскольку карта опустилась ниже GeForce2 Ti200. По этой причине мы настоятельно рекомендуем альтернативно купить GeForce3 Ti200, Radeon 8500LE или подождать GeForce4 Ti4200. И это только лишь на 1024x768.
Раскладка существенно не меняется на 1280x1024, но для преодоления 60 fps барьера вам понадобится карта не хуже GeForce4 Ti4400. Следует, конечно, учитывать максимально нагруженный характер этого теста, зато он наглядно демонстрирует всю мощь GeForce4. 4600 показывает прекрасную производительность, в то время как GeForce4 MX ничего общего с GeForce4 кроме имени не имеют.
Когда мы впервые посмотрели на производительность UPT2002, то нормальные результаты в 1600x1200 были недостижимы, однако GeForce4 все меняет. Конечно, 4600 так и не смогла достичь 60 fps, но она крайне близка, и такой рекорд наверняка станет возможным при дальнейшей оптимизации кода и драйверов.
Что нас больше всего впечатлило, GeForce4 Ti4600 смогла достичь на текущем билде движка Unreal 856 80 fps на сглаживании 2X в 1024x768. GeForce4 определенно продолжает показывать свою направленность на будущие игры. В то же время GeForce4 MX явно отдыхает.
Поскольку сглаживание Quincunx реализовано только на картах nVidia, результаты вполне предсказуемы.
Из-за модернизированного многосэмплового алгоритма сглаживания nVidia падение производительности при переходе к 4X сглаживанию минимально, что приводит к относительно приличной частоте кадров. В действительности же 4X сглаживание вряд ли будет быстро работать на будущих играх, так что лучше будет выбрать 2X сглаживание или увеличить разрешение.
Новый режим сглаживания 4XS доступен только для карт nVidia, он характеризуется улучшением визуального качества в ущерб производительности. Однако он работает только под Direct3D
Если GeForce4 значительно теряет в производительности, то про Radeon 8500 такого уже не скажешь. Отрыв от самой быстрой GeForce4 составляет 20% по причине более эффективного алгоритма анизотропной фильтрации в Radeon.
Как мы убедились в тестировании, для того, чтобы визуальное качество мультисэмплового сглаживания nVidia было аналогично суперсэмпловому сглаживанию ATi, карты nVidia должны работать с включенной 16-tap анизотропной фильтрацией. Включение анизотропной фильтрации на Radeon 8500 не так сильно снижает производительность, но параллельное включение суперсэмплового сглаживания значительно подтормаживает карту.
GeForce4 не сильно теряет при включении 2X сглаживания по причине более эффективного алгоритма.
Все то же самое можно сказать про 16-tap анизотропную фильтрацию и 4X сглаживание. Разрыв между GeForce4 Ti4600 и GeForce3 Ti500 увеличился по причине большей зависимости от пропускной способности памяти.
Аппаратное обеспечение Socket 478 |
|
Процессор | Intel Pentium 4 2200 МГц 400 МГц QDR FSB |
Материнская плата | ASUS P4T-E Intel i850 |
Память | 256 Мб 400 МГц RDRAM (2x128 Мб) |
Жесткий диск | Seagate 12 Гб ST313021A UDMA66 5400 об/мин |
Драйверы и ПО | |
NVIDIA Cards | v27.30 |
ATI | Альтернативный драйвер - 6.13.10.6025 |
DirectX | 8.1 |
ОС | Windows 98 SE |
Тесты и настройки | |
Quake3 | v1.17 OpenGL with HW Transformation Support (Demo001) |
Aquanox | DirectX 8 игра |
3DMark 2001 | Синтетический DirectX 8 тест |
В этом тесте GeForce4 Ti4600 с 2XFSAA находится примерно на уровне GeForce3 Ti200 без FSAA.
В 1024x768 Ti4600 с 2x FSAA оказался быстрее GeForce3 Ti500 без FSAA! Даже на 1280x1024 Ti4600 с 2X сглаживанием показывает сходные с GeForce3 Ti500 результаты. И наоборот, падение производительности GeForce4 MX460 с 2X FSAA намного более заметно.
DirectX 8 3D движок Aquanox использует пиксельные и вершинные шейдеры. Как ни странно, MX460 смог остаться на уровне GeForce3 Ti200 благодаря высоким тактовым частотам чипа и памяти. GeForce3 Ti500 смогла немного обогнать Radeon 8500. В любом случае, GeForce4 Ti явно демонстрирует силу двух модулей вершинных шейдеров в Aquanox. 4600 работает в два раза быстрее R8500 и Ti500.
В Quake 3 результаты MX460 находятся между GeForce3 Ti500 и Ti200. В то же время MX440 явно превосходит GeForce2 Ti. GeForce4 Ti4200 лишь на немного превосходит Radeon 8500 и GeForce3 Ti500. Старшие модели сильнее ушли в отрыв. Конечно, вряд ли вам нужны 132,6 fps при 1600x1200. Но что более впечатляет - 70,2 fps со сглаживанием 2x, что находится почти на уровне GeForce3 Ti200.
3D Mark показывает несколько странные результаты. В этом синтетическом тесте Radeon 8500 играет своими мускулами и обходит GeForce3 Ti500. Однако GeForce4 обгоняет всех. Даже младшая модель 4200 находится вне достижения Radeon 8500. MX460 показывает чуть меньшую производительность, чем GeForce3 Ti200. GeForce4 MX440 явно побеждает GeForce2 Ti.
В полноэкранном сглаживании Ti4600 показывает впечатляющие результаты. С включенным 2X FSAA и Quincunx он находится почти на одном уровне с Radeon 8500 и GeForce3 Ti500 без FSAA. В Quincunx FSAA MX460 побеждает даже Ti500 и Radeon 8500! В 4x сглаживании Radeon 8500 также уступает 460.
С 2x и Quincunx GeForce4 Ti4600 почти достигает нормального уровня GeForce3. Radeon 8500 явно отстает в 4x сглаживании. MX460 отчетливо показывает свою природу бюджетной карты, находясь позади Ti500 на заметном расстоянии.
Radeon 8500 смог обойти GeForce3 и 4. Однако здесь ATi хитрит, послушаем комментарии Давида Наласко/David Nalasco из ATi:
"Radeon 8500 использует полное число сэмплов только в тех частях изображения, где оно действительно необходимо, что позволяет экономить пропускную способность, не снижая качество анизотропной фильтрации. Это является еще одним примером "умной архитектуры", которая экономит пропускную способность при малейшей возможности".
Итак, драйвер динамически решает, какие текстуры должны подвергнуться анизотропной фильтрации. Например, если вы стоите перед стеной, то вряд ли анизотропной фильтрации ее текстуры будет какой-нибудь толк. На скриншотах вы вряд ли заметите какую-нибудь разницу. Все же относитесь к полученным результатом с долей скепсиса. Нас разочаровала столь небольшая разница в производительности между GeForce4 Ti4600 и GeForce3 Ti500.
Версия драйверов ATi Radeon 7500 и 8500 - 6.13.10.6025
Версия драйверов Detonator - 27.30
ОС - Windows XP Professional
В этом тестировании дополнительно сравнивались карты Radeon 7500 и GeForce2 MX.
Как ни удивительно, но ATi HyperZ II оказывается крайне эффективным. Единственное что не хватает Radeon, так это эффективной работы с памятью и высоких частот ядра и памяти. HyperZ II позволяет отбрасывать пиксели, скрытые за другими объектами. В сценах типа Nature присутствует большое количество взаимных перекрытий, поэтому там Radeon 8500 показал достойные результаты. GeForce4 дышит Radeon в затылок благодаря улучшенной технологии отбраковки пикселей и более эффективному контроллеру памяти.
По этому тесту можно отметить эффективность всех трех чипов: GeForce3, 4 и Radeon. GeForce4 обходит Radeon на 21%, остальные карты просто отдыхают. Очевидно, что сейчас nVidia беспокоится не только о тактовой частоте, но и об эффективности заключенных в чипе технологий. GeForce4 способна за такт сделать больше, нежели ее предшественники.
В низком разрешении отрисовывается слишком мало пикселей для того, чтобы нагрузить пропускную способность памяти на GeForce 3 и 4, равно как и на ATi Radeon 8500. Перекрестная архитектура памяти приносит свои плоды, повышая производительность как GeForce3, так и GeForce4.
Различия в производительности начинают более отчетливо проясняться по мере увеличения разрешения. На максимальном разрешении GeForce4 Ti4600 уходит в заметный отрыв от GeForce3 главным образом по причине более быстрой DDR SDRAM.
Результаты Wolfenstein не столь впечатляющи, как в Quake 3, в силу использования обновленной версии движка и большей нагрузки на процессор. GeForce3, 4 и Radeon 8500 показывают близкие результаты.
С выходом сглаживания Accuview можно смело хоронить все остальные виды. Accuview позволяет почти бесплатно реализовывать качество 4X сглаживания. В некоторых разрешениях типа 1280x1024 (кстати, похоже, идеальный вариант для GeForce4 Accuview) производительность GeForce4 Ti4600 почти в два раза превышает GeForce3 Ti500. С такой скоростью nVidia может себе позволить поиграть с анизотропной фильтрацией, которая значительно улучшает визуальное качество.
И снова мы наблюдаем похожую картину. Идеальными разрешениями можно назвать 1024x768 и 1280x1024.
Как видим, игра в высоком разрешении с включенным полноэкранным сглаживанием стала реальностью.
И снова мы можем удостовериться в эффективности аппаратного сглаживания Accuview. Улучшается как качество, так и скорость. Во многих случаях GeForce4 Ti4600 не только в два раза обгоняет GeForce3 Ti500 по производительности, но и показывает почти двойную производительность GeForce4 MX.
Тенденция продолжается и при использовании 4X сглаживания. По этой причине картинка на Xbox выглядит намного приятнее, чем на PlayStation2. Видеочип Xbox использует ту же технологию сглаживания, что и в GeForce4. Он позволяет никогда не отключать полноэкранное сглаживание.
Теперь то вы верите, что в GeForce4 MX от GeForce4 только лишь одно название?
Типичная ситуация. При низких разрешениях и низкой скорости заполнения результаты зависят от процессора, видеосистема нагружена слабо. Однако в 1600x1200 карты нагружаются <под завязку>, и даже GeForce4 MX не может отличить один процессор от другого.
Демо лучше всего работает на 128 Мб картах, поскольку 64 Мб карты слишком сильно зависят от AGP. Мы поинтересовались у разработчиков, что они думают по поводу GeForce4.
В: Что вы думаете о вершинных шейдерах вообще и о двойном модуле вершинных шейдеров на GeForce4?
Курт Пельцер/Kurt Pelzer, программист. В принципе, все средства хороши для увеличения производительности. В частности, программируемые вершинные шейдеры предназначены для будущих приложений, и программистам не требуется вносить никаких модификаций в код для задействования второго модуля вершинных шейдеров.В: Что вы думаете по поводу отказа nVidia от реализации пиксельных шейдеров (ATi) 1.4?
Стефан Хегет/Stefan Herget, главный менеджер. Благодаря нашей модульной и гибкой архитектуре, движок Codecreatures хорошо расширяем, и он поддерживает шейдеры 1.4. Разработчик игры может добавлять различные спецэффекты с помощью пиксельных шейдеров, но ему приходится выбирать, какую версия шейдеров поддерживать. Библиотека готовых шейдерных эффектов, поставляемая нами, будет первоначально оптимизирована под наиболее широко распространенные карты, поэтому она будет использовать версию 1.1 или 1.3, хотя движок поддерживает 1.4. В дальнейшем мы расширим библиотеку эффектов сразу для поддержки версии 2.0.Ниже представлено несколько дополнительных скриншотов из демо nVidia.
ATi, со SmoothVision, и nVidia, с Accuview, используют разные подходы к полноэкранному сглаживанию, поэтому трудно сделать точное сравнение между ними. К примеру, ATi позволяет выбрать между Производительностью и Качеством для каждого уровня FSAA, что соответствующим образом влияет на производительность. Кроме того, как утверждает ATi, они производят большую фильтрацию, нежели nVidia, что и объясняет различия в производительности в тестах FSAA. Но если вы посмотрите на приведенные ниже результаты, то Accuview вам покажется все же лучше, учитывая к тому же большую производительность.
На следующих иллюстрациях произведено сравнение FSAA GeForce4 Ti, GeForce3 и Radeon 8500. Каждая картинка увеличена на 200%.
Изображения, полученные на трех картах, абсолютно идентичны. На краях объектов явно видны <лесенки>.
Обе карты от nVidia показывают почти одинаковый результат. На R8500 явно видно, что сглаживание в режиме Производительности не слишком хорошо реализовано.
Специальное сглаживание nVidia Quincunx эффективнее 2x, однако картинка кажется менее четкой. Вряд ли можно заметить какое-либо отличие между GeForce3 и GeForce4.
В режиме 4x текстура пола немного четче на картах nVidia, чем на R8500.
И последний режим сглаживания в таком виде не существует. Анизотропная фильтрация улучшает качество текстур, расположенных под развернутым углом к зрителю (например, текстура пола). Однако такая фильтрация значительно нагружает процессор.
Отличие по сравнению с верхним примером сразу бросается в глаза. Но опять же, вряд ли вы сможете отличить картинки отдельных карт друг от друга.
nVidia полностью решила эту проблему в GeForce4.
Различие между GeForce3 (слева) и GeForce4 (справа) сразу же чувствуется.
Если вы посмотрите на три предлагаемых варианта GeForce4 MX, то сразу можно заметить, что самая медленная карта, GeForce4 MX420, предназначена только для OEM. Ее 166 МГц SDRAM настолько сильно снижает производительность чипа GeForce4 MX, что она вряд ли окажется быстрее GeForce2 MX400, которую сейчас можно купить за $50.
Производительность же GeForce4 MX440 и 460 напротив, впечатляет. Отрадно то, что GeForce4 MX460 смогла показать результаты на уровне GeForce3 Ti200 или даже Ti500. Обе они легко побеждают ATi Radeon 7500 практически везде.
Однако ни одна из GeForce4 MX карт не оснащена полной поддержкой DirectX 8.x по причине отсутствия вершинных и пиксельных шейдеров. А теперь взвесьте сей факт и обратите внимание на разницу в цене между MX460 и нижней моделью GeForce4 Ti - она составляет всего $20.
Не менее интересно выбрать альтернативу MX460 - карту на базе Radeon 8500LE, поскольку она продается по равной с MX460 цене, и при этом полностью поддерживает шейдеры.
Мы рекомендуем GeForce4 MX440 экономным покупателям, но цена все же должна опуститься существенно ниже $149. А пока что лучше присмотреться к линейке GeForce3. Сейчас можно смело хватать любую GeForce3 карту по цене ниже $190, поскольку она полностью поддерживает DirectX 8.x, вершинные/пиксельные шейдеры и обладает хорошей 3D мощью. Если бы нам приходилось выбирать между картой на GeForce3 и GeForce4 MX, мы бы без сомнения выбрали GeForce3!
Давайте перейдем к линейке GeForce4 Ti. Эти карты показывают всю силу современной 3D графики. Два модуля вершинных шейдеров и крайне эффективная подсистема памяти говорят сами за себя. Каждая карта получила свое достойное место в тестах, и каждая карта смогла побить предшественника GeForce3. Впечатляет. В большинстве случаев превосходство GeForce4 Ti4600 над GeForce3 Ti500 составляет 50%.
GeForce4 легко можно считать победителем в Unreal Performance Test 2002, по крайней мере, на несколько месяцев.
На самом деле, вряд ли имеет такое существенное значение, какую карту на GeForce4 Ti вы выберите. Любой выбор беспроигрышен. Если вы сможете купить GeForce4 Ti4200 за $199, то радуйтесь удачной покупке, поскольку даже она быстрее прошлого лидера GeForce3 Ti500. Как мы надеемся, умные продавцы уже давно распродали GeForce3 Ti500, поскольку сейчас красная цена этой карте - $149-179. Ощутимое падение, учитывая вчерашнюю цену $299. Кто заплатит $299, если за $100 меньше можно взять более быстрый продукт?
GeForce4 Ti4400 - тоже достойная карта. Она обгоняет GeForce3 Ti500 и своего собрата GeForce4 Ti4200, в то же время достаточно многие могут позволить себе потратить $299 за нее. GeForce4 Ti4600 предназначена для тех людей, которые вообще не думают о деньгах и просто хотят купить самое лучшее. За $399 вы получите самую быструю 3D карту на сегодня.
Некоторые критикуют GeForce4 Ti за отсутствие действительно новых технологий. Но обратите внимание на тот прирост производительности, который мы видим. Разве это не достаточная причина выпуска нового продукта? GeForce4 Ti настолько мощна, что она может легко работать с включенным сглаживанием практически в каждой игре. Чистые "новые возможности" вряд ли кому нужны. Нас же интересует их реализация в играх и увеличение производительности. Итак, GeForce4 Ti - явный победитель.
Однако нам не очень нравится идея использования того же имени для лучшего на сегодня 3D чипа, что и ранних, технологически отброшенных продуктов. Имя GeForce4 потеряло свое значение. С одной стороны, это лучшее 3D решение на сегодня, с другой стороны карта базируется на технологиях времен GeForce3.
Нас не может не радовать направление nVidia комплектовать все свои карты поддержкой двух дисплеев. Два дисплея вместо одного значительно улучшают работу. Однако не сама nVidia изобрела эту идею, поэтому отдадим должное Matrox. Прискорбно, что GeForce4 MX оснащена столь плохим интегрированным видеокодеком. Будем надеяться, что когда-нибудь nVidia сможет довести качество видеовыхода до уровня S3 или ATi.
Что касается появления карт в фирмах, то это произойдет в начале марта (не считая Ti4200).