Рейтинг@Mail.ru

NVIDIA GeForce4 Ti и GeForce4 MX: особенности архитектуры и их влияние на производительность, сравнение с главными конкурентами и разгон

11 марта 2002 в 00:00 | Всего прочтений: 26030
... ...

Подготовлено по материалам сайтов Anandtech, HotHardware, Xbit Labs и Digit-life

Введение

После выхода графической карты ATI RADEON 8500 для NVIDIA наступили не самые лучшие времена. Один из лучших ее продуктов - GeForce3 Ti500 уступил лидирующие позиции. Недавно компания представила свою новую линейку продуктов GeForce4, оснащенную новыми технологическими решениями, высокой частотой и новыми драйверами, предлагающую ощутить ранее невиданные уровни реалистичности отображаемых сцен. Пока компания представила два чипа, нацеленные на массовый и производительный рынок - GeForce4 Ti и GeForce4 MX. 

Спецификация NVIDIA GeForce4 Ti 4600


Графический движок - NVIDIA® GeForce4 Ti GPU @ 300MHz
 
Видео память - 128MB DDR @ 650MHz DDR
 
Стандарт шины - AGP 4X / 2X / 1X
 
Разъем - Двойной VGA или DVI (с конвертером)
 
TV-out разъем (опциально) - S-VHS mini-DIN

NVIDIA Personal Cinema Ready (опция)

nView - Технология, обеспечивающая работу в много дисплейных конфигурациях 

Accuview AA - Новая технология сглаживания, обеспечивающая новый уровень качества сглаживания сцен с большой скоростью в больших разрешениях

Lightspeed Memory Architecture TM (LMA) II - 128- bit DDR интерфейс, увеличивающий эффективность памяти, "Quad Cache" – четыре независимых модуля кэш памяти (Pixel, Texture, Primitive и Vertex), Сжатие Z-буфера без потерь с коэффициентом 4:1, Подсистема видимости второго поколения

nfiniteFX II движок - Обеспечивает сложную геометрию и анимацию с двойным вершинным шейдером и быстрым пиксельным шейдером

Производительность - 4.8Gsamples/sec

Спецификация NVIDIA GeForce4 MX 460

Графический движок - NVIDIA® GeForce4 MX GPU @ 300MHz
 
Видео память - 64MB DDR @ 550MHz DDR
 
Стандарт шины - AGP 4X / 2X / 1X
 
Разъем - один VGA и один DVI
 
TV-out разъем (опциально) - One S-VHS mini-DIN

NVIDIA Personal Cinema Ready (опция)

nView - Технология, обеспечивающая работу в много дисплейных конфигурациях 

Accuview AA - Новая технология сглаживания, обеспечивающая новый уровень качества сглаживания сцен с большой скоростью в больших разрешениях

Lightspeed Memory Architecture TM (LMA) II - 128- bit DDR интерфейс, увеличивающий эффективность памяти, "Quad Cache" – четыре независимых модуля кэш памяти (Pixel, Texture, Primitive и Vertex), Сжатие Z-буфера без потерь с коэффициентом 4:1, Подсистема видимости второго поколения

Интегрированный TV кодер с разрешением 1024x768

Интегрированный аппаратный MPEG- 2 декодер

Компенсация движения и IDCT - Позволяет декодировать DVD с минимальным использованием CPU

Поддержка HDTV

Сравнение спецификаций современных графических карт

Архитектурные особенности GeForce4 Ti 4600

Ядро GeForce4 Ti 4600, использует кодовое имя NV25. Как и NV20, это ядро выполнено по 0.15мкм технологии.

При рассмотрении карты ядра сразу обращаешь внимание на присутствие двух модулей вершинных шейдеров, вместо одного, используемого в NV20. Присутствие двух модулей значительно увеличивает скорость и качество рендеринга, что позволит разработчикам формировать более детализированные, и соответственно более реальные сцены в большом разрешении. Модуль пиксельного шейдера остался неизменным. Ядро имеет четыре пиксельных конвейера и способно обработать две текстуры на пиксель. Эти три модуля объединены в новый движок nfiniteFX II.

Движок nfiniteFX II реализован только в GeForce4 Titanium. Это второе поколение движка пиксельного и вершинного шейдера, совместимого с DirectX 8.1. Два вершинных шейдера способны обработать до 136 миллионов вершин в секунду. Это позволит разработчикам, реализовать более детализированные и сложные сцены. Для подтверждения этих слов, позвольте продемонстрировать три скриншота, демонстрирующих возможности GeForce4. 

NV Wolfman

Tiger Woods 2002

Morrowind

Как Вы видите, все три кадра показывают великолепное качество и детализацию отображаемых сцен, однако мы хотим особенно обратить Ваше внимание на первый кадр - "Mojo Wolf". Здесь Вы можете видеть, как подготовлены некоторые сложные элементы сцены.

Lightspeed Memory Architecture II

Новая особенность ядра NV25 – Lightspeed Memory Architecture II. В NV25 используется перекрестная архитектура памяти NVIDIA, основанная на четырех независимых контроллерах памяти, каждый с собственной 32-bit DDR шиной, что позволяет разделить и сбалансировать запросы к памяти.

Quad Cache. Эта особенность подразумевает наличие четырех выделенных модулей кэш памяти для примитивов, вершин, текстур и пикселей. Такое разделение так же позволяет ускорить доступ к данным.

Модуль компрессии Z-буфера без потерь. Данные z-буфера (данные, которые указывают на то, как «глубоко» расположен объект от поверхности экрана) фактически очень легко сжимаются. Используя алгоритм сжатия без потерь, мы получаем полную идентичность декомпрессированных и оригинальных данных, что можно сравнить с ZIP компрессией. NVIDIA способна достичь коэффициента сжатия 4:1. Учитывая факт что z-буфер очень активно пишет и читает данные, всякий раз, когда отображается новый пиксель, это позволит значительно разгрузить шину.

Z-clear.Эта особенность, используется в чипах GeForce3 и Radeon, и позволяет с очень большой скоростью обнулить все данные z-буфера.

Подсистема видимости второго поколения. GeForce3 имеет особенность, известную как Z-occlusion culling, которая позволяет GPU просматривать значения z-буфера, для определения видимости каждого пикселя. Если текущий пиксель «накрыт» другим пикселем, то он не будет отображаться, что приведет к разгрузке шины памяти. Это позволяет решить проблему известную как «overdraw» и значительно увеличить производительность.

И последняя особенность LMA II известная как «auto pre-charge». Помните, что в отличие от КЭШа, DRAM память основана на емкостях и соответственно требует постоянного обновления. Преимущество этого типа памяти заключается в том, что для ее изготовления используется значительно меньшее число дорогостоящих компонентов, чем при производстве кэш памяти, недостаток же заключается в наличии больших задержек при доступе к информации. Одной из причин возникновения задержек является необходимость подзарядки емкостей при попытке считать информацию из новых блоков памяти. Технология «auto pre-charge» использует специальную логику в контроллере памяти, позволяющую предсказать, к какой строке и к какому столбцу DRAM массива будет обращение в следующий момент, что позволит зарядить их прежде, чем они будут затребованы, сокращая, таким образом, время ожидания. Если предсказание прошло неудачно, то процесс пойдет по обычной схеме. «Auto pre-charge» в дополнение к Quad Cache очень помогает освободить GPU от траты драгоценных циклов в idle состоянии.

В целом, алгоритмы, используемые в GeForce4 позволяют увеличить производительность по сравнению с GeForce3, работающим на той же частоте (гипотетически) примерно на 25%.

Архитектурные Особенности GeForce4 MX 460

В отличие от ядра GeForce4 Ti 4600, GeForce4 MX не имеет пиксельного шейдера совместимого с DirectX 8 и ограниченно поддерживает вершинные шейдеры. Вместо этого, чип поддерживает технологию NVIDIA Shading Rasterizer (NSR) используемую в GeForce2. Несмотря на это GeForce4 MX является очень мощным для сегодняшних игр.

GeForce4 MX имеет только два независимых 64-bit контроллера памяти балансирующих нагрузку. Выбор такой конфигурации связан с возможным использованием этого ядра в составе будущей версии чипсета nForce, который использует двух канальный 64-bit DDR интерфейс памяти.

В остальном GeForce4 MX идентичен GeForce4 Ti 4600; он имеет тот же движок Accuview AA (см. ниже), поддержку nView (см. ниже), и так же улучшенную подсистему видимости.

Кроме этого, GeForce4 MX имеет двойной интегрированный TMDS передатчик для двойного DVI выхода с разрешением до 1280 x 1024 на монитор, что в комплексе с возможностями nView делает платы, основанные на этом чипе, очень привлекательными, особенно на рынке бюджетных систем. Учитывая нацеленность этого чипа на массовый рынок дешевых систем, NVIDIA посчитала, что будет полезно оснастить его аппаратным декодером MPEG2 с компенсацией движения и IDCT (inverse discrete cosine sform), который поможет значительно улучшить просмотр DVD на системах, использующих слабые процессоры. Отсутствие подобного декодера в GF4 Ti объясняется использованием его в очень мощных системах, где центральный процессор самостоятельно справиться с декодированием MPEG2. 

На сегодняшний день линейка GeForce4 MX включает три карты: MX 460, MX 440 и MX 420. Все три карты имеют 128-bit шину памяти с 64MB фрейм буфером. Карты 460 и 440 используют DDR SDRAM, а 420 использует обычную SDR SDRAM память.

Особенности и возможности nView

Одной из долгожданных особенностей GeForce4 является технология nView, которая является расширением TwinView. Новый чип NVIDIA из верхней ценовой группы наконец-то приобрел полнофункциональную поддержку двухмониторных конфигураций. Теперь, мы можем забыть о тех днях, когда нам приходилось мириться с тем, что быстрые и дорогие 3D чипы от NVIDIA не поддерживают этой интересной и важной технологии, а их дешевые и менее производительные модификации (GeForce2 MX/MX200/MX400) могут работать с двумя мониторами, но не могут обеспечить достаточной производительности.

Конечно же, для поддержки двухмониторных конфигураций немалую роль сыграла компания ATI. Если бы карта ATI RADEON 8500/7500 не имели поддержки двухмонитоных конфигураций, мы до сих пор продолжали бы мечтать об альтернативном решении от NVIDIA.

Когда к графической карте подключены два монитора (Точнее говоря, два дисплея, т.е. монитор, и LCD или TV), nView позволяет работать в режимах Clone, Zoom, Horizontal Span и Vertical Span. Кроме того, первичное и вторичное устройство могут меняться ролями.

Вы так же можете менять свойства ориентации дисплея:

Во время воспроизведения видео имеется еще одие режим - Video Mirror.

Говоря о nView, мы не можем не упомянуть программную поддержку особенностей NVIDIA GeForce4, осуществленных на аппаратном уровне. В этой области nView Desktop Manager является доказательством высокой функциональности и удобства при работе с двухмониторными конфигурациями.

  • Создание и редактирование профилей

  • Управление окном и диалогом

  • Установки эффектов и масштабирования

  • Установка «горячих клавиш»

  • Управление виртуальными рабочими столами

С функциональной точки зрения, nView не уступает технологии HYDRAVISION от ATI. Единственное замечание касается работы с TV-выходом.

Согласно утверждению NVIDIA, имеется модуль TV-выхода с поддержкой HDTV встроенный в чип GeForce4. Однако, наша тестовая карта NVIDIA GeForce4 Ti4600 была оборудована внешним чипом CX 25871-13 от Conexant. Кроме того, качество изображения на экране TV немного отстает оттого, что мы видели на картах ATI. Мы считаем, что когда начнется массовое производство карт на NVIDIA GeForce4, эта проблема будет решена.

Новый алгоритм сглаживания Accuview AA

В GeForce 4 и GeForce 4MX, NVIDIA реализовала новый более эффективный алгоритм сглаживания - "Accuview AA". До выпуска GeForce 3, NVIDIA использовала т.н. алгоритм super-sampling позволяющий удалить "неровности" из изображения. Работает этот алгоритм следующим образом. Super-sampling рендерит текущий фрейм в более высоком разрешении (Например, 2X или 4X от родного). В этом разрешении, цветовые сэмплы собираются вокруг каждого пикселя, после чего они смешиваются вместе, и фрейм масштабируется обратно к родному разрешению. Поскольку оригинальный фрейм рендерится множество раз, super-sampling требует большой пропускной способности шины памяти. В то время как визуально, super-sampling AA позволяет получить превосходные изображения, по производительности этот метод сглаживания доступен не всем GPU при разрешении выше 800x600. Учитывая это, в GeForce 3 NVIDIA применила другой метод сглаживания известный как multisampling.


Multisampling работает подобно super-sampling, но из-за особенностей GPU, оригинальные данные посылаются через конвейер один раз, что позволяет разгрузить шину. Имеющиеся данные используются для получения цветовых сэмплов от т.н. "виртуальных пикселей" окружающих оригинальный пиксель. После этого все сэмплы смешиваются вместе. Несмотря на это, multisampling имеет несколько побочных эффектов. Уменьшение загрузки шины пагубно сказывается на качестве изображения. При многократном использовании данных текстуры изображение может размываться. Для решения этой проблемы используются различные оптимизирующие методы, такие как анизотропная фильтрация или изменение положения "виртуальных пикселей" используемых для цветовых сэмплов.

Различные версии алгоритмов сглаживания, включая multisampling, 2x, Quincunx, 4x и 4xS, вместе с анизотропной фильтрацией теперь называются одним словом - Accuview.

Здесь, Вы видите включение нового алгоритма сглаживания 4xS. Фактически алгоритм 4xS является комбинацией 2x multisampling’а и 1x2 supersampling’а. Суть этого метода заключается в формировании финального пикселя как среднее число двух подпикселей, расположенных один ниже другого, каждый из которых получен 2x multisampling’ом.

Методика 4xS позволяет скрыть "ступеньки" на горизонтальных и слегка наклоненных линиях. Для оценки эффективности этой методики мы использовали несколько игровых программ. Первая, Serious Sam: The Second Encounter, где мы сравнили качество полученное при применении методики 2x, Quincunx, 4x и 4xS от NVIDIA, а так же SMOOTHVISION 6x от ATI.

Нет сглаживания

Accuview 2x

Accuview Quincunx


Accuview 4x


Accuview 4xS


Smoothvision 6x Quality

Второй пример - Novalogic Comanche 4

2X AA

Quincunx AA

4X AA

4XS

 Eye Candy 1

Eye Candy 2

Eye Candy 3

В этом сравнении верхние четыре снимка позволяют нам увидеть тот же эффект, который мы наблюдали в Serious Sam: The Second Encounter. Нижние три снимка показывают новое качество получаемых сцен при применении метода 4XS.

Теперь мы хотели бы коснуться вопроса влияния нового метода сглаживания на производительность. Для этого были проведены испытания Serious Sam: The Second Encounter в режимах Speed и Quality. В сравнении приняли участие три графические карты NVIDIA GeForce4 TI4600, GeForce3 TI500 и ATI RADEON 8500.

Режим Quality отличается от режима Speed поддержкой анизотропной фильтрации, ВТО время как 4xS отличается от 4x - 2x1 supersampling’ом.

По этой причине, а именно из-за 2x1 supersampling’а в методике 4xS, удвоение производительности, необходимое для вычисления цвета кажется очень ощутимой при включении анизотропной фильтрации. Кроме того, чем выше уровень анизотропной фильтрации, тем больше 4xS отстает от 4x. Для определения разницы использовалась тестовая сцена Lobby из 3DMark2001.

Здесь мы отчетливо видим, что увеличение вычислительной нагрузки, требуемой анизотропной фильтрацией увеличивает время требуемое на отображение пикселя 4x и вдвое увеличивает время для 4xS.

Качество 3D сцен

Поскольку мы заговорили о анизотропной фильтрации, давайте подробнее рассмотрим новые возможности и производительность при отображении 3D сцен.

NVIDIA GeForce4, так же как GeForce3 поддерживает 8-, 16- и 32-сэмпловую анизотропную фильтрацию. Обратите внимание, что качество фильтрации текстур одинаково для этих двух чипов. Для иллюстрации этого посмотрите на скриншоты ниже выполненные в режиме quality:

NVIDIA
GeForce4 Ti4600

NVIDIA
GeForce3 Ti500

ATI
RADEON 8500

Как Вы может видеть, качество анизотропной фильтрации NVIDIA GeForce4 Ti4600 и NVIDIA GeForce3 Ti 500 абсолютно идентичны.

Теперь, давайте посмотрим влияние включение анизотропной фильтрации на NVIDIA GeForce4 Ti4600 в сравнении с NVIDIA GeForce3 Ti500 и ATI RADEON 8500:

При включении анизотропной фильтрации производительность NVIDIA GeForce4 Ti4600 понижается намного больше, чем у NVIDIA GeForce3 Ti500. Особенно это важно учитывая, что GeForce3 Ti500 теряет почти 50% производительности. Единственным спасением для GeForce4 Ti4600 является работа на большей частоте. В случае одинаковых частот GeForce4 Ti4600 может даже проиграть GeForce3 Ti500.

Внешние особенности новых графических карт

Графические платы, основанные на новых чипах, имеют ряд новых конструктивных решений и особенностей. Первое, что бросается в глаза - новый кулер с логотипом NVIDIA. Учитывая факт, что чип работает на 300MHz, он требует более эффективных методов охлаждения, чем те, что использовались раньше. Оригинальная конструкция кулера позволяет не только эффективно охлаждать сам GPU, но и окружающие его чипы памяти, которые, кстати, работают на частоте до 600MHz, и тоже требуют хорошего охлаждения.

  

Что касается памяти, но плата оснащается 128MB DDR SDRAM от Samsung со временем доступа 2.8ns. Обратите внимание, что чипы памяти выполнены в новом корпусе BGA, который имеет несколько лучшие электрические характеристики, учитывая стабильную работу на очень высоких частотах.

Карты оборудуются VGA-, DVI-I и S-Video выходами. Сигнал для цифровых мониторов формируется чипом Sil164ct64 от Silicon Image.

TV-сигнал формируется чипом Conexant CX25871-13.

Испытания

Теперь, когда мы подробно рассмотрели все новые особенности архитектуры GeForce4, и даже провели предварительные испытания влияния новых архитектурных решений на производительность GeForce4, давайте перейдем непосредственно к испытаниям новых графических карт. Тестовая система работала под управлением Windows XP, которая устанавливалась с нуля для каждой новой графической карты.

Тестовая система

  • Pentium 4 Northwood CPU - 2GHz
  • Abit BD7-RAID - i845 DDR
  • 256MB Corsair PC2400 DDR SDRAM
  • IBM DTLA307030 30Gig ATA100 7200 RPM
  • Sound Blaster Live Value
  • Windows XP Professional
  • Direct X 8.1 (стандартно с WinXP)
  • Asus V8200T5 - GeForce3 Ti 500
  • NVIDIA GeForce2 Ti 200 Reference Card
  • ATi Radeon 8500
  • NVIDIA GeForce4 Ti 4600 128MB Reference Card
  • NVIDIA GeForce4 MX 460 64MB Reference Card
  • NVIDIA Detonator 4 reference drivers version 27.30
  • ATi Radeon 8500 Drivers 6.13.10.6025
  • Intel chipset drivers version 3.20

Новые референсные драйвера Detonator 4 27.30

Информация

Direct X

OpenGL

Accuview AA

nView

Прозрачность

Quake 3 Arena

Сначала мы проведем общее сравнение без включения AA.

 

Все платы были протестированы при установке максимальных настроек геометрии и текстур, с 32 bit цветом и трилинейной фильтрацией. Однако помните, что "старый" игровой движок не использует пиксельные и вершинные шейдеры. Теперь результат. Несмотря на безумную скорость GeForce4 Ti 4600, наше внимание привлекли результаты  GeForce4 MX 460. Даже в разрешении 1600х1200 эта карта показывает больше 80 кадров в секунду. При том, что ее цена около 150$. Теперь Давайте активизируем сглаживание...

 

При активизации сглаживания карта GeForce4 MX 460 составляет серьезную конкуренцию Radeon 8500 и даже GeForce3 Ti 500. Эти результаты были получены в разрешении 1280X1024.

Сравнение производительности DirectX 8

 

В этой серии испытаний не использовалось сглаживание, а только менялось разрешение. Это позволяет нам более реально оценить отличие DirectX 8 производительности от GeForce3 Ti 200. 

 

Эти испытания проводились в разрешении 1024X768 с 32 bit глубиной цвета, при использовании режимов сглаживания 2X и 4X. Здесь мы видим бесспорное лидерство карты GeForce4 Ti 4600, опережающую GeForce4 MX 460 на 25 - 35%. Кроме того, в эту серию мы включили результат для режима 4XS, который показывает примерно 4% отставание.

Производительность OpenGL

Для этих тестов мы использовали игру Serious Sam - The Second Encounter. Во время тестов были установлены максимальное качество текстур и детализации.

 

Первая серия тестов с отключенным сглаживанием. Здесь Вы можете видеть, что все платы, за исключением GeForce4 Ti 4600 показывают примерно равные результаты.

Следующие тесты проводились в одном разрешении при установке разных режимов сглаживания.

 

Тесты выполнены в разрешении 1024X768, с установкой максимальной детализации и 32 bit глубины цвета.  GeForce4 MX показывает результаты сравнимые с Radeon 8500, за исключением режима 4X.  GeForce4 Ti 4600 превосходит остальные карты примерно на 34 - 50%. 

Производительность DirectX 8

В этой серии испытаний мы использовали продукт Max Payne, который использует DirectX 8 для управления графическими средами и жизнеподобным характером.  В целом Max Payne позволяет максимально загрузить графическую карту, что объясняет не высокую скорость.

 

Здесь мы продолжаем наблюдать преимущество GeForce4 Ti 4600, однако, оно не столь значительно, как мы видели в предыдущих тестах.

Возможности разгона GeForce4 Ti 4600

Эксперименты показали, что GeForce4 Ti 4600 можно разогнать, но не сильно. Фактически удалось достичь частоты ядра 325MHz и памяти 715MHz (DDR). На этих частотах карта оставалась стабильной при выполнении 3DMark 2001. 

GeForce4 Ti 4600 @  325/715

 

Заключение

В целом все, что было сказано выше, позволит Вам самостоятельно сделать все необходимые выводы. Мы только попробуем сопоставить некоторые факты. Учитывая, что негласно чип GeForce4 был выпушен как главный конкурент ATI RADEON 8500, NVIDIA должна была учесть все недостатки GeForce3 Ti500 и преимущества ATI RADEON 8500.

ATI RADEON 8500 в отличие от NVIDIA GeForce3 поддерживает двухмониторные конфигурации. Теперь эта поддержка осуществлена в GeForce4.

ATI RADEON 8500 имеет аппаратную декомпрессию MPEG2. Теперь GeForce4 также оснащается аппаратным декодером MPEG2.

ATI RADEON 8500 имеет более эффективный модуль вертикальных шейдеров, чем NVIDIA GeForce3. GeForce4 теперь имеет два модуля.

ATI RADEON 8500 поддерживает более "расширенный" пиксельный шейдер, чем NVIDIA GeForce3: версия 1.4 против версии 1.1. GeForce4 имеет поддержку версии 1.3.

ATI RADEON 8500 хвастается технологией HyperZ II, которая более эффективна, чем Lightspeed Memory Architecture технология, используемая в GeForce3. GeForce4 теперь использует технологию Lightspeed Memory Architecture II.

И, наконец, ATI RADEON 8500 работает на более высокой частоте ядра и памяти, чем GeForce3 Ti500. Теперь GeForce4 Ti4600 использует самую высокую частоту, как для ядра, так и для памяти.

Все это подтверждает, что основной причиной выпуска GeForce4 стала RADEON 8500. Но это неважно, главное, что теперь мы получили действительно новый уровень качества и производительности.

Мы благодарим компанию «Ultra Computers» за помощь, оказанную при подготовке этой статьи. Сегодня компания предлагает широкий ассортимент графических карт GeForce2, GeForce 3, RADEON 8500 и GeForce 4.

По вопросам консультаций обращайтесь по телефонам в Москве: (095) 729-5255, 729-5244