Какая пропускная способность нужна видеокартам PCI Express?
Сегодня интерфейс PCI Express есть практически у каждого нового
компьютера, он используется и для подключения видеокарты, как
встроенной, так и внешней. За прошедшее время видеокарты ощутимо
продвинулись вперёд, поэтому, как нам показалось, настало время для
анализа, который позволил бы ответить на вопрос: какая
пропускная способность шины нужна видеокарте на самом деле?
Интерфейс
PCI Express быстро обеспечил потенциал роста графической индустрии,
поскольку он позволил nVidia и ATi/AMD устанавливать в компьютер две и
даже четыре видеокарты. Кроме того, PCI Express необходим для карт
расширения с высокими требованиями к пропускной способности, такими как
RAID-контроллеры, гигабитные сетевые адаптеры или физические ускорители
для 3D-приложений и игр. Вычислительную мощь дополнительных видеокарт
можно использовать для увеличения производительности на высоких
разрешениях, добавления визуальных функций или для увеличения скорости
на стандартных разрешениях и настройках качества. Впрочем, последняя
опция не всегда интересна, поскольку многие современные видеокарты
достаточно мощные для стандартных разрешений 1024x768 и 1280x1024.
Потенциал роста благодаря решениям ATi Crossfire и nVidia SLI
впечатляет, но обоим решениям требуется подходящая платформа. Но
универсала, материнской платы, которая поддерживала бы Crossfire и SLI
одновременно, не существует. По крайней мере, пока.
Впрочем,
конфигурации на двух и четырёх видеокартах являются только частью
графического рынка. Большинство компьютеров и сценариев модернизации
по-прежнему построены на одной видеокарте, именно поэтому мы решили не
расширять наши тесты масштабирования PCI Express до двух видеокарт. Мы
взяли обычные high-end видеокарты ATi и nVidia, после чего провели их
через серию тестов в разных режимах PCI Express.
Основы PCI Express
Самые
распространённые слоты PCI Express: крупный поддерживает 16 линий, а
маленький - одну линию для простейших карт расширения.
В
отличие от шин PCI и PCI-X, интерфейс PCI Express основан на
последовательном протоколе "точка-точка". То есть для интерфейса PCI
Express требуется относительно небольшое число проводников. Зато
интерфейс использует намного более высокие тактовые частоты по
сравнению с параллельными шинами, что даёт высокую пропускную
способность. Кроме того, пропускную способность можно легко увеличить,
связав вместе несколько линий PCI Express. Чаще всего используются
следующие типы слотов: x16, x8, x4, x2 и x1, где цифры указывают на
число линий PCI Express.
PCI
Express - двунаправленный интерфейс "точка-точка", который обеспечивает
одинаковую пропускную способность в двух направлениях, и которому не
требуется делиться пропускной способностью с другими устройствами, как
происходило в случае PCI. Благодаря модульной архитектуре производители
материнских плат могут распределять доступные линии PCI Express на те
слоты, на которые требуется. Скажем, 20 доступных линий PCI Express
можно направить на один слот x16 PCIe и на четыре слота x1 PCIe. Так у
многих чипсетов и происходит. А для серверных систем, например, можно
установить пять портов x4 PCIe. В общем, с PCI Express можно создавать
любые математические конфигурации. Наконец, PCI Express позволяет
смешивать мосты чипсета от разных производителей.
Впрочем,
у PCI Express есть один недостаток: чем больше линий PCIe, тем выше
энергопотребление чипсета. Именно по этой причине чипсеты с 40 и
большим количеством линий PCI Express требуют больше энергии. Как
правило, 16 дополнительных линий PCI Express увеличивают
энергопотребление современных чипсетов на 10 Вт.
Число линий PCI Express |
Пропускная способность в одном направлении |
Суммарная пропускная способность |
1 |
256 Мбайт/с |
512 Мбайт/с |
2 |
512 Мбайт/с |
1 Гбайт/с |
4 |
1 Гбайт/с |
2 Гбайт/с |
8 |
2 Гбайт/с |
4 Гбайт/с |
16 |
4 Гбайт/с |
8 Гбайт/с |
PCI Express: x1, x4, x8, x16
На большинстве материнских плат для подключения видеокарты используется 16 линий PCI Express.
На многих системах с двумя видеокартами два физических слота x16 PCI Express работают в режиме x8 линий каждый.
Чтобы видеокарта заработала в режиме x8 PCI Express, мы заклеили часть контактов скотчем.
Чтобы видеокарта заработала в режиме x4 PCI Express, нам пришлось заклеить скотчем ещё больше контактов.
Та же самая видеокарта, но заклеено больше контактов. Она работает в режиме x4 PCI Express.
То же самое можно сказать и про x1 PCI Express. Мы заклеили все контакты, которые не требовались в режиме x1.
Если заклеить
лишние контакты, то видеокарта PCI Express станет работать в режиме
всего x1 PCI Express. Пропускная способность составляет 256 Мбайт/с в
обоих направления.
Следует учитывать, что не каждая материнская плата может работать с видеокартами с низким числом линий PCI Express.
Схема
слота x16 PCI Express. По ней можно определить, какие контакты
требовалось заклеивать скотчем. Нажмите на картинку для увеличения.
Конкуренты: ATi Radeon X1900 XTX и nVidia GeForce 8800 GTS
Мы
взяли две high-end видеокарты от двух конкурентов: AMD/ATi и nVidia, а
именно Radeon X1900 XTX и GeForce 8800 GTS. Модели, конечно, не самые
топовые, но определённо класса high-end.
ATi Radeon X1900 XTX
ATi
Radeon X1900 XTX состоит из 384 млн. транзисторов и предлагает 48
блоков пиксельных шейдеров. Они организованы по четыре блока в так
называемые "квады". GPU работает на частоте 675 МГц, на видеокарту
установлено 512 Мбайт памяти GDDR3, работающей на частоте 775 МГц (1,55
ГГц DDR). Обратите внимание, что видеокарты ATi из линейки X1xxx не
относятся к стандарту DirectX 10.
Мы
взяли модель HIS X1900 XTX IceQ3, которая использует улучшенную систему
охлаждения. Поскольку дизайн эталонный, то вентилятор карты по-прежнему
радиальный, зато есть система тепловых трубок и массивный радиатор. По
нашему опыту видеокарта HIS работает тише, чем эталонные модели ATi.
nVidia GeForce 8800 GTS
Линейка
GeForce 8 от nVidia является передовой у этой компании. Хотя перед нами
первые видеокарты класса DirectX 10 потребительского уровня, nVidia не
очень удачно стартовала под Windows Vista из-за проблем с драйверами.
Чип работает на частоте 500 МГц, а пиксельные процессоры - на 1,2 ГГц.
В продаже есть карты с 320 и 640 Мбайт ОЗУ, все они используют 800-МГц
память (1,6 ГГц DDR).
Мы взяли GeForce 8800 GTS с 320 Мбайт памяти GDDR3 от Zotec. Карта построена по эталонному дизайну nVidia.

Тестовая конфигурация
Системное аппаратное обеспечение |
Socket 775 |
Intel Core 2 Extreme X6800 (Conroe 65 нм, 2,93 ГГц, 4 Мбайт кэша L2) |
Материнская плата |
MSI 975X Platinum PowerUp Edition, чипсет: Intel 975X, BIOS: 2007-01-24 |
Общее аппаратное обеспечение |
Память |
2x 1024 Мбайт DDR2-8000 (CL 4,0-4-4-12), Corsair CM2X1024-6400C3 XMS6403v1.1 |
Видеокарта I |
HIS X1900 XTX IceQ3, GPU: ATi Radeon X1900 XTX (650 МГц), память: 512 Мбайт GDDR3 (1 550 МГц) |
Видеокарта II |
Zotec GeForce 8800 GTS, GPU: GeForce 8800 GTS (500 МГц), память: 320 Мбайт GDDR3 (1 200 МГц) |
Жёсткий диск |
400 Гбайт, 7 200 об/мин, кэш 16 Мбайт, SATA/300, Western Digital WD4000KD |
DVD-ROM |
Gigabyte GO-D1600C (16x) |
Программное обеспечение |
Графический драйвер I |
ATi Catalyst Suite 7.2 |
Графический драйвер II |
nVidia ForceWare 97.92 |
Драйверы платформы Intel |
Chipset Installation Utility 8.1.1.1010 |
DirectX |
Версия: 9.0c (4.09.0000.0904) |
ОС |
Windows XP Professional, Build 2600 SP2 |
Тесты и настройки
Тесты и настройки |
3D-игры |
Call Of Duty 2 |
Version: 1.3 Retail Video Mode: 1600x1200 Anti Aliasing: 4x Texture Filter: Anisotropic Timedemo demo2 |
Quake 4 |
Version: 1.2 (Dual-Core Patch) Video Mode: 1600x1200 Video Quality: Ultra (ATI)/High(Nvidia) Anti Aliasing: 4x Multi CPU: Yes THG Timedemo waste.map timedemo demo8.demo 1 (1 = load textures) |
Приложения |
SPECviewperf 9 |
Version: 9.03 All Tests |
3D Mark06 |
Version: 1.1 Video Mode: 1600x1200 Anti Aliasing: 4x Anisotropic Filter: 8x |
Результаты тестов
Call of Duty 2
Как
видим, nVidia GeForce 8800 GTS работает на скоростях x1 и x4 просто
ужасно, заметно ниже максимального уровня производительности, который
достижим только при скоростях x16. ATi Radeon X1900 XTX, с другой
стороны, для нормальной работы в Call of Duty 2 требует пропускную
способность не больше x4 PCI Express.
Quake 4
Ситуация
в Quake 4 совершенно иная. Здесь ATi Radeon X1900 XTX и nVidia GeForce
8800 GTS начинают вполне нормально работать на скорости x4 PCI Express,
а при переходе на x8 или x16 выигрывают незначительно.
3DMark06
Графический
3D-тест 3DMark06 от Futuremark очень сильно нагружает GPU, поскольку он
с самого начала разрабатывался для подобной цели. Поэтому требования к
интерфейсу у него невелики. nVidia GeForce 8800 GTS сильнее реагирует
на снижение пропускной способности интерфейса PCI Express по сравнению
с ATi Radeon X1900 XTX, который работает близко к максимуму уже на
скорости x4 PCI Express.
SPECviewperf 9.03
Профессиональный
графический OpenGL-тест SPECviewperf 9.03 очень сильно нагружает
центральный процессор и графическую подсистему. Как видим, результаты
заметно зависят от скорости интерфейса. Было весьма любопытно отметить,
как масштабируется производительность при переходе от x1 к x4 и к x8
PCI Express. Переход к x16 PCI Express даёт прирост производительности,
но уже не такой существенный. В любом случае, можно совершенно
определённо сказать, что профессиональные графические приложения
требуют интерфейса с высокой пропускной способностью. Поэтому, если вы
хотите работать с 3DSMax, Catia, Ensight, Lightscape, Maya, Pro
Engineer или SolidWorks, от без x16 PCI Express не обойтись.
ЗаключениеКак видим, четырёх линий
PCI Express для получения максимальной производительности уже
недостаточно. Хотя мы наблюдаем различия как между ATi/AMD и nVidia,
так и между играми и профессиональными приложениями, в большинстве
случаев максимальная производительность достигается только с
интерфейсом x16 PCI Express. Мы тестировали две 3D-игры, Quake 4 и Call
of Duty 2, которые сегодня нельзя назвать самыми требовательными, но
они определённо выигрывают от более быстрого интерфейса. Но самые
любопытные результаты мы получили в тесте SPECviewperf 9.03, поскольку
он показал существенное падение производительности при снижении
скорости интерфейса PCI Express ниже x16.
Результаты
производительности наглядно показывают, что сегодня материнские платы и
чипсеты должны поддерживать все видеокарты на полной скорости x16 PCI
Express. Если вы установите высокопроизводительные видеокарты на
"слабый" интерфейс, такой как PCI Express x8, то придётся пожертвовать
производительностью.
Источник: http://www.thg.ru |