Платный
хостинг от провайдера HostSpace.com.ua - хостинг, регистрация доменов.
Поддержка PHP, MySQL, почта - в каждом тарифном плане.
Две головы лучше, или Кое-что о двухпроцессорных рабочих станциях
В мире, полном компромиссов, всегда находятся люди, желающие большего. В мире персональных компьютеров всегда находятся задачи, для которых даже самый быстрый из имеющихся на рынке процессоров слишком медлителен.
Для решения этой проблемы индустрия PC позаимствовала у больших компьютеров
идею симметричной многопроцессорной обработки (Symmetrical Multiprocessor Computing
– или сокращенно SMP), воплотив ее в железо (в виде соответствующих материнских
плат, допускающих установку двух или более процессоров) и в ПО (прежде всего
в виде операционных систем с поддержкой SMP, к которым относятся, например,
Windows NT, Windows-2000, OS/2, Linux и множество других менее распространенных
ОС).
Основная идея SMP достаточно проста и заключается в том факте, что если написать
задачу в виде нескольких более-менее независимых друг от друга процессов (нитей),
то такую задачу можно эффективно выполнять одновременно несколькими процессорами,
и результирующая производительность системы будет теоретически равна сумме производительностей
составляющих ее процессоров. На практике оказывается достаточно сложно сделать
процессы полностью независимыми, кроме того, на разделение задач между процессорами
тоже тратятся некоторые вычислительные ресурсы, поэтому реальный прирост производительности
системы оказывается ниже теоретически возможного, и тем ниже, чем больше процессоров
участвуют в SMP-связке. Кроме того, существуют некоторые аппаратные сложности,
ограничивающие реализацию сложных SMP-систем для PC-платформы, поэтому на практике
наибольшее распространение получили двухпроцессорные PC-системы.
Таблица 1
Коэффициент производительности в многозадачной среде.
Сравнение одно- и двухпроцессорных рабочих станций на базе процессоров Intel (чем
выше значение, тем лучше)
| Тест на многозадачность |
Один процессор |
Два процессора |
Коэффициент производительности |
процент сэкономленного времени (два процессора против одного),
% |
| Dgauss si3 + Dgauss si3 |
1410.60 |
2878.10 |
2.04
|
51.0% |
| SPECint_peak_rate95 |
182.84 |
360.01 |
1.97
|
49.2% |
| ProE 19 Bench98 + 8 (Ansys 5.5 ttns-fs) |
1157.00 |
2149.00 |
1.86
|
46.2% |
| ProE 19 Bench98 + 10 (Ansys 5.5 sms-bls) |
1194.00 |
2180.00 |
1.83
|
45.2% |
| SYSMarkNT 4.0 ppoint + SPEC95 gcc-51 |
91.60 |
164.40 |
1.79
|
44.3% |
| SYSMarkNT 4.0 word + SPEC95 gcc-19 |
49.70 |
84.80 |
1.71
|
41.4% |
| SYSMarkNT 4.0 excel + SPEC95 gcc-26 |
59.90 |
100.40 |
1.68
|
40.3% |
| SPECfp_peak_rate95 |
141.91 |
237.83 |
1.68
|
40.3% |
| 2 (Nastran 70 lgamd) + 7 (Nastran 70 bd03fix) |
628.80 |
948.50 |
1.51
|
33.7% |
| Среднее |
1.78 |
43.5% |
SMP-системы с двумя процессорами оказываются достаточно простыми, компактными
и дешевыми, одновременно предлагая вычислительную мощность, значительно превышающую
параметры одного процессора (типичный коэффициент прироста мощности колеблется
в зависимости от задачи в диапазоне 1.1-1.9).
Поэтому такие системы широко применяются как для построения PC-серверов, так
и в качестве мощных рабочих станций, причем если со сферой применения серверов
все более-менее ясно, то сфера наиболее выгодного применения мощных рабочих
станций все еще остается не вполне осознанной многими. В настоящее время сложились
следующие области, в которых применение двухпроцессорных рабочих станций дает
значительный выигрыш в производительности и обеспечивает хороший экономический
эффект:
1. 3D-моделирование (дизайнеры и конструкторы).
2. Системы САПР.
3. Создание цифрового контента (DCC) и обработка изображений.
4. Нелинейный видеомонтаж.
5. Сложные математические вычисления.
Конкретные цифры прироста производительности для некоторых типичных задач вы
можете увидеть в приводимых таблицах. Табл. 1 показывает рост производительности
обычных (не оптимизированных для SMP-архитектуры) задач в многозадачной среде
(то есть при запуске на выполнение двух и более одинаковых задач параллельно).
Табл. 2 показывает рост производительности оптимизированных (многопоточных)
задач (для тестов взята популярная программа
3D-визуализации SoftImage, программы физического моделирования потоков различных
сред и твердотельного моделирования, а также сложные вычислительные задачи).
Таблица 2. Коэффициент производительности многопоточных
приложений - сравнение одно- и двухпроцессорных рабочих станций на базе процессоров
Intel (чем выше значение, тем лучше).
| Тест многопоточных приложений |
Один процессор |
Два процессора |
Коэффициент производительности |
% сэкономленного времени – два процессора против одного |
| Softimage mental ray, объект Cathedral |
190.00 |
368.33 |
1.94
|
48.4% |
| Fluent UGM2: поток в искривленной трубе |
999.00 |
1836.00 |
1.84
|
45.6% |
| Fluent STANCAS: моделирование изгиба трубы |
86.00 |
157.00 |
1.83
|
45.2% |
| Fluent mixer: двухфазный поток через смеситель |
1309.00 |
2273.00 |
1.74
|
42.4% |
| Fluent Burner: высокоскоростное горение |
442.00 |
762.00 |
1.72
|
42.0% |
| MM5 Weather Forecast: 6 часов |
5077.00 |
9140.00 |
1.80
|
44.5% |
| Dgauss: модель Silicalite (si3vwn) |
861.69 |
1549.23 |
1.80
|
44.4% |
| LS-DYNA: авария небольшой машины |
4256.00 |
7831.00 |
1.84
|
45.7% |
| LS-DYNA: Штамповка нефтяных резервуаров |
5319.00 |
8600.00 |
1.62
|
38.2% |
| Linpack 1000 x 1000 |
273.93 |
433.83 |
1.58
|
36.9% |
| SWMM/EXTRAN: большая модель CSS |
413.00 |
580.00 |
1.40
|
28.8% |
| Среднее |
1.74 |
42.0% |
Условия тестирования
Тестирование проводилось на рабочих станциях с архитектурой Intel с одним, а
затем с двумя процессорами Intel Pentium III Xeon 500 MHz. Подробнее о методике
и результатах вы можете узнать по ссылке http://www.intel.ru/eBusiness/products/workstation/processor/bm877.htm.
Кстати, популярный тест SPEC CPU2000 показывает аналогичные цифры – прирост
производительности двухпроцессорной системы на процессорах PIII-933 составляет
по SPECint 1.84 раза, а по SPECfp – 1.65 раза. Другими словами, для получения
такой же производительности на однопроцессорной станции вам понадобился бы процессор
PIII с тактовой частотой не менее 1717 MHz или 1540 MHz соответственно, который
просто не существует в природе.
Из приведенных результатов хорошо видно, что производительность двухпроцессорной
системы значительно выше, чем однопроцессорной, при этом совершенно очевидным
является тот факт, что цена такой системы значительно ниже, чем цена двух однопроцессорных
машин аналогичной суммарной производительности. Этот факт и определил, в конечном
счете, популярность двухпроцессорных рабочих станций – их выпускают многие производители
компьютерных брэндов, в том числе такие авторитетные, как Silicon Graphics,
HP и Compaq. В качестве же заключительного штриха к иллюстрации популярности
двухпроцессорных рабочих станций на архитектуре Intel хочу привести факт перехода
ведущей лаборатории спецэффектов Голливуда Digital Domain (автора спецэффектов
к фильмам “Правдивая ложь”, “Аполлон-13”, “Титаник”, “Пятый элемент”) со станций
на процессорах Alpha на двухпроцессорные станции PC-архитектуры на процессорах
Intel PIII Coppermine и PIII Xeon. По утверждению специалистов Digital Domain,
это решение является наиболее эффективным и высокопроизводительным из всего,
что сейчас предлагает рынок.
SMP-платформы и политика Intel
Несмотря на достаточно широкое распространение двухпроцессорных платформ и востребованность
таких решений рынком, в настоящее время возможности построения дешевых SMP-систем
оказались значительно урезанными. Дело в том, что на рынке фактически нет надежного
и современного чипсета, поддерживающего двухпроцессорность. Длительное время
безраздельно господствовавший на рынке дешевых двухпроцессорных решений великолепный
чипсет 440BX перестал устраивать разработчиков мощных графических станций из-за
проблем с поддержкой шины FSB = 133 MHz (де-факто чипсет 440BX работает на такой
частоте, однако при этом его шина AGP оказывается выведена на частоту 87 MHz
вместо штатной 66 MHz, что вызывает серьезные проблемы с подбором видеокарт
и устойчивостью их работы).
А заменить его практически нечем – новые чипсеты Intel для процессоров PIII
(прежде всего i815 различных модификаций), по утверждению производителя, не
поддерживают многопроцессорность, так что на рынке остается всего два современных
чипсета, которые поддерживают одновременно и 133 MHz FSB, и двухпроцессорную
конфигурацию:
1. Чипсеты ServerWorks
2. Чипсет VIA Apollo Pro-133A.
Чипсеты ServerWorks, производство которых в настоящее время контролируется
корпорацией Intel, казалось бы, всем хороши – и производительны, и надежны.
Но вот незадача – они не позволяют строить дешевые системы, как из-за своей
высокой цены, так и из-за того, что они работают только с дорогостоящей registered
памятью. Поэтому в секторе дешевых двухпроцессорных систем выбора практически
нет – чипсет VIA является пока единственным SMP-чипсетом, сочетающим в себе
поддержку обычных unbuffered PC133 SDRAM c шиной FSB = 133 MHz, необходимой
для реализации высокой производительности современных процессоров PIII.
Причины, по которым Intel не хочет делать современный дешевый чипсет с поддержкой
двухпроцессорности, просты как грабли: двухпроцессорные платформы на PIII создают
сильнейшую конкуренцию новому процессору Intel P4, предлагая более высокую суммарную
производительность за меньшую цену.
VIA, Ваш выход!
И тут, пока Intel занята минимизацией возможных потерь от межплатформенной конкуренции,
на сцену выходит VIA Apollo Pro-133A – чипсет, хотя и имеющий не самую лучшую
репутацию и поэтому явно непригодный для создания, например, серверов, но вполне
способный претендовать на нишу мощных рабочих станций. Остается только выбрать
производителя материнской платы на этом чипсете, а это, между прочим, не такая
уж простая задача, поскольку чипсет сам по себе капризный и требует гораздо
более тщательного отношения к проектированию “обвязки” и разводки платы, чем
популярные чипсеты от Intel, так что тут можно довериться только наиболее солидным
фирмам.
В общем, после некоторого перебора моделей я остановился на материнской плате
GA-6VXDC7 фирмы Gigabyte (рис. 1). Вот некоторые подробности о ней:
VIA Apollo Pro Family AGPset.
Dual Socket 370 for Intel® FC-PGA Pentium® III или других аналогичных процессоров.
Ряд частот FSB 66/100/112/124/133/142/152 MHz.
Автоопределение напряжения питания CPU.
Память: 4 x 168-pin DIMM (PC-100 или
PC-133 SDRAM или VCM SDRAM).
Поддерживает до 1.5Gb RAM (3.3V unbuffered SDRAM DIMM).
Слоты: 1 x AGP4X, 5 x PCI (33 MHz PCI 2.2), 1 x ISA 2 x UltraDMA 33/66 bus master
IDE.
1 x FDD, 2 x COM, 1 x LPT, клавиатура и мышь PS/2, 4 x USB порта (из них два
через опциональный кабель).
Форм-фактор: ATX, 4-слойная печатная плата (30.4*24.3 см).
Дополнительные преимущества: 4 разъема для вентиляторов охлаждения.
Рис.1. Внешний вид материнской платы GA-6VXDC7
На этой материнской плате была построена тестовая платформа следующей
конфигурации:
1. 2 x CPU PIII-866EB (133 MHz FSB).
2. 2 x DIMM PC-133 SDRAM 256 Mb Micron (итого 512 Mb).
3. Video nVidia GeForce-2 MX (Microstar MS8817).
4. HDD Quantum Fireball CX10A011 (10 Gb).
5. Операционная система Windows-2000 AS + SP1.
В общем и целом это достаточно типичная конфигурация для мощной
рабочей станции. Единственное исключение состоит в том, что я не стал ставить
более мощный видеоадаптер, так как хотел сохранить конфигурацию возможно более
близкой к конфигурации типичных однопроцессорных игровых компьютеров, чтобы
полнее убедиться, что же дает применение двух процессоров.
К моему удивлению, инсталляция Windows 2000 AS с интегрированным
сервис-паком SP1 не вызвала никаких затруднений, драйверы видеоадаптера с прилагающегося
к нему диска (версия 5.3.2.0) тоже встали без каких-либо проблем. Также следует
отметить, что установка на плату GA-6VXDC7 процессоров с новыми кулерами Intel
увеличенного размера не вызвала трудностей, характерных для плат некоторых других
производителей. Более того, запас места позволяет ставить еще более мощные оверклокинговые
кулера (например, популярные в России Golden Orb), что, учитывая оверклокинговые
возможности платы, не может не радовать.
Тестируем!
Теория теорией, а практические данные, измеренные собственными руками, всегда
убеждают лучше. Поэтому я решил прогнать тестовую платформу через некоторые
стандартные тесты. Начал с популярного теста SiSoft Sandra-2001 Pro – результаты
представлены на рис. 2, 3 и 4:
Рис. 2. Сравнительная производительность процессоров системы
на простых инструкциях (Dhrystones и Whetstones)
Рис. 3. Сравнительная производительность процессоров системы
на расширенном наборе инструкций (MMX, SSE)
Рис. 4. Скорость доступа в память со стороны целочисленных модулей
и модуля с плавающей запятой
Затем я предпринял небольшой оверклокинг, увеличив частоту FSB до 142 MHz (благо,
на GA-6VXDC7 для этого достаточно всего лишь переставить переключатель SW1.1
в положение OFF), в результате чего частота процессоров выросла до 910 MHz и
пропорционально увеличились частоты на шинах PCI и AGP, и выполнил те же самые
тесты (см. рис. 5, 6 и 7):
Рис. 5. Сравнительная производительность процессоров системы
на простых инструкциях (Dhrystones и Whetstones) после оверклокинга
Рис. 6. Сравнительная производительность процессоров системы
на расширенном наборе инструкций (MMX, SSE) после оверклокинга
Рис.7. Скорость доступа в память со стороны целочисленных модулей
и модуля с плавающей запятой после оверклокинга
В целом ситуация понятна – “числодробилка” у двухпроцессорной системы легко
превзошла почти вдвое производительность единичного процессора AMD Athlon на
частоту 1 GHz, однако скорость доступа в память у получившейся системы не особенно
велика (сказываются задержки межпроцессорного арбитража).
Посмотрим, что же покажет система на реальных вычислениях.
Для начала я воспользовался программой Super Pi for Windows v.1.1, с помощью
которой вычислял значение числа “Пи” с точностью до миллиона знаков. На тестовой
машине я запустил параллельно две копии программы, чтобы обеспечить равномерную
загрузку обоих процессоров, а в качестве сравнительных использовал машины с
процессором Intel PIII-800EB (FSB = 133 MHz на материнской плате с чипсетом
i815) и с процессорами AMD Duron-800 и Athlon-800 (FSB = 100 MHz DDR на плате
с чипсетом VIA KT133). Результаты на рис. 8 демонстрируют подавляющее преимущество
двухпроцессорной системы.
Рис. 8. Время вычисления числа “Пи” до 1 млн знаков, секунды
(больше – хуже)
Наконец, в качестве финального теста я выбрал программу “SETI at Home” v.3.03
(сложный спектральный анализ реальных данных радиотелескопа в Аресибо с целью
обнаружения посланий от инопланетной цивилизации в рамках международной программы
SETI), которая была запущена на тестовой платформе более чем на двое суток (для
равномерной загрузки процессоров я опять применил метод одновременного запуска
двух копий программы, обсчитывающих разные данные). Результаты, показанные в
табл. 3, говорят сами за себя: двухпроцессорная платформа показала рекордно
высокую производительность, легко обогнав даже достаточно экстремальную оверклокинговую
платформу с частотой шины FSB = 150 MHz.
Таблица 3
Производительность программы “SETI at Home” (блоков в сутки, больше означает лучшую
производительность)
| Система |
Блоков в сутки |
| Dual PIII 866 MHz VIA Apollo Pro (FSB=133 MHz) |
5.53 |
| PII 400 MHz Intel 440BX (FSB=100 MHz) |
1.72 |
| PIII 1050 MHz Intel i815E (оверклок до FSB=150 MHz) |
3.69 |
Выводы
1. Двухпроцессорные системы действительно позволяют получить высокую производительность,
недостижимую для однопроцессорных систем.
2. Двухпроцессорные системы на платформе VIA Apollo Pro дают возможность строить
эффективные по соотношению цена/производительность системы с отличным потенциалом
расширяемости, поскольку позволяют достигать на сравнительно дешевых процессорах
начального и среднего уровня производительности, аналогичной или превышающей
производительность однопроцессорных систем с процессорами высшей доступной тактовой
частоты.
3. Материнская плата Gigabyte GA-6VXDC7 показала себя при работе под ОС Windows 2000
достаточно надежной и стабильной для использования в мощных профессиональных
рабочих станциях. Впрочем, не на ней одной свет клином сошелся, и я надеюсь
в недалеком будущем провести сравнительные испытания еще нескольких аналогичных
материнских плат на VIA Apollo Pro от других производителей.
4. Несколько производителей материнских плат сообщили, что им удалось реализовать
двухпроцессорность на чипсете i815. Мы с нетерпением ожидаем образцы этих плат
и надеемся, что они смогут составить серьезную конкуренцию платформе VIA Apollo
Pro.
А в целом, все, что ни делается – к лучшему. Глядишь, и Intel зашевелится,
создаст наконец SMP-чипсет для своих процессоров PIII, вновь появится конкуренция,
а с ней упадут цены на эти платформы. А значит, недалек тот день, когда мы перестанем
гнаться за дорогими гигагерцевыми процессорами и остановимся на более умеренных
и дешевых решениях с не меньшей вычислительной мощностью.
www.atlant.ru
Компьютерные комплектующие 24-08-2006
Обзор, тестирование Raid контролера HighPoint RocketRAID 3120 PCI-E SATA RAID. 22-10-2008 Компьютерные комплектующие Введение.В данном обзоре вашему вниманию будет представлен Raid контролер, который с успехом можно использовать в серверах начального уровня, например, в офисных серверах.Особенностью данного контролера является два раздельных канала, новая шина PCI-E и работа с распространенными винчестерами SATA.Комплектация.Контролер поставляется в коробке белого цвета, в которой находились:1. Контролер.2. Шлейфы SATA.3. Планка PCI.4. Инструк...
Обзор, тестирование видеокарты BFG Tech GeForce 9800 GTX OCX 512MB GDDR3. 18-10-2008 Компьютерные комплектующие Введение.Вашему вниманию хотелось бы представить очередную видеокарту из серии GeForce 9. Не смотря на то, что я все больше склоняюсь к видеокартам AMD Radeon HD48**, видеокарты от NVIDIA не теряют свою популярность, - прежде всего из-за того, что люди привыкли к данному производителю.Также связано это со снижением цен на продукцию от компании NVIDIA.Комплектация.Видеокарта поставляется в довольно большой коробке, в которой были обн...
Обзор, тестирование видеокарты BFG Tech GeForce 9800 GTX OCX 512MB GDDR3. 17-10-2008 Компьютерные комплектующие Введение.Вашему вниманию хотелось бы представить очередную видеокарту из серии GeForce 9. Не смотря на то, что я все больше склоняюсь к видеокартам AMD Radeon HD48**, видеокарты от NVIDIA не теряют свою популярность, - прежде всего из-за того, что люди привыкли к данному производителю.Также связано это со снижением цен на продукцию от компании NVIDIA.Комплектация.Видеокарта поставляется в довольно большой коробке, в которой были обн...
Мышки в стиле автомобиля 17-10-2008 Компьютерные комплектующие В настоящее время существует множество видов компьютерных мышей: складные, эргономичные, альтернативные, игровые и даже гироскопические мыши. Теперь к этому разношерстному списку добавилась декоративная мышь, выполненная в виде автомобиля. Беспроводные мыши Road Mice, появившиеся в продаже интернет-магазина fourdoormedia.com, сделаны как модели современных автомобилей Dodge Charger, Chevy Z06 и Ford Mustang и оснащены оптическим сенсором, с разре...
Обзор, тестирование видеокарты BFG GeForce 9600GT OC2 512Mb GDDR3. 14-10-2008 Компьютерные комплектующие Введение.В данном обзоре, вашему вниманию будет представлена очередная видеокарта на основе чипа GeForce 9600GT, популярность к которой не так давно упала, но после очередного снижения цен, популярность к ней вспыхнула с новой силой.Производителем видеокарты является довольно известная за границей и не очень у нас в России, - компания BFG Technology.Сам лично к продукции данного производителя отношусь резко положительно, так как обычно это ...
Обзор, тестирование видеокарты XFX GeForce GTX 260 XXX Edition 896 Mb. 17-09-2008 Компьютерные комплектующие Введение.В данной статье будет опубликован очередной видеокарты, от хорошо себя зарекомендовавшей себя компании XFX.Видеокарта основана на одном из топовых чипсетов GeForce GTX 260. Стоимость видеокарты на момент написания статьи приближается к 340-350 $. Стоит ли данная видеокарта этих денег? На много ли отстает её производительность от конкурирующих решений? На данные вопросы мы и попытаемся сегодня ответить.Комплектация.Видеокарт... |