научная статья по теме SUPERCOMPUTERS: STATE OF THE ART AND PERSPECTIVES Автоматика. Вычислительная техника

Текст научной статьи на тему «SUPERCOMPUTERS: STATE OF THE ART AND PERSPECTIVES»

Автоматика и телемеханика, Л- 5, 2007

PACS 89.20.Ff

© 2007 г. A.B. ЗАБРОДИН, чл.-корр. РАН

(Институт прикладной математики им. М.В. Келдыша РАН), В.К. ЛЕВИН, академик РАН (НИИ "Квант" Роспрома, Москва)

СУПЕРКОМПЬЮТЕРЫ - СОСТОЯНИЕ И РАЗВИТИЕ

Охарактеризовано развитие суперкомпьютеров, которые за последние 10 15 лет стали строиться как массово-параллельпые структуры па микропроцессорной базе. В перспективе ближайшего десятилетия продолжится развитие параллельной обработки даппых как па общесистемном уровне, так и в структуре процессоров, будет повышаться физическое быстродействие компонентов и расширяться проблемная ориентация вычислительных систем па базе рекоп-фигурируемых структур.

1. Общая характеристика тенденций развития суперкомпьютеров

Создание и применение наиболее мощных вычислительных систем суперкомпьютеров является показателем научно-технического потенциала и входит в число важнейших приоритетов развитых стран. В течение 60 лет. прошедших с момента ввода в действие первой электронной цифровой вычислительной машины с программным управлением ENIAC (Electronic Numerical Integrator and Computer), производительность наиболее мощных установок, определяемая количеством вычислительных операций в секунду, возрастала ориентировочно 10-кратно за пятилетие. Рост производительности вычислительных систем происходит, прежде всего, за счет повышения быстродействия физико-технологической базы (электронных компонентов. устройств памяти, средств коммуникаций, ввода-вывода и отображения информации) и развития параллелизма обработки на всех системоструктурных уровнях, что связано с увеличением количества задействованных электронных обрабатывающих элементов и объемов памяти.

За последние 15 лет темп роста производительности суперкомпьютеров повысился до 20-кратного, что связано с переходом к массово-параллельным системам, построенным на базе активно развивающихся серийных микропроцессоров [1]. Концепции массово-параллельной обработки (масштабируемые МРР-структуры) стали определяющими в создании и применении суперкомпьютеров, несмотря на трудности программирования при распараллеливании обработки. По-видимому, такой структурно-технический подход и высокий темп развития сохранятся в последующее десятилетне.

В США на рубеже 2000 г. производительность суперкомпьютера вышла на уровень 10 трлн. операций в секунду, а в 2005 г. превысила 100 трлн. оп/с: системы этого уровня содержат по 10 тыс. и более процессоров. Ведущие фирмы анонсируют системы уровня 1015 (квадриллион) оп/с; фирма IBM уже несколько лет назад объявляла о намерении ввести в действие систему Bine Gene такой производительности.

За последние 5 7 лет получили распространение суперкомпьютеры в виде так называемых "кластеров", т.е. систем, изготовленных путем объединения коммерчески доступных серийных процессорных модулей средствами высокоскоростных локальных сетей (на сегодня преобладают сети Gigabit Ethernet. Myririet, Infiniband) с использованием стандартизованных интерфейсов (обычно шины PCI).

Наиболее мощные суперкомпыотерные установки, как это имело место и ранее, весьма громоздки (до сотни стоек), их энергопотребление достигает 1 МВт. Следовательно. остро стоит проблема теплоотвода. поэтому сохраняет актуальность проработка возможностей не только воздушного, но и жидкостного охлаждения электронной аппаратуры.

Современные микропроцессоры, являющиеся базовыми компонентами компьютеров. характеризуются тактовой частотой 1 4 ГГц и интеграцией более 100 млн. транзисторов в чипе при технологических нормах ОД мкм и менее. Структура микропроцессора. определяемая параллельно-конвейерной обработкой нескольких команд программного потока, предельно усложнилась. В микропроцессорах продолжает развиваться векторная и многопотоковая обработка, они уже выпускаются как двуядериые с суммарным пиковым быстродействием более 10 млрд. оп/с, интенсифицируется внешний обмен данными. Ожидается, что в ближайшие 2 3 года в одной интегральной схеме будет размещаться 10 30 процессорных ядер. В микропроцессоры встраиваются разнообразные средства контроля, терморегуляции и энергосбережения [1 4].

Продолжает сохранять остроту проблема построения оперативной памяти как в отношении увеличения объема, так и ускорения доступа к хранимой информации. Эти требования противоречивы: компромисс отчасти достигается иерархическим построением памяти с использованием двух- и трехуровневой внутренней памяти (кэш) микропроцессоров. Основная оперативная память современных суперкомпьютеров имеет объем по 1 2 Гигабайта на процессор, вместе с тем проявляется тенденция к наращиванию объема памяти. Для построения кластеров обычно используются 2 4-процессориые модули с общей (разделяемой) памятью. Некоторые типы из выпускаемых процессорных модулей допускают расширение оперативной памяти до уровня 100 Гигабайт, однако на сегодня это оправдано лишь для специфических применений в установках с небольшим числом процессоров.

Развитие сетей межпроцессорного обмена направлено на повышение пропускной способности каналов связи и коммутаторов при сокращении латентности (т.е. времени вхождения в связь). Проявляется стремление к созданию, по возможности. виртуальной общей памяти для всего многопроцессорного ресурса, что требует форсирования характеристик межпроцессорного обмена. При большом количестве объединяемых процессоров приходится строить сети как иерархические многоуровневые. Зачастую используют несколько внутренних сетей связи, ориентированных на различные системные функции (межпроцессорный обмен в различных режимах, обмен с внешней памятью, общесистемное управление и ввод-вывод).

Следует отметить, что эффективное использование упомянутых выше усложнений структуры микропроцессоров, многоступенчатой иерархии памяти и межпроцессорных связей, а также организация общей памяти требуют соответствующего построения программного обеспечения на системном и прикладном уровнях, что является сложной многовариантной задачей.

Рост производительности суперкомпьютеров взаимосвязан с расширением, обновлением н усложнением применений, разработками новых математических моделей, развитием соответствующих вычислительных методов. При этом необходимо распараллеливать обработку данных в алгоритмах и программах решаемых вычислительных задач и учитывать специфику структурного параллелизма, присутствующего в том или ином виде на всех уровнях системы (от внутрипроцессорного до

общесистемно-сетевого с выходом на глобальные Grid-технологии). Умелое использование и перманентное развитие программного обеспечения (как системного, так и прикладного) существенно определяет эффективность применений суперкомпьютеров и остается сложной и широкой проблемой.

2. Многопроцессорные системы в России

В нашей стране исследования по массово-параллельным структурам имеют 40-летнюю историю. На этой структурной основе с появлением 32 64 битных микропроцессоров стало возможным строить мощные вычислительные средства: в 1995 2000 гг. в ряде вычислительных центров России были введены в действие многопроцессорные системы производительностью 10 100 млрд. оп/с. С 2000 г. стали строиться кластеры производительностью до 1 трлн. оп./с, а в 2005 2006 гг. на уровне 10 трлн. оп/с. Кластерные системы выпускаются в различных модификациях по быстродействию и количеству процессоров, объемам памяти, типам межпроцессорных связей, конструктивному оформлению, составу программного обеспечения. Эти системы результативно используются в научных учреждениях и в промышленности различных регионов России, обеспечивая решение разнообразных задач высокой вычислительной сложности. Осуществляется поэтапно-прогрессирующее наращивание производительности и совершенствование технико-экономических показателей действующих н вновь создаваемых вычислительных систем [2. 5 8].

Важным фактором в отечественной практике стало повсеместное использование множественного доступа удаленных пользователей к мощным вычислительным установкам (по сети Internet или корпоративным сетям) с обеспечением необходимого разграничения доступа и защиты информации. В связи с этим становится реальным переход на новый этап осуществления вычислительных процессов с большим объемом обработки данных тсрриториалыго-распрсдслснные вычисления на основе повсеместно развиваемых Grid-технологий [9].

Освоение и развитие многопроцессорных систем требует определенных усилий и преодоления трудностей как в организации эксплуатации, так и в программном обеспечении. Следует признать, что возможности новейшей процессорной базы последних 2 3 лет по повышению производительности пока что не в полной мере ощущаются в отечественной практике применений (т.е. в исполнении прикладных программ): по-видимому, здесь есть резерв повышения эффективности действующих вычислительных установок.

3. Проблемная ориентация как фактор повышения производительности вычислительных систем

В числе направлений повышения вычислительной производительности с ориентацией на конкретные применения может рассматриваться функциональная специализация микропроцессоров и систем в целом. Так, известны и находят применение разного рода сигнальные микропроцессоры, нейрочипы, микросхемы ассоциативной памяти, а также чипы, содержащие по несколько десятков и даже сотен "простых" (малоразрядных) процессоров. Все большее распространение получают устройства на основе электрически-'программируемых" (т.е. структурно-реконфигурируемых) логических интегральных схем (ПЛИС) или в англоязычном варианте FPGA (Field-Programmable Gate Arrays).

ПЛИС довольно широко используются при макетной отработке устройств и в управляющих узлах, где возникает необходимость перенастроек. Уже появились системы Cray XD1 и некоторые другие, в которых ПЛИС используются как дополнительное средство к основной обработке [1, 10]. Структурная настройка, т.е. своего

рода ''программирование" ПЛИС, это, вообще говоря, более трудоемкое дело, чем ''обычное" программирование для микропроцессоров и компьютеров. Выбор наиболее эффективных способов работы, аппаратно-программных компонентов и системных решений определяет

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком