научная статья по теме ЭЛЕМЕНТНАЯ БАЗА И АРХИТЕКТУРА БУДУЩИХ СУПЕРКОМПЬЮТЕРОВ Электроника. Радиотехника

Текст научной статьи на тему «ЭЛЕМЕНТНАЯ БАЗА И АРХИТЕКТУРА БУДУЩИХ СУПЕРКОМПЬЮТЕРОВ»

МИКРОЭЛЕКТРОНИКА, 2015, том 44, № 3, с. 163-179

= ЭЛЕМЕНТНАЯ БАЗА СУПЕР ЭВМ

УДК 621.382

ЭЛЕМЕНТНАЯ БАЗА И АРХИТЕКТУРА БУДУЩИХ СУПЕРКОМПЬЮТЕРОВ © 2015 г. Ю. И. Митропольский

Физико-технологический институт Российской АН E-mail: mitropolsky@mail.ru Поступила в редакцию 25.06.2014 г.

Приведен обзор развития архитектуры и элементной базы отечественных и зарубежных суперкомпьютеров на протяжении 50 лет — от первых скалярных машин CDC 6600, CDC 7600, IBM Stretch, БЭСМ-6 до современных систем с петафлопсной производительностью. Выделены этапы развития: скалярные, векторно-конвейерные машины, массивно-параллельные системы на микропроцессорах, системы с использованием акселераторов и сопроцессоров и неоднородные системы на новой элементной базе. Проанализированы основные проблемы создания экзафлопсных систем и рассмотрены планы зарубежных фирм по созданию таких систем. На основе анализа собственного опыта исследований по мультиархитектурным системам автор приходит к выводу, что в нашей стране нельзя повторять ошибочный с технической точки зрения путь от персональных компьютеров к суперсистемам, а необходимо результаты разработки суперсистем использовать при создании всех классов машин, включая персональные. Создание собственной архитектуры, собственной элементной базы и собственного программного обеспечения суперсистем является абсолютно необходимым условием обеспечения стратегической независимости и гарантии непрерывного развития.

DOI: 10.7868/S0544126915030060

ВВЕДЕНИЕ

Создание вычислительных машин и систем с предельной производительностью началось в 60-х годах, однако термин суперкомпьютеры утвердился во второй половине 70-х. В дальнейшем развитие микроэлектроники обеспечило беспрецедентный рост производительности — от 1 млн операций в секунду в середине 60-х годов до 30 квадриллионов операций с плавающей запятой в секунду (30 РЯор8) в 2013 г. Такой рост производительности в 30 млрд раз был обеспечен как увеличением тактовой частоты. так и увеличением степени параллелизма. Современные суперкомпьютеры фактически являются большими системами, объединяющими сотни тысяч и миллионы процессоров. Элементная база вычислительных систем — это не только и не столько технология и методы проектирования БИС, но и конструкция всех узлов и устройств, межсоединения, системы питания и охлаждения. Успешная разработка и эффективное использование систем зависит от согласованного комплексного подхода к разработке элементной базы, архитектуры системы, ее системного и прикладного программного обеспечения. Кроме того, на развитие влияют такие факторы как совместимость аппаратного и программного обеспечения, области применения и условия эксплуатации систем, а также чисто экономические факторы. По мере роста производительности систем и объема их памяти возникают

условия для постановки таких задач, решение которых раньше было физически невозможно.

На первом этапе развития использовались навесные компоненты, воздушное охлаждение и скалярные процессоры. На втором этапе произошел переход к векторным процессорам, интегральным схемам и системам жидкостного охлаждения. Следующий этап связан с использованием скалярных микропроцессоров, разработанных первоначально для персональных компьютеров. На этом этапе были попытки создания систем на векторных процессорах, реализуемых на одном кристалле. В настоящее время в ряде систем кроме стандартных микропроцессоров используются т.н. акселераторы и сопроцессоры, предназначенные для более эффективного выполнения программ, имеющих параллелизм на уровне данных. В качестве акселераторов используются модернизированные графические процессоры и мульти-ядерные векторные процессоры. На следующем этапе ставится задача создания систем с производительностью 1000 РИор8 (1 БАор8). По мнению большинства экспертов необходима разработка новых подходов к созданию как элементной базы, так и архитектуры. Весьма важным фактором является энергетическая проблема, связанная как с необходимостью снижения общей мощности вычислительных систем, так и со снижением локального выделения тепла, что влияет на конструктивное оформление и в конечном итоге на

длины связей и быстродействие. Для достижения высокой эффективности систем необходима взаимная адаптация архитектуры и программ, в том числе обеспечение локальности данных в условиях многоуровневой иерархической структуры памяти. Объединение большого числа процессоров и машин и масштабирование системы связаны с построением сетевой структуры и системы управления, включая системное программное управление. Таким образом, создание оптимальной системы требует комплексного подхода.

Развитие вычислительной техники, в том числе и суперсистем зависит от целого ряда противоречивых тенденций.

Основой развития являются достижения технологии, зависящие от фундаментальных научных результатов. Успех применения этих достижений определяется инженерным искусством разработчиков.

При создании любой машины или системы должна быть определена основная цель. На противоположных сторонах всего диапазона целей находятся научный и инженерный прорыв и получение максимального дохода. Аналогично противопоставляются предельная производительность уникальных систем и сбыт массовой техники.

Создание архитектуры процессоров, машин и систем — это своего рода искусство достижения возможного за счет компромисса между технологией, аппаратурой, программами и целями использования. При этом неизбежен выбор между универсальными и специализированными подходами, между автоматической и ручной настройкой программ и собственно вычислений. К числу таких функций, которые могут быть автоматизированы относится локализация данных, для ее достижения используется кэш-память, программы операционной системы управления данными, управления обменом и обеспечения памяти одного уровня. Однако, во многих случаях настройка программ и локализация данных, выполняемая прикладным программистом оказывается значительно эффективнее. Необходимы специальные аппаратные и программные средства для такой ручной настройки. Аналогично оптимизация программ может выполняться как автоматически на уровне транслятора, так и самим программистом.

Одним из решающих факторов является требование обеспечения совместимости на уровне архитектуры и операционной системы. Однако, по мере роста масштабов систем и расширения сферы применения и необходимости проблемной ориентации сохранение совместимости становится сдерживающим фактором. В какой то степени это относится и к стандартизации, которая может сдерживать внедрение инноваций. В неко-

торых случаях совместимость и стандартизация приводят к укреплению монополии.

КРАТКАЯ ИСТОРИЯ

Чтобы представить перспективы развития необходимо рассмотреть особенности конструкции и архитектуры самых высокопроизводительных систем в историческом контексте.

Система CDC 6600 фирмы Control Data Corporation, выпущенная в 1965 г., была ориентирована на достижение высокой эффективности при решении научно-технических задач [1]. Система команд центрального процессора достаточно простая, причем все функции управления и ввода-вывода перенесены на периферийные процессоры. Это позволило упростить структуру центрального процессора и повысить тактовую частоту до 10 МГц. Команды обработки — трехадресные, операнды размещаются на адресуемых регистрах. Имеется 10 функциональных устройств, которые могут параллельно выполнять операции. 10 периферийных процессоров реализованы виртуально — фактически мультиплексное устройство выделяет каждому процессору один такт (100 нс) в каждом цикле обслуживания 10 процессоров. Конструкция основана на использовании компактных модулей, в которых размещаются схемы на 64 кремниевых транзисторах. Этажерочная конструкция модуля обеспечила максимальную плотность компоновки. В машине использовалась фреоновая система отвода тепла. Максимальная производительность по выполнению команд — 3 млн операций в с, производительность по выполнению операций с плавающей запятой — 1 Mflops. CDC 6600 считалась самой высокопроизводительной машиной с 1964 до 1969 гг., когда первенство перешло к CDC 7600.

Машина БЭСМ-6 предназначалась для решения крупных научно-технических задач [2]. К особенностям системы команд следует отнести одноадресную структуру команды, наличие операций с плавающей запятой, индекс-регистров для модификации адресов, двух форматов команд в зависимости от длины адреса. Хотя в ней и отсутствуют адресуемые регистры, система команд БЭСМ-6, так как и CDC 6600 ближе к системе RISC, что обеспечило большую эффективность оттранслированного кода.

В начале 60-х годов отечественной промышленностью были созданы высокочастотные транзисторы и диоды, на основе которых была разработана элементная база машины. В ее состав входили диодно-резисторные логические схемы и усилители на переключателях тока с подвешенным источником питания. Важными особенностями системы элементов являлись высокая скорость переключения и очень высокая нагрузоч-

ная способность как по входу, так и по выходу. Диодные и усилительные схемы размещались в специальных блоках, которые в свою очередь устанавливались в стойку с двух сторон. Внутри этого объема между диодными и усилительными блоками выполнялся монтаж. Такая конструкция обеспечивала компактное размещение блоков и сокращение длин связей. Наличие специальных блоков с вынесенными змиттерными повторителями позволяло к выходу одного усилителя подключать более 50 вентилей, т.е. управлять целым регистром. Параметры конструкции стоек были согласованы с форматом данных (длина слова 50 разрядов), с числом регистров в арифметическом устройстве и с объемом регистровой памяти. Размеры стоек обеспечивали передачу сигналов в стойке в пределах одного полутакта — 50 нс.

Система синхронизации обеспечивала возможность функционирования конвейера на тактовой частоте, что использовано в большинстве схем, в частности, в арифметическом устройстве и в устройстве управления. На следующем уровне темп конвейера определялся циклом работы буферной памяти, который равен трем тактам. Этот цикл соответствует и максимальному темпу пос

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком