Какая компания первая выпустила суперкомпьютер с распараллеливанием операций

Суперкомпьютером в современном мире принято называть специализированные вычислительные машины, которые по своим техническим параметрам и достигаемой скорости вычисления превосходят большинство существующих на рынке ЭВМ.

Аналоговая-Вычислительная-Машина-МН-10
(Аналоговая-Вычислительная-Машина-МН-10. Автор: Snatl)

Согласно первой версии, почти век назад, в 20-х годах ХХ века, популярная газета New York World рассказала своим читателям о табуляторе* IBM. Он был создан по заказу Колумбийского университета и занимался «супервычислениями».

* Табулятор — электромеханическая машина, предназначенная для автоматической обработки числовой и буквенной информации, записанной на перфокартах.

Ранняя машина табулирования IBM
(Ранняя машина табулирования IBM. Автор: Stahlkocher)

Оказывается, что еще во время Второй Мировой Войны англичане смогли с помощью мощной на тот момент ЭВМ с быстродействием 25 тыс. символов в минуту взломать немецкие военные шифры.

А сразу после завершения военных действий в США отметили появление первого электронного вычислителя. Он назывался ENIAC, применялся для расчета таблиц стрельбы и был огромен: его вес составлял более 27 тонн.

Первая перфокарта Германа Холлерита
(Первая перфокарта Германа Холлерита для механических вычислительных машин, датированная 1895 годом)

По второй версии термин «суперкомпьютер» появился в начале 60-х годов прошлого века. Именно тогда специалисты Иллинойского университета реализовали идею параллельной вычислительной системы.  Проекту дали название SOLOMON.

Руководил этими исследованиями доктор Даниэль Слотник, а под его руководством работали такие известные изобретатели, как Джордж Майкл и Сидней Фернбачу. Нам сложно это представить, но этого момента компьютер мог выполнять только одну операцию, а вот после внедрения новинки стал в состоянии выполнять несколько задач одновременно. Это положительно влияло на его производительность.

стандартная перфокарта
(И стандартная перфокарта, использовавшаяся в электронно-вычислительных машинах — ЭВМ 2-й половины XX века)

Хронология развития суперкомпьютера

Дальнейшая хронология событий выглядит следующим образом:

  • 1965 год: Была выпущена первая ЭВМ, работающая на принципе параллельной вычислительной системы. Ее название – ILLIAC IV, производитель – компания Burroughs, заказчик – NASA. Отличительной чертой этого компьютера была высокая производительность – он выполнял 150 млн. операций с плавающей точкой в секунду (150 мегафлопсов).
  • 1974 год: Американец Сеймур Крей изобрел малогабаритную супер-ЭВМ под названием CRAY-1 производительностью 180 мегафлопсов. Она получила широкое распространение в проектах, финансируемых правительством, а также в промышленности.
  • 1985 год: Корпорация Fujitsu и компания NEC выпустили суперкомпьютеры, преодолевшие рубеж в миллион операций в секунду. FACOM VP-400 от Fujitsu работал со скоростью 1,14 гигафлопса в секунду, а NEC SX-2 – 1,13 гигафлопса.
  • 1990 год: Компания Intel разработала ЭВМ Intel iPSC/860. В нем было 128 процессов, а суммарная производительность превышала 2,6 гигафлопса.
  • 1996 год: Компания IBM применила при производстве компьютера кластерную систему, при которой несколько компьютеров оказались объединенными в единую систему. Его производительность достигала 3 терафлопсов.
  • Март 2002 года: Рейтинг всех суперкомпьютеров возглавил компьютер с производительностью 35,86 терафлопса. Он использовался в работе программы Earth Simulator, которая мониторила изменения климата и прогнозировала его изменения.
  • Июнь 2008 года: IBM представляет Roadrunner. Его максимальная производительность – 1,105 петафлопса.

Суперкомпьютер "Christofari"
(Суперкомпьютер «Christofari». Автор: SberCloud)

Сегодня суперкомпьютеры обладают высокой, порой поражающей воображение вычислительной мощностью. Они в состоянии решить сверхсложные задачи – например, прогнозировать улучшение или ухудшение погоды, а также моделирование ядерных испытаний.

Суперкомпьютер "Ломоносов"
(Суперкомпьютер «Ломоносов». Первый гибридный суперкомпьютер в России, установлен в НИВЦ МГУ. Автор: Надир)

Суперкомпьютер в культуре

СкайНет КибердайнСистемс
(Искусственный интеллект СкайНет из КибердайнСистемс, фильм «Терминатор»)

За всю историю существования понятия «суперкомпьютер», его возможности искусственного интеллекта будоражили воображение творческих людей, в результате чего было создано огромное количество, прежде всего, художественных фильмов фантастической направленности:

  • 1968 год: в прокат вышел фильм «2001 год: Космическая одиссея». Он считается величайшим научно-фантастических фильмом даже в настоящее время. Повествует о конфликте искусственного и естественного разумов.
  • 2008 год: Фильм «Железный человек». В главной роли – Роберт Дауни- младший. Снят по мотивам одноименным комиксов.
  •     В этом же году на суд зрителей вышел фильм «На крючке» (орлиный глаз). В том фильме суперкомпьютер решил, что деятельность правительства вредна для страны, и начал действовать самостоятельно.
  • 2012 год: Еще одни герои комиксов оказались экранизированы – на этот раз речь идет о «Мстителях». Супергерои, обладающие разными суперспособностями, по очереди спасаются нашу планету от неминуемой гибели.
  • 2013 год: «Тихоокеанский рубеж» с Гильермо дель Торо в главной роли. Фильм повествует и гигантских роботах, которые пилотируют военные.
  • 2014 год: Выходит еще один фильм на ту же тему под названием «Новый человек-паук: высокое напряжение».

Суперкомпьютер IBM
(Суперкомпьютер IBM)

Ну и, конечно, главные фильмы про искусственный интеллект, вышедший из под контроля – это трилогия «Матрица» и все части «Терминатора». Идея того, как суперкомпьютер собирается уничтожить все человечество, вызывает повышенный интерес, но и быть может за этим есть повод задуматься.

Первый суперкомпьютер

Время на прочтение
2 мин

Количество просмотров 19K

Сегодня суперкомпьютеры помогают человеку решать массу задач, в том числе прогнозировать погоду, расшифровывать ДНК и играть в «Свою игру». А первая вычислительная машина, которой подошло название «суперкомпьютер», в этом году празднует 40-летний юбилей. Это Cray-1.

image

Сеймур Крэй до начала работы над Cray-1 ушел из компании-производителя вычислительных машин CDC, став её прямым конкурентом. В работе над новой машиной было принято решение отказаться от транзисторов, выбрав интегральные микросхемы, а также отказаться от многопроцессорной системы в пользу векторного процессора. Вместо ферромагнитных сердечников было принято решение использовать полупроводники для памяти. Это привело к положительному результату: первые тесты системы показали производительность в 80х10*6 операций с плавающей запятой в секунду.

Пиковая производительность Cray-1 составляла 133 Мфлопса. Для сравнения — нынешний номер 1 в рейтинге ТОП500 суперкомпьютеров, Тяньхэ-2, обладает вычислительной мощностью в 33,86 Пфлопс.

Процессор машины представлял собой 500 печатных плат, на которых располагались по 144 микросхемы с обеих сторон. Итого было 144 тысячи микросхем. Для охлаждения машины использовался фреон.

image

Система питания.

image

Как стойка выглядит изнутри.

image

Как думаете, кто купил этот суперкомпьютер? Как и в случае с этим компьютером за 97 миллионов фунтов, одними из первых о необходимости приобретения такой мощной машины подумала национальная метеослужба. Так что Национальный Центр Атмосферных исследований США отдал за право пользоваться суперкомпьютером Cray-1 с серийным номером 003 целых 8,86 миллионов долларов. Сейчас, если верить этому калькулятору, эта сумма равняется примерно $39,784,472 с копейками. Так что жители США обязаны прогнозом погоды с 1977 по 1989 годы именно этой машине.

Сеймур Крэй представляет один из первых суперкомпьютеров в Калифорнийском Университете в Беркли.

Cray-1 в немецком музее.

image

Суперкомпьютеры, о которых уже говорилось на страницах нашего сайта, выполняют поистине титаническую работу — делают сверхточные прогнозы погоды, моделируют сложные физические процессы, помогают в разработке новых удобрений и лекарств. И, конечно же, как и у всего в природе, у эры суперкомпьютеров есть своё начало и свой путь развития. Так как же появились и как развивались эти колоссы компьютерного мира? Чтобы ответить на этот вопрос, нам придётся заглянуть на полстолетия в прошлое, во времена, когда компьютеры уже переставали быть единичным товаром, но до массового их распространения было ещё очень и очень далеко.

Начало развития

Суперкомпьютер CDC-6600Как и в любой истории, в истории суперкомпьютеров не обошлось без своей выдающийся личности. В 1964 году свет увидел первый суперкомпьютер в истории — CDC 6600 производства Control Data Corporation. Руководил работами по созданию этого технического чуда 60-х годов Сеймур Крей, талантливый инженер и негласный «отец суперкомпьютеров». Его CDC 6600 с невиданной по меркам того времени производительностью в 1 МФЛОПС (один миллион операций с плавающей точкой в секунду) вплоть до 1969 года оставался самым мощным и самым совершенным компьютером. В 1969-ом же лавры главного суперкомпьютера планеты перешли к модели CDC 7600 производства всё того же Сеймура Крея. Новая машина была в десять раз производительнее своего предка, что делало её незаменимой для выполнения сложных и трудоёмких расчётов.

Однако Крею было некомфортно в стенах Control Data Corporation. В 1972 году он уходит из CDC, чтобы основать собственную компанию по производству суперкомпьютеровCray Research. Уже через четыре года выходит компьютер, который прославил как самого Сеймура Крея, так и его компанию — Cray-1. Это почти шеститонное чудовище с производительностью в 160 МФЛОПС взорвало компьютерный мир того времени и вошло в школьные учебники по информатике. До сих пор именно «Крей-1» приходит нам на ум, когда мы говорим о суперкомпьютерах.

Суперкомпьютер Cray-2На этом Cray Research не остановилась. Через пять лет был выпущен первый мультипроцессорный суперкомпьютерCray X-MP, ну а в 1985 году компьютер Cray-2 преодолел планку в один ГФЛОПС, причём сделал это с ну очень серьёзным запасом — почти два миллиарда операций в секунду помогли Cray-2 удержать преимущество на рынке суперкомпьютеров.

Однако не стоит думать, что на этом рынке присутствовала лишь компания Крея. Наоборот, удешевление компьютерной техники в 80-х годах прошлого столетия открыло дорогу в мир суперкомпьютерной индустрии большому числу небольших независимых компаний; как следствие, возросла конкуренция, а, следовательно, скорость прогресса увеличилась. Однако в 1990-х на данном рынке произошёл серьёзный кризис, связанный с изменением геополитической обстановки в мире. Распад СССР и окончание «холодной войны» привели к резкому сокращению заказов от военных инстанций США и стран НАТО. А ведь именно военные были основными покупателями суперкомпьютеров: моделирование ядерных взрывов, расшифровка секретных сообщений вероятного противника и прочие не слишком мирные задачи требовали солидных вычислительных мощностей. Впрочем, вскоре мечи были перекованы на орала, и суперкомпьютеры стали в массовом порядке закупаться различными «мирными» исследовательскими центрами, НИИ и лабораториями.

Суперкомпьютеры в Стране Советов

Перед тем, как приступить к описанию событий, произошедших в мире сверхпроизводительных компьютеров, вернёмся обратно в 60-е, только теперь по нашу сторону «железного занавеса», то есть в СССР. Надо сказать, что тут у нас есть поводы для гордости: по заверениям как отечественных, так и зарубежных исследователей, советская компьютерная промышленность в начале своего развития не отставала от западной, а во многом даже и превосходила её. Однако в рамках данной статьи нас интересует не вся компьютерная индустрия СССР, а только её, так сказать, «суперкомпьютерная» часть.

Суперкомпьютер BESM-6Итак, первым отечественным суперкомпьютером является БЭСМ-6, выпущенный в 1967 году под руководством, безусловно, гениального инженера Сергея Алексеевича Лебедева. Данная машина, по формальной производительности сопоставимая с CDC 6600, реально намного превосходила своего иностранного конкурента. В данном компьютере было заложено так много инновационных решений, что её производство продолжалось на протяжении двадцати лет! Попытка американских инженеров создать что-либо совершеннее БЭСМ-6, носившая имя ILLIAC-IV, окончилась неудачей: данный суперкомпьютер оказалась дороже, сложнее и медленнее «русской машины». БЭСМ-6 не была единственным советским суперкомпьютером. В последние годы своей жизни Лебедев руководил работами по созданию многопроцессорного комплекса «Эльбрус«, однако в 1974 году смерть помешала ему увидеть результаты своих трудов. Работы над первым компьютером серии «Эльбрус» завершились в 1979 году, и, хотя по производительности он, равно как и другие компьютеры серии, отставали от зарубежных аналогов, в его процессоре впервые была применена технология суперскалярности. Суперскалярная архитектура, то есть технология параллельного выполнения нескольких команд, независимых друг от друга, вскоре была реализована в большинстве процессоров для персональных компьютеров; таким образом, в процессорах Intel и AMD есть частичка нашего, русского, инженерного знания.

Увы, перестройка, раскол Советского Союза и последовавшие за ним события крайне негативно — если не сказать «губительно», — отразились на отечественной суперкомпьютерной промышленности. Прощальным приветом отечественных инженеров-электронщиков можно считать появившийся в 1990-х процессор Elbrus 2000 (E2K) , который так и не смог выйти на рынок: сначала помешал кризис, ну а затем, когда казалось, что «вот уже чуть-чуть», команду «Эльбруса» на корню купила Intel. На данный момент все существующие в России суперкомпьютеры либо зарубежного производства, либо основаны на зарубежных комплектующих и технологиях.

Мощнее и быстрее: суперкомпьютеры наших дней

Вот на такой, увы, пессимистичной ноте мы возвращаемся на Запад, чтобы продвинуться далее по временной шкале. Оправившись от кризиса, индустрия производства суперкомпьютеров принялась за штурм новых высот. В 1997 году был создан суперкомпьютер ASCI RED, обладавший неслыханной тогда производительностью в 1,34 ТФЛОПС. Однако самое интересное, что данный компьютер был построен на базе почти что десяти тысяч процессоров Pentium II — да-да, тех самых, которых можно было спокойно найти в любом топовом ПК тех лет. Подобная система объединения вычислительных мощностей относительно недорогих процессоров получила название Massively Parallel Processing, или просто MPP. Преимущество MPP-систем — в их гибкости: незагруженные процессорные блоки можно легко отключить, а по возможности — включить заново, а вдобавок подключить дополнительные. На данный момент большинство суперкомпьютеров было построено именно на базе данной технологии.

Суперкомпьютер Supercomputer KОднако вернёмся к теме. Шло время, и производители выпускали всё более и более новые суперкомпьютеры, которые задавали новые стандарты производительности. Символический барьер в один ПФЛОПС (читается «пентафлопс»; 1 ПФЛОПС = 1000 ТФЛОПС) был преодолён в 2008 году компьютером Roadrunner от IBM. Характеристики данной машины, мягко говоря, шокируют: почти 100 Тб оперативной памяти, около 20 000 процессоров… Удивляет и то, что всё это работает под управлением Linux-систем Red Hat и Fedora, причём тех же самых версий, что устанавливаются на домашние компьютеры.

Однако Roadrunner не является самым быстрым суперкомпьютером на сегодняшний день. Согласно рейтингу самых мощных компьютеров Top-500, наиболее производительным является японский суперкомпьютер K производства Fujitsu, запущенный в эксплуатацию незадолго до написания этих строк. Этот 70 000-процессорный гигант (причём процессоры, стоит заметить, все до одного восьмиядерные) на момент написания статьи обладал безумной производительностью в 8,162 ПФЛОПС. Даже не хватает воображения, что бы представить, чем же можно нагрузить подобную махину. Впрочем, на это есть учёные — перед ними стоят ещё очень много неразрешённых вопросов.

Вывод

Смотря на звёзды на ночном небе, мы заглядываем в прошлое, ну а смотря на современные суперкомпьютеры, мы смотрим в будущее. Так, дорогой, но, в принципе, общедоступный ПК сегодняшнего дня может решить все те же задачи, что решал стоящий безумных денег суперкомпьютер в 1990-х. Многоядерность и многопроцессорность, 64-битная архитектура, системы водяного охлаждения — всё это было сначала установлено и опробовано на суперкомпьютерах, а только потом уже перебралось на компьютеры персональные. Кто знает, может быть, в году этак в 2030-м или 2040-м под столом у секретарши в офисе будут работать двадцать тысяч процессоров?

Основная заслуга суперкомпьютеры переходит к изобретателю CDC -6600 Сеймуру Крей. В история суперкомпьютеров восходит к началу 1920-х годов в Соединенных Штатах с табуляторами IBM на Колумбийский университет и серия компьютеров на Корпорация Control Data (CDC), разработанный Сеймур Крей использовать новаторские разработки и параллелизм для достижения максимальной вычислительной производительности.[1] В CDC 6600, выпущенный в 1964 году, вообще считается первым суперкомпьютером.[2][3] Однако некоторые более ранние компьютеры считались суперкомпьютерами для своего времени, например, 1954 г. IBM NORC,[4] 1960 год UNIVAC LARC,[5] и IBM 7030 Stretch[6] и Атлас, оба в 1962 году.

В то время как суперкомпьютеры 1980-х годов использовали всего несколько процессоров, в 1990-х годах машины с тысячами процессоров начали появляться как в Соединенных Штатах, так и в Японии, устанавливая новые рекорды вычислительной производительности.

К концу 20-го века были построены суперкомпьютеры с массовым параллелизмом и тысячами готовых процессоров, подобных тем, что используются в персональных компьютерах. терафлоп вычислительный барьер.

Прогресс в первом десятилетии 21 века был значительным, и появились суперкомпьютеры с более чем 60 000 процессорами, достигнув петафлоп уровни производительности.

Начало: 1950-е и 1960-е годы.

Термин «суперкомпьютеры» впервые был использован в Нью-Йорк Уорлд в 1929 году для обозначения больших табуляторов, изготовленных на заказ, которые IBM сделал для Колумбийский университет.

В 1957 году группа инженеров покинула Sperry Corporation формировать Корпорация Control Data (CDC) в Миннеаполис, Миннесота. Сеймур Крей покинул Сперри год спустя, чтобы присоединиться к своим коллегам из CDC.[1] В 1960 году Крей завершил CDC 1604, один из первых твердое состояние компьютеры и самый быстрый компьютер в мире[сомнительный – обсуждать] в то время, когда вакуумные трубки были обнаружены в большинстве больших компьютеров.[7]

Приблизительно в 1960 году Крей решил разработать компьютер, который с большим отрывом будет самым быстрым в мире. После четырех лет экспериментов вместе с Джимом Торнтоном, Дином Рушем и примерно 30 другими инженерами Крей завершил разработку CDC 6600 в 1964 году. Cray перешел с германиевых на кремниевые транзисторы, построенные Fairchild Semiconductor, который использовал планарный процесс. У них не было недостатков мезасремниевых транзисторов. Он запускал их очень быстро, и ограничение скорости света привело к очень компактной конструкции с серьезными проблемами перегрева, которые были решены путем внедрения охлаждения, разработанного Дином Роушем.[8] Учитывая, что 6600 опережал все компьютеры того времени примерно в 10 раз, его окрестили суперкомпьютер и определил рынок суперкомпьютеров, когда двести компьютеров были проданы по 9 миллионов долларов каждый.[7][9]

6600 набирает скорость за счет передачи работы периферийным вычислительным элементам, освобождая центральный процессор (CPU) для обработки фактических данных. Миннесота FORTRAN компилятор для машины был разработан Лиддиардом и Мундстоком в Университет Миннесоты и с ним 6600 может выдерживать 500 килофлопс на стандартных математических операциях.[10] В 1968 году Крей завершил CDC 7600, снова самый быстрый компьютер в мире.[7] В 36 летМГц, 7600 имел в 3,6 раза больше Тактовая частота 6600, но работал значительно быстрее за счет других технических новшеств. Они продали всего около 50 из 7600, что не совсем провал. Крей покинул CDC в 1972 году, чтобы основать собственную компанию.[7] Через два года после его отъезда CDC доставил ЗВЕЗДА-100 что на 100 мегафлопс было в три раза быстрее, чем у 7600. Наряду с Техасские инструменты ASC, STAR-100 была одной из первых машин, которые использовали векторная обработка — идея была вдохновлена ​​примерно в 1964 г. Язык программирования APL.[11][12]

Манчестерский университет Атлас в январе 1963 г.

В 1956 г. Манчестерский университет в Соединенном Королевстве началась разработка MUSE — названия, производного от микросекунда двигатель — с целью в конечном итоге создать компьютер, который мог бы работать со скоростью обработки, приближающейся к одной микросекунде на инструкцию, около миллиона инструкций в секунду.[13] Му (или же µ) — это приставка в СИ и других системах единиц, обозначающая коэффициент 10.−6 (одна миллионная).

В конце 1958 года Ферранти согласился начать сотрудничество с Манчестерским университетом над проектом, и вскоре компьютер был переименован. Атлас, с совместным предприятием под контролем Том Килберн. Первый Atlas был официально введен в эксплуатацию 7 декабря 1962 года, почти за три года до того, как был представлен суперкомпьютер Cray CDC 6600, как один из первых в мире суперкомпьютеры — и считался самым мощным компьютером в Англии и в течение очень короткого времени считался одним из самых мощных компьютеров в мире, эквивалентным четырем IBM 7094s. Было сказано, что всякий раз, когда Atlas отключался, половина компьютерных мощностей Соединенного Королевства терялась.[14] Атлас первым начал использовать виртуальная память и пейджинг как способ расширить рабочую память Атласа, объединив 16 384 основных слова основная память с дополнительными 96 тыс. слов вторичного барабанная память.[15] Атлас также был пионером Атлас Супервайзер «, который многие считают первым узнаваемым современным Операционная система «.[14]

Эпоха Cray: середина 1970-х и 1980-е годы.

С жидкостным охлаждением Крей-2 суперкомпьютер

Через четыре года после ухода из CDC Cray поставил 80 МГц Крей-1 в 1976 году, и он стал самым успешным суперкомпьютером в истории.[12][16] В Cray-1 использовались интегральные схемы с двумя вентилями на кристалл, и он был векторный процессор который ввел ряд нововведений, таких как цепочка в котором скалярные и векторные регистры генерируют промежуточные результаты, которые можно использовать немедленно, без дополнительных ссылок на память, которые снижают скорость вычислений.[8][17] В Cray X-MP (разработано Стив Чен ) был выпущен в 1982 году как общая память 105 МГц. параллельно векторный процессор с улучшенной поддержкой цепочки и несколькими конвейерами памяти. Все три конвейера с плавающей запятой на X-MP могли работать одновременно.[17] К 1983 году Cray и Control Data были лидерами среди суперкомпьютеров; несмотря на свое лидерство на компьютерном рынке в целом, IBM не смогла создать прибыльного конкурента.[18]

В Крей-2 выпущен в 1985 г. был 4-х процессорным с жидкостным охлаждением компьютер полностью погружен в резервуар Флюоринерт, который пузырился во время работы.[8] Он мог работать до 1,9 гигафлопса и был вторым по скорости суперкомпьютером в мире после M-13 (2,4 гигафлопса).[19] до 1990 года, когда ETA-10G[нужна цитата ] от CDC обогнали обоих. Cray-2 был полностью новым дизайном, в нем не использовалась цепочка и была высокая задержка памяти, но использовалась большая конвейерная обработка, и он идеально подходил для задач, требующих большого количества памяти.[17] Стоимость программного обеспечения при разработке суперкомпьютера не следует недооценивать, о чем свидетельствует тот факт, что в 1980-х годах затраты на разработку программного обеспечения в Cray были равны затратам на оборудование.[20] Отчасти эта тенденция стала причиной ухода от внутреннего, Операционная система Cray к UNICOS на основе Unix.[20]

В Крей Y-MP, также разработанный Стивом Ченом, был выпущен в 1988 году как усовершенствование X-MP и мог иметь восемь векторные процессоры на частоте 167 МГц с максимальной производительностью 333 мегафлопса на процессор.[17] В конце 1980-х годов эксперимент Крея по использованию арсенид галлия полупроводники в Крей-3 не удалось. Сеймур Крей начал работать над массивно параллельный компьютер в начале 1990-х, но погиб в автокатастрофе в 1996 году, не успев завершить работу. Однако Cray Research производила такие компьютеры.[16][8]

Массовая переработка: 1990-е годы

В Крей-2 который устанавливал границы суперкомпьютеров в середине-конце 1980-х годов, имел всего 8 процессоров. В 1990-е годы начали появляться суперкомпьютеры с тысячами процессоров. Еще одним событием в конце 1980-х годов стало появление японских суперкомпьютеров, некоторые из которых были созданы по образцу Cray-1.

Задняя часть Идеал шкаф, показывающий шины и сеточные маршрутизаторы

В SX-3 / 44R было объявлено Корпорация NEC в 1989 году, а год спустя получил звание самого быстрого в мире с моделью с 4 процессорами.[21] Однако Fujitsu Цифровая аэродинамическая труба Суперкомпьютер использовал 166 векторных процессоров, чтобы занять первое место в 1994 году. Его пиковая скорость составляла 1,7 гигафлопс на процессор.[22][23] В Hitachi SR2201 с другой стороны, в 1996 году была достигнута пиковая производительность 600 гигафлопс за счет использования 2048 процессоров, подключенных через быстрый трехмерный перекладина сеть.[24][25][26]

В тот же период Intel Paragon могло быть от 1000 до 4000 Intel i860 процессоров в различных конфигурациях и был признан самым быстрым в мире в 1993 году. Paragon был MIMD машина, которая соединяет процессоры через высокоскоростную двумерную сетку, позволяя процессам выполняться на отдельных узлах; общение через Интерфейс передачи сообщений.[27] К 1995 году Cray также поставляла массивно-параллельные системы, например то Cray T3E с более чем 2000 процессоров, используя трехмерный тороидальное соединение.[28][29]

Архитектура Paragon вскоре привела к появлению Intel ASCI Красный суперкомпьютер в Соединенных Штатах, который до конца 20 века занимал лидирующее место среди суперкомпьютеров как часть Advanced Simulation and Computing Initiative. Это также была массивно-параллельная система MIMD на основе сетки с более чем 9000 вычислительных узлов и более 12 терабайт дисковой памяти, но использовавшаяся в готовом виде. Pentium Pro процессоры, которые можно найти в повседневных персональных компьютерах. ASCI Red была первой системой, преодолевшей барьер в 1 терафлоп на MP-Linpack ориентир в 1996 г .; в итоге достигнув 2 терафлопс.[30]

Петафокальные вычисления в 21 веке

Значительный прогресс был достигнут в первом десятилетии 21 века. Эффективность суперкомпьютеров продолжала расти, но не так резко. В Cray C90 в 1991 году потребляли 500 киловатт электроэнергии, а к 2003 году ASCI Q потреблял 3000 кВт, будучи в 2000 раз быстрее, увеличивая производительность на ватт в 300 раз.[31]

В 2004 г. Симулятор Земли суперкомпьютер построен NEC в Японском агентстве морской науки и технологий (JAMSTEC) достигла 35,9 терафлопс при использовании 640 узлов, каждый с восемью собственными векторные процессоры.[32] Для сравнения, по состоянию на 2020 год сингл NVidia RTX 3090 видеокарта может обеспечить сопоставимую производительность при 35 терафлопс на карту.[33]

В IBM Синий ген суперкомпьютерная архитектура нашла широкое распространение в начале 21 века, и 27 компьютеров на TOP500 list использовал эту архитектуру. Подход Blue Gene несколько отличается тем, что в нем используется скорость процессора в обмен на низкое энергопотребление, поэтому при температурах воздушного охлаждения можно использовать большее количество процессоров. Он может использовать более 60 000 процессоров, по 2048 процессоров «на стойку», и соединяет их через трехмерное межсоединение типа тор.[34][35]

Прогресс в Китай был быстрым: Китай занял 51-е место в списке TOP500 в июне 2003 г., затем 14-е место в ноябре 2003 г., 10-е место в июне 2004 г. и затем 5-е место в течение 2005 г., а затем занял первое место в 2010 г. с показателем 2,5 петафлоп. Тяньхэ-I суперкомпьютер.[36][37]

В июле 2011 г. японская K компьютер стал самым быстрым в мире, использовав более 60 000 SPARC64 VIIIfx процессоры размещены в более чем 600 шкафах. Тот факт, что компьютер K более чем в 60 раз быстрее, чем Earth Simulator, и что Earth Simulator занимает 68-е место в мире через семь лет после того, как он занял первое место, демонстрирует как быстрое увеличение максимальной производительности, так и повсеместный рост суперкомпьютерных технологий. Мировой.[38][39][40] К 2014 году Earth Simulator выпал из списка, а к 2018 году компьютер K выпал из первой десятки. К 2018 году Саммит стал самым мощным суперкомпьютером в мире со скоростью 200 петафлопс.

Историческая таблица TOP500

Это список компьютеров, которые оказались вверху Топ500 список с 1993 года.[41] «Пиковая скорость» обозначается как рейтинг «Rmax».

Быстрый рост производительности суперкомпьютеров, по данным сайта top500.org. Логарифмический у-axis показывает производительность в GFLOPS.

  Совместная производительность 500 крупнейших суперкомпьютеров

  Самый быстрый суперкомпьютер

  Суперкомпьютер на 500 месте

Год Суперкомпьютер Пиковая скорость
(Rmax)
Место расположения
1993 Fujitsu Цифровая аэродинамическая труба 124,50 ГФЛОПС Национальная аэрокосмическая лаборатория, Токио, Япония
1993 Intel Идеал XP / S 140 143,40 ГФЛОПС Национальные лаборатории DoE-Sandia, Нью-Мексико, Соединенные Штаты Америки
1994 Fujitsu Цифровая аэродинамическая труба 170,40 ГФЛОПС Национальная аэрокосмическая лаборатория, Токио, Япония
1996 Hitachi SR2201 /1024 220,4 ГФЛОПС Токийский университет, Япония
Hitachi CP-PACS /2048 368,2 гигафлопс Университет Цукуба, Цукуба, Япония
1997 Intel ASCI Красный /9152 1,338 терафлопс Национальные лаборатории DoE-Sandia, Нью-Мексико, Соединенные Штаты Америки
1999 Intel ASCI Красный /9632 2,3796 терафлопс
2000 IBM ASCI Белый 7,226 терафлопс DoE-Lawrence Ливерморская национальная лаборатория, Калифорния, Соединенные Штаты Америки
2002 NEC Симулятор Земли 35,86 терафлопс Центр симуляторов Земли, Иокогама, Япония
2004 IBM Синий Джин / L 70,72 терафлопс DoE /IBM Рочестер, Миннесота, Соединенные Штаты Америки
2005 136,8 терафлопс DoE /Национальное управление ядерной безопасности США,
Национальная лаборатория Лоуренса Ливермора, Калифорния, Соединенные Штаты Америки
280,6 терафлопс
2007 478,2 терафлопс
2008 IBM Roadrunner 1.026 ПФЛОПС Национальная лаборатория DoE-Los Alamos, Нью-Мексико, Соединенные Штаты Америки
1,105 пфлопс
2009 Cray Ягуар 1,759 пфлопс Национальная лаборатория DoE-Oak Ridge, Теннесси, Соединенные Штаты Америки
2010 Тяньхэ-I А 2,566 пфлопс Национальный суперкомпьютерный центр, Тяньцзинь, Китай
2011 Fujitsu K компьютер 10,51 ПФЛОПС Рикен, Кобе, Япония
2012 IBM Sequoia 16.32 ПФЛОПС Национальная лаборатория Лоуренса Ливермора, Калифорния, Соединенные Штаты Америки
2012 Cray Титан 17,59 пфлопс Национальная лаборатория Окриджа, Теннесси, Соединенные Штаты Америки
2013 NUDT Тяньхэ-2 33,86 ПФЛОПС Гуанчжоу, Китай
2016 Sunway TaihuLight 93.01 ПФЛОПС Уси, Китай
2018 Саммит IBM 122,3 пфлопс Национальная лаборатория DoE-Oak Ridge, Теннесси, Соединенные Штаты Америки
2020 Фугаку 415,53 пфлопс Рикен, Кобе, Япония

Экспортный контроль

В CoCom и его более поздняя замена, Вассенаарская договоренность, регулируется законодательством — требуется лицензирование, согласование и учет; или полностью запрещены — экспорт высокопроизводительные компьютеры (HPC) в определенные страны. Такой контроль стало труднее оправдывать, что привело к ослаблению этих правил. Некоторые утверждали, что эти правила никогда не были оправданы.[42][43][44][45][46][47]

Смотрите также

  • Linpack
  • TOP500
  • Зеленый 500
  • ФЛОПЫ
  • Инструкций в секунду
  • Квазиоппортунистический суперкомпьютер
  • Архитектура суперкомпьютера
  • Суперкомпьютерные технологии в Китае
  • Суперкомпьютерные технологии в Европе
  • Суперкомпьютеры в Индии
  • Суперкомпьютеры в Японии
  • Суперкомпьютеры в Пакистане

Рекомендации

  1. ^ а б Чен, Сао-Цзе; Линь Гуан-Хуэй; Сюн, Пао-Анн; Ху, Ю-Хен (2009). Совместная разработка аппаратного и программного обеспечения мультимедийной платформы SOC. Springer Science + Business Media. С. 70–72. ISBN  9781402096235. Получено 20 февраля 2018.
  2. ^ Impagliazzo, Джон; Ли, Джон А. Н. (2004). История информатики в образовании. п. 172. ISBN  1-4020-8135-9. Получено 20 февраля 2018.
  3. ^ Сиссон, Ричард; Захер, Кристиан К. (2006). Средний Запад Америки: интерпретирующая энциклопедия. п. 1489. ISBN  0-253-34886-2.
  4. ^ Франк да Круз (25 октября 2013 г.) [2004 г.]. «IBM NORC». Получено 20 февраля 2018.
  5. ^ Лундстрем, Дэвид Э. (1984). Несколько хороших людей из UNIVAC. MIT Press. ISBN  9780735100107. Получено 20 февраля 2018.
  6. ^ Дэвид Лундстром, Несколько хороших людей из UNIVAC, стр. 90, LARC и STRETCH указаны как суперкомпьютеры.
  7. ^ а б c d Ханнан, Кэрин (2008). Биографический словарь штата Висконсин. С. 83–84. ISBN  978-1-878592-63-7. Получено 20 февраля 2018.
  8. ^ а б c d Мюррей, Чарльз Дж. (1997). Супермены. Wiley & Sons. ISBN  9780471048855.
  9. ^ Ceruzzi, Пол Э. (2003). История современных вычислений. MIT Press. п.161. ISBN  978-0-262-53203-7. Получено 20 февраля 2018.
  10. ^ Фриш, Майкл Дж. (Декабрь 1972 г.). «Замечания по алгоритму 352 [S22], алгоритму 385 [S13], алгоритму 392 [D3]». Коммуникации ACM. 15 (12): 1074. Дои:10.1145/361598.361914. S2CID  6571977.
  11. ^ Фосдик, Ллойд Дадли (1996). Введение в высокопроизводительные научные вычисления. MIT Press. п.418. ISBN  0-262-06181-3.
  12. ^ а б Хилл, Марк Дональд; Джуппи, Норман Пол; Сохи, Гуриндар (1999). Чтения по компьютерной архитектуре. С. 41–48. ISBN  978-1-55860-539-8.
  13. ^ «Атлас». Манчестерский университет. Архивировано из оригинал 28 июля 2012 г.. Получено 21 сентября 2010.
  14. ^ а б Лавингтон, Саймон Хью (1998). История компьютеров Manchester (2-е изд.). Суиндон: Британское компьютерное общество. С. 41–52. ISBN  978-1-902505-01-5.
  15. ^ Кризи, Р. Дж. (Сентябрь 1981 г.), «Происхождение системы разделения времени VM / 370» (PDF), Журнал исследований и разработок IBM, 25 (5), стр. 486
  16. ^ а б Рейли, Эдвин Д. (2003). Основные этапы развития информатики и информационных технологий. п.65. ISBN  1-57356-521-0.
  17. ^ а б c d Тохи, М. О .; Хоссейн, Мохаммад Аламгир (2003). Параллельные вычисления для обработки сигналов и управления в реальном времени. стр.201 -202. ISBN  978-1-85233-599-1.
  18. ^ Гринвальд, Джон (1983-07-11). «Колосс, который работает». Время. В архиве из оригинала от 14 мая 2008 г.. Получено 2019-05-18.
  19. ^ «Михаил Александрович Карцев — разработчик суперкомпьютеров для наблюдения за космосом». ICFCST. 2018 [1998]. Получено 20 февраля 2018.
  20. ^ а б Маккензи, Дональд (1998). Познавая машины: очерки технических изменений. С. 149–151. ISBN  0-262-63188-1.
  21. ^ Glowinski, R .; Личневский, А. (январь 1990 г.). Вычислительные методы в прикладных науках и технике. С. 353–360. ISBN  0-89871-264-5.
  22. ^ «Годовой отчет TOP500 за 1994 год». 1 октября 1996 г.
  23. ^ Hirose, N .; Фукуда, М. (1997). Численные исследования аэродинамической трубы (NWT) и CFD в Национальной аэрокосмической лаборатории. Материалы HPC-Asia ’97. Компьютерное общество IEEE. Дои:10.1109 / HPC.1997.592130.
  24. ^ Fujii, H .; Yasuda, Y .; Акаши, H .; Inagami, Y .; Кога, М .; Ishihara, O .; Кашияма, М .; Wada, H .; Сумимото, Т. (апрель 1997 г.). Архитектура и производительность массивно-параллельной процессорной системы Hitachi SR2201. Материалы 11-го Международного симпозиума по параллельной обработке. С. 233–241. Дои:10.1109 / IPPS.1997.580901.
  25. ^ Ивасаки, Ю. (январь 1998 г.). Проект CP-PACS. Nuclear Physics B — Proceedings Supplements. 60 (1–2). С. 246–254. arXiv:геп-лат / 9709055. Дои:10.1016 / S0920-5632 (97) 00487-8.
  26. ^ А.Дж. ван дер Стин, Обзор новейших суперкомпьютеров, публикация NCF, Stichting Nationale Computer Faciliteiten, Нидерланды, январь 1997 г.
  27. ^ Рид, Дэниел А. (2003). Масштабируемый ввод / вывод: достижение системного баланса. п. 182. ISBN  978-0-262-68142-1.
  28. ^ «Cray продает первый суперкомпьютер T3E-1350 компании PhillipsPetroleum» (Пресс-релиз). Сиэтл: Гейл Групп. Деловой провод. 7 августа 2000 г.
  29. ^ Agida, N.R .; и другие. (и др.) (март – май 2005 г.). «Сеть межсоединений Blue Gene / L Torus» (PDF). Журнал исследований и разработок IBM. 45 (2–3): 265. Архивировано с оригинал (PDF) 15 августа 2011 г.. Получено 9 февраля 2012.
  30. ^ Гринберг, Дэвид С. (1998). Хит, Майкл Т. (ред.). «Включение суперкомпьютеров в масштабе отдела». Алгоритмы параллельной обработки. 105: 323. ISBN  0-387-98680-4. Получено 20 февраля 2018.
  31. ^ Фэн, У-чунь (1 октября 2003 г.). «Доказательство эффективности суперкомпьютеров» (PDF). Журнал ACM Queue. 1 (7): 54–64. Дои:10.1145/957717.957772. S2CID  11283177. Архивировано из оригинал (PDF) 30 марта 2012 г.. Получено 6 февраля 2016.
  32. ^ Сато, Тэцуя (2004). «Симулятор Земли: роли и последствия». Nuclear Physics B: Proceedings Supplements. 129: 102. Дои:10.1016 / S0920-5632 (03) 02511-8.
  33. ^ «Характеристики NVIDIA GeForce RTX 3090». techradar.com.
  34. ^ Алмаси, Джордж; и другие. (и др.) (2005). Кунья, Хосе Кардосо; Медейрос, Педро Д. (ред.). Ранний опыт использования научных приложений на суперкомпьютере Blue Gene / L. Параллельная обработка Euro-Par 2005: 11-я Международная конференция Euro-Par. С. 560–567. ISBN  9783540319252.
  35. ^ Морган, Тимоти Прикетт (22 ноября 2010 г.). «IBM раскрывает 20 петафлопс BlueGene / Q super». Реестр.
  36. ^ Graham, Susan L .; Снир, Марк; Паттерсон, Синтия А. (2005). Ускоряемся: будущее суперкомпьютеров. п.188. ISBN  0-309-09502-6.
  37. ^ Вэнс, Эшли (28 октября 2010 г.). «Китай вырывает титул суперкомпьютера у США» Нью-Йорк Таймс. Получено 20 февраля 2018.
  38. ^ «Японский суперкомпьютер« К »- самый быстрый в мире». Телеграф. 20 июня 2011 г.. Получено 20 июн 2011.
  39. ^ «Японский компьютер K — самый мощный». Нью-Йорк Таймс. 20 июня 2011 г.. Получено 20 июн 2011.
  40. ^ «Суперкомпьютер« К компьютер »занимает первое место в мире». Fujitsu. Получено 20 июн 2011.
  41. ^ «Генератор подсписок». Top500. 2017 г.. Получено 20 февраля 2018.
  42. ^ «Сложности установки порогов экспортного контроля: компьютеры». Экспортный контроль и политика нераспространения (PDF). Издательство ДИАНА. Май 1994 г. ISBN  9781428920521.
  43. ^ Уолкотт, Питер; Гудман, Сеймур; Гомер, Патрик (ноябрь 1998 г.). «Экспортный контроль высокопроизводительных вычислений: навигация по неспокойным водам». Коммуникации ACM. Нью-Йорк, США. 41 (11): 27–30. Дои:10.1145/287831.287836. S2CID  18519822.
  44. ^ McLoughlin, Glenn J .; Фергюссон, Ян Ф. (10 февраля 2003 г.). Высокопроизводительные компьютеры и политика экспортного контроля (PDF) (Отчет).
  45. ^ Брюггер, Сет (1 сентября 2000 г.). «США пересматривают правила экспортного контроля компьютеров». Ассоциация по контролю над вооружениями.
  46. ^ «Экспортный контроль для высокопроизводительных компьютеров». 24 июня 2011 г.
  47. ^ Благдон, Джефф (30 мая 2013 г.). «США снимают санкции с экспорта компьютеров в Иран».

внешняя ссылка

  • Суперкомпьютеры (1960-1980-е годы) на Музей истории компьютеров

С момента появления первых вычислительных устройств их создатели пытались усовершенствовать свои творения, в частности, повысить их эффективность за счет увеличения производительности или изобрести новые устройства, более совершенные. Суперкомпьютеры работают очень быстро не только благодаря самой современной элементной базе, но и за счет принципиальных решений, заложенных в их архитектуру. Основную роль здесь играет принцип параллельной обработки данных, воплощающий идею одновременного (параллельного) выполнения нескольких действий. С аппаратной точки зрения для реализации параллельных систем напрашиваются две основные схемы. Первая — несколько отдельных систем, с локальной памятью и процессорами, взаимодействующих в какой-либо среде посредством посылки сообщений. Вторая — системы, взаимодействующие через разделяемую память. Существуют и промежуточные архитектуры, где память физически распределена, но логически общедоступна.

Можно перечислить ряд задач, предъявляющих высокие требования к производительности систем. Вот лишь краткий список отраслей, в которых не обойтись без использования высокопроизводительных вычислений HPC (High Performance Computing): автомобилестроение, авиационная промышленность, атомная промышленность, космические исследования, разведка нефти и газа, химическая промышленность, фармакология, прогноз погоды, сейсмическая разведка, системы принятия решений.[1]

Первый векторно-конвейерный компьютер Cray-1 появился в 1976 г. Архитектура его оказалась настолько удачной, что он дал начало целому семейству компьютеров PVP (Parallel Vector Processing). Название этому семейству дали два принципа, заложенных в архитектуре процессоров: конвейерная организация обработки потока команд и введение в систему команд набора векторных операций, которые позволяют работать с целыми массивами данных.

Длина одновременно обрабатываемых векторов у векторных компьютеров может составлять, например, 128, 256 и более элементов. Очевидно, что векторные процессоры должны иметь гораздо более сложную структуру и по сути дела содержать множество арифметических устройств. Основное назначение векторных операций состоит в том, чтобы распараллелить выполнение операторов цикла, в которых в основном и сосредоточена большая часть вычислительной работы. Для этого циклы подвергаются процедуре векторизации с тем, чтобы их можно было реализовать с использованием векторных команд. Как правило, это автоматически выполняют компиляторы при подготовке исполнимого кода программы. Поэтому изначально векторно-конвейерные компьютеры не требовали никакой специальной технологии программирования, что и стало решающим фактором в их успехе на компьютерном рынке. Тем не менее при написании циклов требовалось соблюдение некоторых правил с тем, чтобы компилятор мог их эффективно векторизовать.

Исторически это были первые компьютеры, к которым в полной мере было приложимо понятие «суперкомпьютер». Как правило, несколько векторно-конвейерных процессоров работали в режиме с общей памятью (SMP, Symmetric MultiProcessing), образуя вычислительный узел, а несколько таких узлов объединялись с помощью коммутаторов, образуя либо NUMA- (Non-Uniform Memory Access), либо MPP-систему. Основным параметром классификации параллельных компьютеров служит наличие общей (SMP) или распределенной памяти (MPP, Massive Parallel Processing). Нечто среднее между SMP и MPP представляют собой NUMA-архитектуры, где память физически распределена, но логически общедоступна. Кластерные системы представляют собой более дешевый вариант MPP. При поддержке команд обработки векторных данных говорят о векторно-конвейерных процессорах, которые, в свою очередь, могут объединяться в PVP-системы с использованием общей или распределенной памяти.

Суперкомпьютеры, разработанные по технологии MPP, объединяют большое число микропроцессоров — вплоть до нескольких тысяч, — соединяя каждый из них с локальным банком памяти посредством высокоскоростной коммутационной среды. Главная особенность систем с симметричной многопроцессорной архитектурой SMP — наличие общей физической памяти, разделяемой всеми процессорами (напомним, что в массивно-параллельной архитектуре MPP память физически разделена). В этом случае система строится из отдельных модулей, содержащих процессор, локальный банк операционной памяти, два коммуникационных процессора или сетевой адаптер, иногда жесткие диски и/или другие устройства ввода-вывода. Один коммутационный процессор обычно используется для передачи команд, другой — для передачи данных. По сути, такие модули представляют собой полнофункциональные компьютеры. Доступ к банку оперативной памяти из конкретного модуля имеют только процессоры того же модуля. Модули соединяются специальными коммуникационными каналами.

Гибридная архитектура NUMA воплощает в себе удобства систем с общей памятью и относительную дешевизну систем с раздельной памятью. Суть этой архитектуры состоит в особой организации памяти. Здесь память физически распределена по различным частям системы, оставаясь логически разделяемой, так что пользователь видит единое адресное пространство. Система формируется из однородных базовых модулей, состоящих из небольшого числа процессоров и блока памяти. Модули объединены с помощью высокоскоростного коммутатора. Поддерживается единое адресное пространство, аппаратно организован доступ к удаленной памяти, т. е. к памяти других модулей. При этом доступ к локальной памяти осуществляется в несколько раз быстрее, чем к удаленной. По существу архитектура NUMA представляет собой массивно-параллельную архитектуру, где в качестве отдельных вычислительных элементов выступают SMP-узлы.

Основной признак параллельно-векторных систем PVP — наличие специальных векторно-конвейерных процессоров, в которых предусмотрены команды однотипной обработки векторов независимых данных, эффективно выполняющиеся на конвейерных функциональных устройствах. Как правило, несколько таких процессоров работают одновременно над общей памятью (аналогично SMP) в рамках многопроцессорных конфигураций. Несколько таких узлов могут объединяться с помощью коммутатора.[2]

Большое разнообразие архитектур вычислительных систем породило естественное желание ввести для них какую-то классификацию. Эта классификация должна была однозначно относить ту или иную вычислительную систему к некоему классу, который, в свою очередь, должен достаточно полно ее характеризовать. Таких попыток предпринималось множество. Одна из первых классификаций, ссылки на которую чаще всего встречаются в литературе, была предложена М. Флинном в конце 60-х годов прошлого века. Она базируется на понятиях двух потоков: команд и данных. На основе числа этих потоков выделяется четыре класса архитектур: SISD (Single Instruction Single Data) — единственный поток команд и единственный поток данных, SIMD (Single Instruction Multiple Data) — единственный поток команд и множественные потоки данных, MISD (Multiple Instruction Single Date) — множественные потоки команд и единственный поток данных и, наконец, MIMD (Multiple Instruction Multiple Date) — множественные потоки команд и данных.

Суперкомпьютеры NEC SX

Типичным примером PVP-решений могут служить системы SX, которые создает подразделение корпорации NEC — HNSX Supercomputers ( http://www.sw.nec.co.jp ). Развитие PVP-архитектуры продолжается, а суперкомпьютеры на ее основе в ряде случаев существенно опережают конкурентов. NEC имеет давние традиции производства больших универсальных ЭВМ (достаточно упомянуть выпускавшиеся в 80-х годах мэйнфреймы ACOS). Примерно в то же время появились и первые суперкомпьютеры семейства SX. Процессоры в SX-1 имели пиковую производительность 570 MFLOPS. Во второй половине 80-х были разработаны NEC SX-2 со временем цикла 6 нс; пиковая производительность старшей модели SX-2 составила уже 1,3 GFLOPS. В 1989 г. была выпущена NEC SX-3 с пиковой производительностью центрального процессора около 5 GFLOPS, в состав которой входило до четырех процессоров. Основные характеристики одноузловых систем семейства SX приведены в табл. 1.

Таблица 1. Характеристики одноузловых систем NEC SX

Модель SX-2 SX-3 SX-4 SX-5 SX-6 SX-7
Число процессоров 1 4 32 16 8 32
Пиковая производительность на процессор, GFLOPS 1,3 5,5 2 8 8 8,83
Пиковая производительность системы, GFLOPS 1,3 22 64 128 64 282
Максимальная емкость оперативной памяти, Гбайт 0,256 2 16 128 64 256
Общая пропускная способность памяти, Гбайт/с 11 44 512 1024 256 1129
Пропускная способность памяти на процессор, Гбайт/с 11 22 16 64 32 35,3

К современному поколению суперкомпьютеров следует относить КМОП-cистемы NEC SX-5 и SX-6. Здесь следует напомнить, что многие суперкомпьютеры долгое время использовали ЭСЛ-технологию (транзисторы с эмиттерно-связанной логикой), которая отличается достаточно высоким энергопотреблением. Во многом именно благодаря применению КМОП-технологии системы SX-4 стали первыми в мире суперкомпьютерами PVP-архитектуры, работающими с воздушным, а не с жидкостным охлаждением. Современные полупроводниковые КМОП-микросхемы обеспечили не только более высокую степень интеграции, но и хорошую масштабируемость по частоте.

Когда NEC в 1995 г. анонсировала суперкомпьютеры SX-4, большинство специалистов в области высокопроизводительных вычислений считали, что этот суперкомпьютер станет последним «динозавром» векторной архитектуры. Однако сейчас, с появлением масштабируемых векторных систем, интерес пользователей к векторным архитектурам возвращается. Кстати, на момент выпуска модель SX-4 показала производительность на уровне 1 TFLOPS.

Начинка суперкомпьютера SX-4A.

Начинка суперкомпьютера SX-4A.

Суперкомпьютеры различных поколений NEC совместимы снизу вверх. К основным компонентам архитектуры NEC SX относятся центральный процессор, подсистема оперативной памяти и подсистема ввода-вывода. Эти компоненты объединяются в узлы SMP-архитектуры, которые, в свою очередь, связаны через межсоединение Internode Crossbar Switch (IXS). Вся память всех узлов является общей; иными словами, многоузловые модели SX имеют архитектуру NUMA.

Каждый центральный процессор в NEC SX состоит из двух основных блоков: векторного и скалярного устройств. В архитектуре SX имеются операционные векторные регистры (над ними выполняются основные команды) и векторные регистры данных. В большинстве случаев применение векторных регистров позволяет заметно уменьшить трафик при обмене данными между центральным процессором и оперативной памятью.

Исполнительные блоки векторного устройства конвейеризованы. Основные конвейеры в SX — блоки сложения/сдвига, умножения, деления и логических операций. Как характерно для многих PVP-систем, операции над векторами могут выполняться при участии маски, для чего в архитектуре предусмотрено наличие регистров маски.

Скалярное устройство в SX содержит кэш данных и кэш команд, а также 64-разрядные регистры общего назначения. Так, для SX-5 размеры указанной кэш-памяти составляют по 64 Кбайт, а число регистров общего назначения равно 128. Все команды выдает на исполнение скалярное устройство, способное декодировать до четырех команд за такт. Например, как скалярное, так и векторное устройства SX-5 оперируют с 32- и 64-разрядными числами с плавающей точкой в формате IEEE. Скалярное устройство SX-5 поддерживает также 128-разрядные числа расширенной точности.

В составе процессора, кроме основных блоков — скалярного и векторного, можно также выделить интерфейс с оперативной памятью и так называемые коммуникационные регистры. Они служат в первую очередь для обеспечения синхронизации при распараллеливании задач.

Подсистема памяти SMP-узлов SX доступна процессорам через неблокирующийся коммутатор. Так, каждая плата памяти SX-5 может иметь емкость 4 Гбайт, а весь 16-процессорный узел — до 128 Гбайт. Вся оперативная память разбита на банки. Платы памяти SX умеют обрабатывать запросы к оперативной памяти во внеочередном порядке, что повышает эффективную пропускную способность при наличии конфликтов по обращению к банку памяти. Конвейерная выдача данных из памяти, поддержка переупорядочения запросов к памяти для уменьшения конкуренции из-за доступа к ней, наличие аппаратных средств, позволяющих скрыть задержки при обращении к оперативной памяти, — все это обеспечивает высокую реальную пропускную способность памяти.

В NEC SX используется страничная адресация оперативной памяти. За счет этого программные модули могут загружаться в несмежные области физической оперативной памяти, т. е. устраняются проблемы фрагментации. IXS обеспечивает работу с таблицами страниц при глобальной адресации оперативной памяти, с коммуникационными регистрами и командами глобальной пересылки данных.

Основные блоки подсистемы ввода-вывода в NEC SX — специализированные процессоры. Эти функциональные устройства разгружают центральный процессор от непосредственного управления вводом-выводом. Стоит отметить, что в NEC SX-5 пропускная способность процессоров ввода-вывода была увеличена вдвое по сравнению с SX-4 и составляет около 3,2 Гбайт/с. SMP-узел SX-5 может содержать до четырех таких устройств. Каждое из них способно поддерживать работу многих каналов ввода-вывода при наличии соответствующих канальных плат. Основные типы канальных карт в SX — HIPPI-800 (100 Мбайт/с), FC-AL (1 Гбит/с) и Ultra SCSI.

Серия SX-5

Эти суперкомпьютеры предназначены для крупномасштабных параллельных вычислений, что обеспечивается набором параллельно работающих узлов, каждый из которых, в свою очередь, представляет собой полноценный векторно-конвейерный SMP-суперкомпьютер.

Суперкомпьютер SX-5.

Суперкомпьютер SX-5.

Каждый узел в максимальной конфигурации предоставляет вычислительную производительность до 128 GFLOPS, объем основной памяти до 128 Гбайт и пропускную способность каналов ввода-вывода до 12,6 Гбайт/с. Специалисты отмечают, что таких показателей не имела ранее ни одна система с разделяемой памятью; стоит лишь сказать, что производительность обменов с памятью для полного узла достигает 1 Тбайт/с. В узел встроено достаточное количество независимых банков памяти, чтобы минимизировать конфликты, связанные с использованием микросхем памяти между 16 индивидуальными процессорами (с пиковой векторной производительностью 8 GFLOPS каждый). Скалярная производительность достигает 500 MFLOPS. Системы SX-5 используют высокоскоростной неблокирующий коммутатор IXS, чтобы связать между собой до 32 таких узлов. В этом случае пиковая производительность может достигать 4 TFLOPS.

В системах семейства SX-5 пиковая производительность процессора, объем памяти и пропускная способность канала процессор — память улучшились равномерно в четыре раза по сравнению с системами SX-4. По данным пользователей SX-5, на большинстве реальных приложений достигается не менее 90% пиковой производительности, в то время как для масштабируемых параллельных систем RISC-архитектуры неплохим результатом считается от 15 до 30% пиковой производительности.

Серия SX-6

Суперкомпьютер SX-6.

Суперкомпьютер SX-6.

Суперкомпьютеры семейства SX-6 представляют собой параллельные векторные системы с пиковой производительностью всей системы до 8 TFLOPS. Они были впервые представлены в октябре 2001 г. В систему может входить до 128 узлов, каждый из которых включает от двух до восьми процессоров и общую память до 64 Гбайт. Пиковая производительность одного процессора достигает 8 GFLOPS — так же, как в SX-5.

Высокая производительность SX-6 достигается за счет использования до 8 Тбайт памяти SDRAM (256-разрядные микросхемы) и системного коммутатора с высокой пропускной способностью. В многоузловой системе обеспечивается пропускная способность памяти на уровне 32 Тбайт/с. Серия SX-6 унаследовала от SX-5 архитектуру с разделяемой памятью и КМОП-технологию. Относительно низкая цена и сравнительная компактность системы SX-6 обусловлена размещением процессора целиком на одной микросхеме и использованием жестких проектных норм 0,15-мкм технологии, тогда как процессор SX-5 выпускается по 0,25-мкм технологии, а для своей реализации требует 32 микросхемы среднего уровня интеграции.

По сравнению с SX-5 более чем на 80% уменьшились линейные габариты суперкомпьютера и потребление электроэнергии, что, в свою очередь, позволяет применять во всех моделях воздушное охлаждение. Представители NEC заявляют, что эти два фактора (габариты и потребление электроэнергии) значительно повлияли на резкое снижение стоимости установки и обслуживания суперкомпьютеров SX-6. А производство по 0,15-мкм технологии привело к резкому уменьшению числа компонентов системы и соответственно к существенному повышению надежности оборудования.

Вместе с SX-6 поставляется системное ПО, позволяющее соединенным по сети персональным компьютерам, рабочим станциям Unix и суперкомпьютерам серии SX-6 работать в качестве единой системы. Инструменты и библиотеки для разработки параллельных задач включают MPI, отладчик Total View и инструмент Vampir/SX для оценки производительности программы. ОС и прочее ПО были модифицированы для поддержки увеличенной многоузловой системы. Базовая ОС SUPER-UX предлагает улучшенную поддержку SSI (Single System Image), вместе с тем обеспечивая совместимость с SX-5. Помимо С++ и Fortran 90, имеются такие средства разработки, как OpenMP и HPF 2.0

Серия SX-6 также предлагает Web Supercomputing Environment (WSE) в качестве средства объединения в единый вычислительный комплекс суперкомпьютеров, Unix-серверов и ПК, подключенных к Интернету или интрасети. При помощи этой системы пользователи могут загружать приложения, находящиеся в единой многомашинной системе, манипулировать файлами и выполнять различные команды, используя интуитивно понятные GUI-операции.

Различие между одноузловыми моделями А и В заключается в том, что модель А сконфигурирована на восемь процессоров (64 GFLOPS) и 64 Гбайт основной памяти, в то время как модель В имеет до четырех процессоров (32 GFLOPS) и только 32 Гбайт основной памяти.

Серия SX-6i

В феврале 2002 г. NEC представила новый компактный суперкомпьютер SX-6i, состоящий из одного векторного процессора. Специальный микропроцессор для векторных компьютеров, разработанный корпорацией, имел пиковую векторную производительность 8 GFLOPS; пропускная способность памяти составляла 32 Гбайт/c. Не так давно такая скорость достигалась лишь на больших суперкомпьютерах. Процессор соединен с однородной оперативной памятью объемом в 4 или 8 Гбайт.

Система SX-6i предназначалась для размещения в лабораториях для научно-технических исследований и для разработок ПО, причем была рассчитана на использование на рабочих местах подобно обычному персональному компьютеру. Компьютер был представлен в трех различных конфигурациях: одной настольной и двух, устанавливаемых в стойке. В настольной системе системный блок NEC SX-6i стал самым маленьким векторным суперкомпьютером. Система содержит один процессор SX-6 и 8 или 4 Гбайт оперативной памяти. Подсистема ввода-вывода поддерживает до шести каналов, которые могут быть заняты различными интерфейсами для дисков и сети и другими периферийными устройствами. Что касается системы, размещаемой в стойке, она, как уже отмечалось, представлена в двух вариантах. Стойка 25U содержит одну систему SX-6i, оставляя больше места для внутренних периферийных устройств. В стойку 37U устанавливаются две независимые системы SX-6i. Технические данные процессора и памяти аналогичны настольной версии.

Серия SX-7

В октябре 2002 г. было объявлено о выпуске нового продукта в линейке SX-серии — SX-7. С данной серией связана некоторая путаница. Дело в том, что эти системы (на шкафах которых действительно написано SX-7), по заверению самих же разработчиков NEC, хотя и содержат новые технологии, на самом деле представляют собой лишь расширение SX-6-архитектуры, но никак не ее революционное продолжение. Создание таких систем было рассчитано лишь на некоторых пользователей в Японии, однако эти суперкомпьютеры сумели привлечь к себе внимание специалистов со всего мира. Так, пиковая производительность одного узла системы SX-7 составляет 282,5 GFLOPS, что в три с лишним раза больше по сравнению с SX-6 (см. табл. 1). Всего машина может содержать до 64 подобных узлов. Узел SX-7 поддерживает до 32 процессоров, что вчетверо больше по сравнению с SX-6. В максимальной многоузловой конфигурации пиковая производительность суперкомпьютера достигает 18,1 TFLOPS. Как уже отмечалось, повышение производительности достигается в результате ряда усовершенствований, в частности, увеличения емкости совместно используемой памяти на каждом узле с 64 до 256 Гбайт, а также повышения максимальной скорости передачи данных с 256 Гбайт/с до 1,13 Тбайт/с. Улучшены и процессоры (в системе используются оригинальные процессоры разработки NEC): если быстродействие прежних составляло 8 GFLOPS, то у новых оно достигает 8,83 GFLOPS.

Суперкомпьютер SX-7.

Суперкомпьютер SX-7.

Серия SX-8

Суперкомпьютер SX-8.

Суперкомпьютер SX-8.

Осенью прошлого года NEC представила новую серию суперкомпьютеров SX-8, одна из моделей которой, согласно утверждению компании, стала самым быстрым в мире на сегодняшний день векторным суперкомпьютером, обладая быстродействием до 65 TFLOPS. SX-8 существует в трех версиях — две с одним узлом (табл. 2) и одна система, состоящая из большего количества узлов (табл. 3). Результат в 65 TFLOPS — наивысший показатель, который могла бы показать последняя. Максимальное число узлов в ней — 512, каждый из которых имеет по восемь процессоров (т. е. общее число процессоров достигает 4096). Максимальный объем адресуемой памяти составляет 64 Тбайт, максимальная скорость обмена данными с памятью — 262 Тбайт/с.

Пиковая производительность каждого такого компьютера достигает 128 GFLOPS (128 млрд операций с плавающей точкой в секунду). По заявлению корпорации, объединение 512 таких машин (высотой 2 м каждая) позволяет создать суперкомпьютер с производительностью 128 TFLOPS. Эти системы используют векторную архитектуру, аналогичную той, что применяется в Earth Simulator (который на протяжении нескольких лет был самым мощным вычислительным комплексом в мире). Однако они построены на базе усовершенствованных процессоров, выполненных с учетом технологических норм 90 нм и с технологией медных межсоединений. Тактовая частота конвейера векторной обработки составляет 2 ГГц. Здесь на одном кристалле интегрированы блоки векторной и скалярной обработки. Кроме того, в числе особенностей системы называют большой объем памяти и высокоскоростные межузловые соединения с пиковой пропускной способностью до 16 Гбайт/с. NEC разработала три модели SX-8 — SX-8/B (одноузловая, 1-4 процессора), SX-8/A (одноузловая, 4-8 процессоров) и SX-8/M (от двух до 512 узлов, 8-4096 процессоров).

В корпорации рассчитывают поставить более 700 компьютеров SX-8 в течение ближайших трех лет. Архитектура машин, как правило, ориентирована на задачи, требующие анализа большого объема данных, такие, как прогнозирование погоды, моделирование природных явлений и столкновений автомобилей.

Таблица 2. Характеристики одноузловой системы NEC SX-8

Тип шасси A B
Число процессоров 4-8 1-4
Пиковая производительность, GFLOPS 88-176 22-88
Пиковая векторная производительность, GFLOPS 64-128 16-64
Объем памяти векторных регистров на один процессор, Кбайт 144 144
Объем памяти скалярных регистров на один процессор 64 бит х 128 64 бит х 128
Объем основной памяти (DDR2-SDRAM), Гбайт 32-128 32-64
Пропускная способность памяти, Гбайт/с 512 256
Число каналов ввода-вывода 55 27
Скорость обмена (в одном направлении), Гбайт/с 12,8 6,4

Таблица 3. Характеристики многоузловой системы NEC SX-8

Число узлов 2-512
Число процессоров 8-4096
Пиковая производительность, GFLOPS 176-90112
Пиковая векторная производительность, GFLOPS 128-65536
Объем памяти векторных регистров на один процессор, Кбайт 144
Объем памяти скалярных регистров на один процессор 64 бит х 128
Объем основной памяти (DDR2-SDRAM) 64 Гбайт — 64 Тбайт
Пропускная способность памяти, Гбайт/с 262144
Число каналов ввода-вывода 28160
Скорость обмена (в одном направлении), Гбайт/с 6553
Полоса пропускания, Гбайт/с 8192

Earth Simulator

Как известно, чтобы выяснить, какие суперкомпьютеры имеют максимальную производительность, университеты Маннгейма (Германия) и щтата Теннесси (США), а также Национальный вычислительный центр энергетических исследований США (NERSC) в Беркли (Калифорния, США), два раза в год публикуют официальный список пятисот самых мощных систем мира — Top500 (http://www.top500.org). Cуперкомпьютер Earth Simulator, созданный при непосредственном участии специалистов корпорации NEC, впервые стал наиболее производительной в мире системой еще летом 2002 г. (в 19-й версии Top500).

Собственно, о завершении работ над высокопроизводительной векторно-параллельной системой «Имитатор Земли» (Earth Simulator) и ее передачей в «Центр моделирования Земли» (Earth Simulator Center, ESC) было объявлено еще весной того же года. Система разрабатывалась в течение пяти лет Научно-исследовательским центром моделирования Земли (ESRDC, Earth Simulator Research and Development Center) в сотрудничестве с Национальным агентством по исследованию космоса Японии (NASDA), Японским институтом исследований атомной энергии (JAERI) и Японским морским научно-техническим центром (JAMSTEC). Затраты на проект составили 40 млрд иен, в работах было задействовано свыше тысячи специалистов корпорации NEC.

Суперкомпьютер Earth Simulator

Суперкомпьютер Earth Simulator.

Система Earth Simulator размещена в здании, похожем на авиационный ангар, с площадью пола равной 50х65 м2 (оно принадлежит Институту наук о Земле в Иокогаме — Yokohama Institute for Earth Sciences). Суперкомпьютер состоит из 640 узлов производительностью 64 GFLOP/узел c общим числом процессоров 5120, для соединения которых потребовалось 2800 км кабеля. Каждый узел состоит из восьми векторных процессоров производительностью 8 GFLOP/процессор и пиковой производительностью в 40 GFLOP. Высокоскоростная сеть, соединяющая процессоры, обеспечивает скорость передачи данных в 12,3 Гбайт. Для охлаждения системы через рабочие помещения в течение 10 с прокачивается 35 млн кубических футов воздуха.

Все 640 узлов Earth Simulator основаны на архитектуре NEC SX. Каждый процессорный узел PN (Processor Node) состоит из восьми арифметических процессоров векторного типа AP (Arithmetic Processor), 16 Гбайт основной памяти MS (Memory System), удаленного устройства управления RCU (Remote Control Unit) и процессора ввода-вывода I/O. В состав Earth Simulator входит 5120 AP. Пиковая производительность каждого AP составляет 8 GFLOPS, а теоретическая производительность всей системы может достигать 40 TFLOPS. Время цикла составляет 2 нс.

Модуль векторного процессора имеет размеры 115 на 139 мм . Однокристальные процессоры системы созданы по 0,15-мкм технологии с восемью слоями медной металлизации и содержат приблизительно 60 млн транзисторов. Число выводов составляет 5185. Тактовая частота достигает 1 ГГц; потребляемая мощность — 140 Вт.

Подсистема MDPS (Mass Data Processing System) включает четыре файловых сервисных процессора, 250 Тбайт дисковой и 1,5 Пбайт ленточной памяти. Последняя выполнена на базе библиотеки StorageTek 9310. Объем оперативной памяти для всей системы составляет 10 Тбайт, а общий объем дисковой памяти, включающий рабочее дисковое пространство (около 460 Тбайт), превышает 700 Тбайт.

В качестве ОС используется SUPER-UX. ПО и среда разработки, основанные на Unix, созданы специально для суперкомпьютеров NEC SX-серий. Используются языки программирования Fortran90, HPF, C и C++. Трансляторы этих языков могут выполнять автоматическое распараллеливание и векторизацию. Кроме того, имеются библиотека передачи сообщений MPI2 и математическая библиотека ASL/ES.

Одна из основных особенностей Earth Simulator связана с организацией межузлового коммутатора и с иерархической системой объединения узлов. Межузловой коммутатор соединяет 640 узлов, причем любая их пара может обмениваться данными с пропускной способностью, равной 12,3 Гбайт/с в одном направлении, так что суммарная пропускная способность коммутатора равна 7,9 Тбайт/с. Сам коммутатор состоит из управляющего устройства и 128 коммутаторов данных шириной в 1 байт. Каждый из 640 узлов связан с каждым однобайтным коммутатором данных, так что тракт обмена данными разбивается на однобайтные секции. Для соединений применяются медные кабели, работающие на частоте 1,25 ГГц, и каждый узел для подсоединения к коммутатору использует 130 пар кабелей.

Для того чтобы эффективно распределять ресурсы Earth Simulator и управлять ими, в NEC организовали систему в виде двухуровневого кластера, назвав его суперкластерной системой. Набор из 640 узлов разбит на 40 кластеров, по 16 узлов на кластер. Предусмотрено два их типа- S-кластер (один на всю конфигурацию Earth Simulator) и L-кластеры (остальные 39). S-кластер имеет два специализированных узла для интерактивной обработки; другие узлы S-кластера используются для относительно небольших пакетных заданий. Только S-кластер содержит пользовательские диски суммарной емкостью 255 Тбайт.

Помимо узлов, в кластер входят управляющая станция кластера CCS, управляющая станция ввода-вывода IOCS и системные диски суммарной емкостью 415 Тбайт. CCS осуществляет общее управление кластером, включая IOCS, а та, в свою очередь, отвечает за передачу данных между системными дисками и подсистемой массовой памяти на магнитных лентах.

На самом верхнем уровне находится управляющая станция суперкластера SCCS, которая управляет всеми 40 кластерами, обеспечивая представление Earth Simulator как единого целого. Вообще говоря, SCCS представлена в четырех экземплярах (две пары с общей дисковой памятью), что дополнительно повышает надежность.

Что касается задач, решаемых Earth Simulator, надо отметить, что система может моделировать всеобщие изменения окружающей среды на сетке в тысячу раз более подробной, чем это было возможно на предыдущих суперкомпьютерах. Мощности созданной системы достаточно, чтобы более точно рассчитывать и предсказывать погоду. Earth Simulator также позволяет изучать движение океанских течений на протяжении тысячелетнего цикла и прогнозировать изменения климата. Кстати, обнадеживающие результаты уже получены. Как утверждает метеорологическое сообщество, Earth Simulator превзошел самые смелые ожидания и, можно сказать, открыл новую эру в области предсказания погоды.

Ученые со всего света ждут своей очереди поработать на японском суперкомпьютере. Некоторые из них собираются с его помощью изучать климат Земли не в будущем, а, наоборот, в прошлом. Так, британские ученые из Бристольского университета, например, собираются смоделировать изменение климата на планете на протяжении последних 20 тысяч лет. Затем результаты можно будет сравнить с теми, которые получены при изучении оледенений, годичных колец на деревьях и сталактитов. По мнению экспертов, уже в ближайшие годы с помощью суперкомпьютеров палеоклиматологам удастся получить целый ряд важных результатов.

Примечания

1. Корпорация NEC
Рынок суперкомпьютеров довольно узок; работают на нем в основном крупные американские и японские компании. Одна из них — японская корпорация NEC (Nippon Electronic Company, http://www.nec.co.jp ) со штаб-квартирой в Токио. Компания основана в 1899 г., сегодня в Японии работает 89 ее подразделений, 61 завод и около 420 офисов, занимающихся продажами. За пределами Японии у NEC функционирует 93 подразделения и 40 заводов в 18 странах, а также маркетинговые, сервисные и научно-исследовательские подразделения в 29 странах. Общее количество служащих — около 170 тыс. человек.

NEC — единственная в мире промышленная структура, входящая в первую мировую пятерку одновременно в области телекоммуникаций, компьютеров и полупроводников. Корпорация выпускает суперкомпьютеры, компьютеры, электронные приборы и оборудование связи (всего примерно 15 тыс. наименований продукции). Особенно заметных результатов NEC добилась в области создания параллельно-векторных систем. В марте 2002 г. корпорация представила систему Earth Simulator из 5120 векторно-конвейерных процессоров, производительность которой в пять раз превысила показатель предыдущего обладателя рекорда — MPP-системы ASCI White, состоящей из 8192 суперскалярных микропроцессоров. Это, конечно же, заставило многих по-новому взглянуть на перспективы векторно-конвейерных систем.

2. Первый векторно-конвейерный
Когда состоялся дебют Cray-1, определение «векторный» однозначно ассоциировалось с супервычислениями. Суперкомпьютеры Cray получили свое имя в честь изобретателя этих машин, американского инженера Сеймура Крэя (Seymour Cray). В 1972 г. Крэй, к тому времени уже бывший сотрудник и один из руководителей фирмы CDC, организовал собственную компанию Cray Research, которая занялась проектированием сверхбыстродействующей ЭВМ (ставшей известной под названием Cray-1) с быстродействием, превосходящим сотню миллионов операций в секунду.

Память этой машины была выполнена в виде 16 блоков общей емкостью в 1 млн 64-разрядных слов. Допускалось одновременное обращение к этим блокам таким образом, что реальное время обращения становилось равным 12,5 нс, в то время как время обращения к одному блоку было равно 50 нс. Основная память машины Cray-1, в отличие от других высокопроизводительных машин, не имела иерархической структуры, она была столь быстра, что необходимость в такой иерархии отпала. Машина Cray-1 стала самой быстродействующей из класса однопроцессорных систем.

В состав центрального процессора Cray-1 входили:

  • главная память объемом до 1048576 слов, разделенная на 16 независимых по обращению блоков емкостью 64К слов каждый;
  • регистровая память, состоящая из пяти групп быстрых регистров, предназначенных для хранения и преобразования адресов, хранения и обработки векторных величин;
  • функциональные модули из 12 параллельно работающих устройств, служащих для выполнения арифметических и логических операций над адресами, скалярными и векторными величинами;
  • устройство, управляющее параллельной работой модулей, блоков и устройств центрального процессора;
  • 24 канала ввода-вывода, организованные в шесть групп с максимальной пропускной способностью 500 тыс. слов в секунду.

Двенадцать функциональных устройств машины Cray-1, игравшие роль арифметико-логических преобразователей, не имели непосредственной связи с главной памятью. Как и в машинах семейства CDC-6000, они имели доступ только к быстрым операционным регистрам, из которых выбирались операнды и на которые засылались результаты после выполнения соответствующих действий. Суперкомпьютер Cray-1 установили в исследовательской ядерной лаборатории в Лос-Аламосе в 1976 г. Объем памяти этой машины составлял рекордные по тем временам величины, а быстродействие в пиковых режимах достигало 160 MFLOPS (миллиардов операций в секунду).

Чтобы ускорить работу системы, Крэй решил собрать компьютер в виде буквы «С» — это позволило уменьшить расстояние между разными электронными компонентами машины, а значит, сократить задержки и увеличить ее производительность. Пожертвовать пришлось дизайном и удобством в обслуживании. Cray-1 охлаждался с помощью очень большой и очень шумной фреонной установки. Но для ученых главным всегда был не внешний вид, а эффективность.

Статья опубликована в журнале BYTE №8 (84), август 2005 г.
Перепечатывается с разрешения редакции.
Статья помещена в музей 03.05.2009

Впервые термин «суперкомпьютер» появился в начале 1960-х годов, когда специалисты Иллинойского университета США под руководством доктора Даниэля Слотника предложили идею создания первой в мире параллельной вычислительной системы. Это был значительный рывок в развитии технологии — теперь компьютер мог выполнять несколько задач одновременно, что резко увеличивало его производительность. Проект получил название SOLOMON. Первой ЭВМ, использующей этот принцип, стала ILLIAC IV, созданная группой Слотника и изготовленная в 1965 году компанией Burroughs по заказу NASA. ILLIAC IV выполняла 150 млн операций с плавающей точкой в секунду (150 мегафлопсов). До этого производительность вычислительных систем была ниже 1 мегафлопса.

Сам термин «суперкомпьютер» появился только в 1970-х годах. Во многом это произошло благодаря американцу Сеймуру Крею, который в 1976 году изобрел ставшую популярной первую относительно малогабаритную супер-ЭВМ CRAY-1. Обладавшая производительностью 180 мегафлопсов CRAY-1 была запущена в серию (выпущено более 80 штук) и использовалась в правительственных, промышленных и академических проектах.

В середине 1980-х лидирующие позиции заняли японские производители. В 1985 году системы FACOM VP-400 корпорации Fujitsu и NEC SX-2 компании NEC первыми в мире преодолели рубеж в 1 млрд операций с плавающей точкой в секунду —1,14 гигафлопса и 1,3 гигафлопса соответственно.

К концу 1980-х — началу 1980-х годов на первых местах в рейтингах супер-ЭВМ вновь оказались американские многопроцессорные компьютеры. Так, компания Intel разработала в 1990 году компьютер Intel iPSC/860, состоящий из 128 процессоров суммарной производительностью 2,6 гигафлопса.

Вскоре суперкомпьютер мирового уровня появился и в России — в 1994-м был наконец построен разработанный в Институте точной механики и вычислительной техники под руководством Бориса Бабаяна «Эльбрус-3» (производительностью 1 гигафлопс), который, однако, так и не был отлажен и запущен в серию.

В конце 1990-х компания IBM, стремясь удешевить производство суперкомпьютеров, применила при их разработке так называемую кластерную модель (когда несколько компьютеров соединяются в единую систему). Разрабатываемая с 1996 года кластерная система ASCI Blue (предназначенная для моделирования ядерных взрывов) продемонстрировала в 1998 году рекордный результат — 3 терафлопса (1012 операций в секунду).

В марте 2002 года японская NEC создала Earth Simulator, который занимался мониторингом и прогнозированием климата и атмосферных явлений. Компьютер с производительностью 35,86 терафлопса мгновенно возглавил все рейтинги суперкомпьютеров.

В июне 2008 года введен в строй компьютер Roadrunner, разработанный IBM для исследований в области ядерного вооружения. В ноябре на нем была достигнута производительность в 1,105 петафлопса (1015). С момента создания и до настоящего времени он занимает первое место в рейтинге самых мощных суперкомпьютеров в мире TOP500 Supercomputer Sites.

Содержание статьи:

  • История супер-ЭВМ: появление суперкомпьютеров в 1960-х гг
  • Суперкомпьютеры Cray в 1970-х гг
  • Развитие суперкомпьютеров в 1980-х гг
  • Дальнейшее развитие суперкомпьютеров в 1990-х — начале 2000-х гг
  • Японский суперкомпьютер
  • Современные ЭВМ
  • Применение суперкомпьютеров
  • Обзор суперкомпьютеров
  • Заключение

Суперкомпьютером называют такую ЭВМ, которая по производительности и другим техническим характеристикам намного превосходит другие, существующие в данный момент. В состав такой ЭВМ входит несколько процессоров. Еще одной отличительной характеристикой таких вычислительных устройств является использование векторной арифметики, то есть они могут выполнять арифметические действия одновременно над несколькими парами чисел. Например, типичный суперкомпьютер может одновременно рассчитывать заработную плату нескольких работников, тогда как обычный компьютер за то же время посчитает зарплату только одного сотрудника.

История супер-ЭВМ: появление суперкомпьютеров в 1960-х гг.

Как узнать чипсет материнской платы: все возможные способыВам будет интересно:Как узнать чипсет материнской платы: все возможные способы

Первый суперкомпьютер был создан в компании Control Data Corporation (CDC) под руководством Сеймура Крея. Одним из первых разработанных в данной фирме компьютеров был Cray CDC 1604. В нем были заменены вакуумные электронные лампы транзисторами, он быстро завоевал популярность в научных лабораториях. Позже компания CDC разработала супер-ЭВМ CDC 7600 и начала работы над CDC 8600. В 1964 г. самым быстрым компьютером на Земле стал Stretch, который мог выполнять три миллиона операций с плавающей запятой в секунду (FLOPS).

ENIAC - самый первый компьютер

Разгон FX - 8320E. Общий алгоритм реализацииВам будет интересно:Разгон FX — 8320E. Общий алгоритм реализации

Одним из преимуществ ЭВМ, разработанных под руководством Сеймура Крея, была плотная упаковка электронных компонентов, благодаря чему увеличивалась производительность компьютеров. Все компьютеры Сеймура Крея были оптимизированы для требовательных научных приложений, например, решения дифференциальных уравнений, матричных вычислений, сейсмического анализа, линейного программирования и других подобных задач.

Суперкомпьютеры Cray в 1970-х гг.

Сеймур Крэй ушел из компании CDC и в 1972 г. основал компанию Cray Research, Inc. В 1975 г. компания Cray Research выпустила компьютер Cray-1, который относится к 4 поколению ЭВМ. Всего продано более 80 таких машин, что для того времени было большим успехом. Cray-1 являлся одним из первых компьютеров, на котором выполнение трудоемких операций могло происходить сразу на нескольких процессорных устройствах, и таким образом был одним из первых «многопроцессорных» устройств.

Одним из пионеров многопроцессорных вычислений был Cray X-MP, представленный в 1982 г., который связал два компьютера Cray-1. Он также был первым ЭВМ, реализующим векторные вычисления.

Кроме этого, в 1970-х гг. появились первые 32-битные супер-мини-ЭВМ.

Развитие суперкомпьютеров в 1980-х гг.

В 1985 г. компания Cray Research представила четырехъядерный компьютер Cray-2. Он стал первым вычислительным устройством, производительность которого превысила один миллиард FLOPS.

МФУ Xerox WorkCentre 3025BI: отзывы владельцев, описание и характеристикиВам будет интересно:МФУ Xerox WorkCentre 3025BI: отзывы владельцев, описание и характеристики

Супер ЭВМ Cray-2

В 1983 г. Даниэль Хиллис, аспирант Массачусетского технологического института, придумал, как можно повысить производительность многопроцессорных систем, относящихся к 4 поколению ЭВМ. И в том же году он стал соучредителем компании Thinking Machines Corporation. В 1985 г. данная компания разработала свой первый компьютер CM-1. Он использовал 65 536 недорогих однобитовых процессоров, которые были сгруппированы по 16 шт. на одном чипе. Производительность компьютера CM-1 в некоторых операциях достигала нескольких миллиардов FLOPS и была сопоставима с самым быстрым на тот момент суперкомпьютером Cray.

Дальнейшее развитие суперкомпьютеров в 1990-х — начале 2000-х гг.

Важными заказчиками супер-ЭВМ были военные. После подписания Соединенными Штатами Договора о всеобъемлющем запрещении ядерных испытаний в 1996 г. возникла необходимость в альтернативной программе сертификации ядерных боеголовок. Поэтому Департамент энергетики США выделил деньги на новую программу развития суперкомпьютеров, целью которой стала разработка к 2004 г. компьютера, способного имитировать ядерные испытания. Эта ЭВМ должна иметь производительность более 100 триллионов FLOPS, а самым быстрым из существующих компьютеров в то время был Cray T3E, с производительностью до 150 миллиардов FLOPS. Суперкомпьютер ASCI Red, построенный в Национальных лабораториях Sandia в Альбукерке, совместно с корпорацией Intel, первым достиг 1 TFLOPS. В нем было задействовано 9 072 стандартных процессоров Pentium Pro.

Японский суперкомпьютер

В то время как в Соединенных Штатах преобладал многопроцессорный подход, в Японии корпорация NEC вернулась к более старому подходу — к индивидуальному проектированию компьютерного чипа. Сделанный этой корпорацией, компьютер Earth Simulator занял первое место в списке самых производительных ЭВМ в 2002 г.

Современные ЭВМ

В 2004 г. самым быстрым суперкомпьютером стал Blue Gene/L, выпущенный компанией IBM. Его производительность была примерно равна 36 TFLOPS. После двух удвоений в количестве процессоров Blue Gene/L, установленный в 2005 г. в Sandia National Laboratories в Ливерморе, Калифорния, стал первой машиной, преодолевшей барьер производительности в 100 TFLOPS.

Первый компьютер, производительность которого превысила 1000 TFLOPS или 1 петафлоп, был построен IBM в 2008 г.

Применение суперкомпьютеров

Супер-ЭВМ применяются в научной сфере для выполнения трудоемких вычислений и обработки большого количества информации в реальном времени. Кроме этого, прогресс в области вычислительной техники позволил ученым использовать точные модели происходящих процессов, вместо упрощенных, использовавшихся ранее.

В математике при помощи суперкомпьютеров решаются задачи криптографии и статистики. В физике они помогают понять процессы, происходящие внутри атома. Биологам супер-ЭВМ помогают расшифровать ДНК. Также они незаменимы при составлении прогноза погоды, исследовании изменений климата Земли и поиске залежей нефти и газа. Также суперкомпьютеры используются для выполнения военных расчетов, связанных с ядерным оружием.

Использование мощных вычислительных машин позволило осуществить ряд прорывов в таких областях, как метеорология, глобальный климатический анализ, создание новых медицинских препаратов и аэрокосмическая техника.

Обзор суперкомпьютеров

При разговоре о сверхмощных ЭВМ часто возникает вопрос: «Какой компьютер самый быстрый?» Ответ на этот вопрос может дать рейтинг 10-ти наиболее мощных суперкомпьютеров. В данном рейтинге представлены самые новые компьютеры.

  • Самым быстрым на данный момент считается компьютер Summit Power System AC922. Его производительность согласно данным, полученным с применением системы тестов LINPACK, составляет 122,3 PFLOPS. Максимальная теоретическая производительность данного вычислительного устройства 187,659 PFLOPS. Супер-ЭВМ Summit Power System AC922 сделана компанией IBM специально для использования в Окриджской Национальной лаборатории. Суперкомпьютер Summit
  • На втором месте по производительности находится китайский суперкомпьютер Sunway TaihuLight. Скорость вычислений данной ЭВМ, которая была измерена при помощи системы тестов LINPACK, составляет 93 PFLOPS. Данная супер-ЭВМ являлась самой производительной в мире с июня 2016 г. по июнь 2018 г. Этот суперкомпьютер расположен в Китайской Народной Республике, в компьютерном центре в Уси и используется для прогнозирования погоды, медицинских исследований и выполнения различных сложных расчетов. Китайский суперкомпьютер Sunway TaihuLight
  • На следующем месте по производительности стоит вычислительное устройство Sierra Power System S922LC. Эта супер-ЭВМ имеет производительность 71,61 PFLOPS, согласно тестам LINPACK. Расположено это устройство в Ливерморской лаборатории им. Э. Лоуренса, входящей в состав Калифорнийского университета. Супер ЭВМ Sierra Power System
  • Супер-ЭВМ «Тяньхэ-2» был самым мощным вычислительным устройством с 2013 г. по 2016 г. Его название переводится с китайского языка как «Млечный путь — 2». Согласно стандартному тесту LINPACK его производительность равна 61,445 PFLOPS, а теоретическая пиковая — 100,679. Находится данное устройство в Национальном компьютерном центре в Гуанчжоу (Китайская Народная Республика). Китайский суперкомпьютер Tianhe-2A
  • На пятом месте по производительности на данный момент находится Японский суперкомпьютер AI Bridging Cloud Infrastructure. Его производительность по тестам LINPACK 19,88, а максимальная теоретическая — 32,577 PFLOPS. Японский суперкомпьютер AI Bridging Cloud Infrastructure
  • Суперкомпьютер Piz Daint расположен в Швейцарском компьютерном центре и является самым производительным вычислительным устройством в Европе. Его пиковая теоретическая производительность равна 25,326 PFLOPS, а реальная, зафиксированная при помощи тестов LINPACK, — 19,59 PFLOPS. Разработан американской компанией Cray.
  • Седьмое место по производительности занимает суперкомпьютер Titan, выпущенный в 2012 г. на базе архитектуры Cray XK7. Реальная производительность данного устройства, измеренная при помощи набора тестов LINPACK, — 17,59 PFLOPS, а максимальная теоретическая — 27,113 PFLOPS. Работает он в лаборатории Министерства энергетики США, штат Теннесси. Был самым мощным вычислительным устройством с ноября 2012 г. по июль 2013 г.
  • Супер-ЭВМ Sequoia разработана компанией IBM на платформе Blue Gene/Q. Его реальная производительность — 17,173 PFLOPS, а теоретически возможная — 20,133 PFLOPS. Располагается в Ливерморской лаборатории.
  • Компьютер Trinity разработан на базе платформы Cray XC40. Измеренная производительность данного вычислительного устройства 14,137 PFLOPS. Установлен в Лос-Аламосской лаборатории.
  • Супер-ЭВМ Cori, как и предыдущая, сделана на архитектуре Cray XC40. Ее производительность по тестам LINPACK — 14,015 PFLOPS.
  • Заключение

    Развитие супер-ЭВМ оказало большое влияние на многие области науки и промышленности. На данный момент самым большим препятствием, затрудняющим раскрытие всего вычислительного потенциала таких устройств, являются трудности с написанием программ, которые могли бы одновременно загрузить все имеющиеся у суперкомпьютера процессоры на полную мощность. Это происходит, потому что написать программу, которая бы эффективно разбивала вычислительную задачу на несколько потоков, намного сложнее, чем ту, которая будет выполняться последовательно на одном процессоре. Да и не каждая задача поддается такому распараллеливанию. Вот и все, что нужно знать о супер-ЭВМ, назначении, возможностях и принципах построения этих компьютеров.

    Понравилась статья? Поделить с друзьями:
  • Какие выплаты штатным сотрудникам компании облагаются взносами на травматизм
  • Какие компании могут использовать облачные технологии международные компании
  • Какие меры примет компания к контрагенту предлагающему взятку ее сотрудникам
  • Какие меры принимаются в компании для установления режима коммерческой тайны
  • Какие основные методы планирования использует технология бизнес планирования