Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Архитектура вычислительных систем



Архитектура вычислительных систем

Лекция 3

 

На данном рисунке изображена расширенная классификация Флинна, в которой самый большой класс- MIMD, который разделился на мультипроцессорные(машины с памятью совместного использования) и мультикомпьютеры(машины с передачей сообщений) –«системы с распределенной памятью». Мультипроцессоры отличаются друг от друга по способу реализации памяти совместного использования.

 

UMA - Uniform Memory Access (Арх. С однородным доступом к памяти)

NUMA - Non-Uniform Memory Access (Арх. С неоднородным доступом)

COMA – Cache Only Memory Access (Арх. с доступом только к кеш памяти)

 

В машинах UMA каждый процессор имеет одно и то же время доступа к любому модулю памяти, каждое слово в памяти можно считать с той же скоростью, что и любое другое слово памяти. Если это технически не возможно, то самые быстрые обращения замедляются, чтобы соответствовать самым медленным. Поэтому программисты не увидят разницы. Это и значит однородный доступ. Такая однородность делает производительность предсказуемой, что очень важно для написания эффективных программ.

Общая память

МПn

МП2

МП1

В основе UMA лежит шина, 2 или несколько процессоров и 1 или несколько модулей памяти. Если процессору нужно считать слово из памяти, он сначала проверяет свободна ли шина. Если шина занята, то МП ждет когда она освободится. Это порождает ряд проблем, при наличии большого количества процессоров (32-64). Производительность системы будет ограничиваться пропускной способностью шины, а большинство процессоров простаивать. Чтобы разрешить эту проблему, нужно добавить каждом процессору кеш память 1 и 2 уровня. Это позволяет уменьшить количество обращений к основной памяти через шину и увеличить производительность системы.

UMA с шинной организацией поддерживают до 64 процессоров.

Если все процессоры имеют равный доступ ко всем модулям памяти и всем устройствам ввода-вывода и каждый процессор взаимодействует с другими процессорами, то такая система называется SMP- Symmetric Multi Processor.

Мультипроцессоры UMA c координатными коммутаторами

Для того, чтобы подключить более 64 процессоров в ВС используют координатный коммутатор. В каждом пересечении горизонтальной (входящей) и вертикальной (исходящей) линий находится коммутирующее устройство, которое можно открыть или закрыть в зависимости от того какой процессор и какой модуль памяти надо соединить. Координатный коммутатор представляет собой неблокируемую сеть, это значит, что процессор всегда будет связан с нужным модулем памяти даже, если какая-то линия или узел уже заняты, те решена проблема занятости шин.



 

UMA с координат. Коммутат.

Недостатком данной системы является то, то при наличии 1000 процессоров и 1000 блоков памяти нам понадобится 1 млн узлов, что неприемлемо, тем не менее координатные коммутаторы вполне применимы для систем средних размеров (больше 64).

Мультипроцессоры UMA с многоступенчатыми коммутаторами (сетями).

В данной мультипроцессорной системе используется другой подход в основе которого лежит небольшой коммутатор 2Х2.

Сообщение приходящее на любую из входных линий могут переключаться на любую выходную линию имеет следующий вид.

Модуль

Адрес

Коп

Значение

Поле модуль сообщает какую память использовать. Поле Адрес определяет адрес в этом модуле памяти. В поле Коп (код операции) содержит write или read. В поле Значение может содержаться операнд (32 битное слово, которое нужно записать при выполнении операции записи).

Сеть «Омега»

 

Процессы 000 1А 2А 3А 000 Модули памяти

Коммутатор исследует поле Модуль и использует его для определения через какой выход – х или у отправить сообщение.

Эти коммутаторы 2х2 можно компоновать различными способами и строить многоступенчатые сети. Один из возможным вариантов- Сеть «Омега».

Тут соединили 8 процессоров с 8 модулями памяти, используя 12 коммутаторов.

Для N процессоров и N модулей памяти нам понадобится (n/2)log2(n).

Разводку сети Омега часто называют полным тасованием (колода карт) поскольку смещение сигналов на каждой ступени напоминают колоду карт, которую разделили пополам, а затем соединили чередуя карты.

Предположим процессору 011 нужно считать слово из модуля памяти 110. Процессор посылает сообщение read, чтобы переключить коммутатор 1D, который содержит 110 в поле Модуль. Коммутатор берет первый (крайний левый бит от 110 и по нему узнает направление. 0 указывает на верхний выход, а 1 на нижний. Все коммутаторы 2 ступени, включая 2D для определения направления используют 2 бит. Поэтому сообщение отправляется на 3D. Затем проверяется 3 бит- он =0 и сообщение переходит в верхний ряд

И попадает в модуль памяти 110.

Сеть омега – блокируемая сеть, т.е. не всякий набор запросов можно передавать одновременною. Конфликты могут возникать при использовании одного и того же провода и коммутатора, а также между запросами, направленными к памяти и ответами, исходящими из памяти.

Мультипроцессоры COMA

В этой архитектуре ВС

Возможен доступ к кеш памяти, те в них означает. В ней страницы памяти не имеют собственных фиксированных машин, как в системах NUMA. Все физическое адресное пространство делится настройки, которые. Перемещаются в систему в случае использования основной памяти в качестве кеш памяти.

Мультипроцессоры NUMA

Они имеют 3 ключевые характеристики, которые в совокупности отличают их от других мультипроцессоров:

1) существует 1 адресное пространство

2) доступ к удаленной памяти производится при помощи комvад load и store.

Если время доступа к удаленной памяти не скрыто (тк кеш отсутствует), то такая систему называется замкнутой (cc NUMA)- присутствует согласованный кеш. Программисты часто называют её аппаратной DCM- Distributed Shared Memory- распределенная совместно используемая память.

Поскольку она сходна с программной дсм.

Реализуется аппаратно с использованием страниц маленького размера. Первая машина ncNUMA была машина Carnegia Mellon.

ncNUMA используют сложное ПО для перемещения страниц из модулей памяти разный процессоров, чтобы максимально увеличить производительность. Мультипроцессоры ncNUMA плохо расширяются, поскольку в них нет кеш памяти. Каждый раз переходить к удаленной памяти, чтобы получить доступ к слову, которого нет в локальной памяти очень не выгодно и это сильно снижает производительность.

Мультипроцессоры ccNUMA

 


Дата добавления: 2015-09-30; просмотров: 24 | Нарушение авторских прав




<== предыдущая лекция | следующая лекция ==>
Перекрытия играют большую роль в обеспечении общей устойчивости здания и в зависимости от системы соедине­ния их элементов со стенами или отдельными опорами влияют на несущую способность | Мерой электрического тока служит величина, измеряемая количеством электричества (зарядом), которое проходит через поперечное сечение проводника за 1 с.

mybiblioteka.su - 2015-2024 год. (0.009 сек.)