Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8) презентация

Содержание


Презентации» Логистика» Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8)
АРХИТЕКТУРА СОВРЕМЕННЫХ ЭВМ  Лекция 8: Параллельные вычисления
 ВМиК МГУ им.План лекции
 Архитектуры параллельных компьютеров
 Параллелизм на уровне команд
 Многопоточность
 Мультипроцессоры
Уровни параллелизма
 В процессоре 
 Конвейризация
 Суперскалярность
 Удлинение длины команд
 ДополнительныеАрхитектуры параллельных компьютеров
 (a) На чипе (b) Сопроцессор (c)Мультипроцессор
 (d) МультикомпьютерПараллелизм на уровне команд
 (a) Конвейер (b) Посл-ть VLIW инструкций
 (c)TriMedia VLIW команда
 Типичная команда TriMedia.Функциональные блоки
 Операции с константами (5)
 АЛУ целочисленных операций (5)
 СдвигиОсобенности
 Арифметика с насыщением
 Команды 2-28 байт
 Отсутствует проверка на совместимостьВнутрипроцессорная многопоточность (1)
 (a) – (c) Три потока. Пустые квадраты означаютВнутрипроцессорная многопоточность (2)
 Многопоточность в сдвоенном процессоре
 (a) Мелкомодульная многопоточность
 (b)Варианты повышения производительности
 Повышение тактовой частоты
 Размещение на одной микросхеме двухСтратегии управления совместным потреблением ресурсов
 Дублирование ресурсов
 Жёсткое разделение ресурсов
 ПолноеМногопоточность в Pentium 4
 Разделение ресурсов между программными потоками в микроархитектуреГомогенные однокристальные микропроцессоры
 Однокристальные мультипроцессоры. 
 (a) Два конвейера  (b)Гетерогенные однокристальные мультипроцессорыАрхитектура CoreConnect
 An example of the IBM CoreConnect architecture.Мультипроцессоры
 (a) Мультипроцессор с 16 ЦПУ, разделяющих общую память
 (b) Изображение,Мультикомпьютеры (1)Мультикомпьютеры (2)Классификация Флинна (1)Классификация Флинна (2)
 A taxonomy of parallel computers.Классификация вычислительных систем
 Мультипроцессоры с использованием единой общей памяти (shared memory)…Классификация вычислительных систем
 Мультипроцессоры с использованием единой общей памяти…Классификация вычислительных систем
 Мультипроцессоры с использованием единой общей памяти… 
 Проблемы:
Классификация вычислительных систем
 Мультипроцессоры с использованием единой общей памяти… 
 Проблема:Классификация вычислительных систем
 Мультипроцессоры с использованием единой общей памяти… 
 Проблема:Классификация вычислительных систем
 Пример: Пусть процессоры выполняют последовательность команд
  
Классификация вычислительных систем
 Мультипроцессоры с использованием единой общей памяти… 
 Проблема:Классификация вычислительных систем
 Для организации разделения ресурсов между несколькими потоками командКлассификация вычислительных систем
 Мультипроцессоры с использованием единой общей памяти 
 Проблема:Классификация вычислительных систем
 Мультипроцессоры с использованием физически распределенной памяти (distributed sharedКлассификация вычислительных систем
 Мультипроцессоры с использованием физически распределенной памяти…Классификация вычислительных систем
 Мультипроцессоры с использованием физически распределенной памяти:
 Упрощаются проблемыМультикомпьютеры…
 Мультикомпьютеры…
 Не обеспечивают общий доступ ко всей имеющейся в системахМультикомпьютеры
 Для доступа к данным, располагаемых на других процессорах, необходимо явноМультикомпьютеры
 Данный подход используется при построении двух важных типов многопроцессорных вычислительныхКластеры
 Преимущества:
 Могут быть образованы на базе уже существующих у потребителейКластеры
 Недостатки:
 Организация взаимодействия вычислительных узлов кластера при помощи передачи сообщенийСпасибо за внимание!



Слайды и текст этой презентации
Слайд 1
Описание слайда:
АРХИТЕКТУРА СОВРЕМЕННЫХ ЭВМ Лекция 8: Параллельные вычисления ВМиК МГУ им. М.В. Ломоносова, Кафедра АСВК Чл.-корр., профессор, д.ф.-м.н. Королёв Л.Н., Ассистент Волканов Д.Ю.


Слайд 2
Описание слайда:
План лекции Архитектуры параллельных компьютеров Параллелизм на уровне команд Многопоточность Мультипроцессоры Мультикомпьютеры Классификация Флинна

Слайд 3
Описание слайда:
Уровни параллелизма В процессоре Конвейризация Суперскалярность Удлинение длины команд Дополнительные специализированные процессоры Многоядерность Многопроцессорность (Сильносвязанный параллелизм) Кластеры (Слабосвязанный параллелизм)

Слайд 4
Описание слайда:
Архитектуры параллельных компьютеров (a) На чипе (b) Сопроцессор (c)Мультипроцессор (d) Мультикомпьютер (e) Грид

Слайд 5
Описание слайда:
Параллелизм на уровне команд (a) Конвейер (b) Посл-ть VLIW инструкций (c) Поток команд с отмеченными связками

Слайд 6
Описание слайда:
TriMedia VLIW команда Типичная команда TriMedia.

Слайд 7
Описание слайда:
Функциональные блоки Операции с константами (5) АЛУ целочисленных операций (5) Сдвиги (2) Загрузка и сохранение из памяти (2) Умножение целых и вещественных чисел (2) АЛУ операций с плавающей точкой (2) Сравнение чисел с плавающей точкой (1) Извлечение квадратного корня (1) Ветвления (3) АЛУ ЦОС (2) Умножитель для ЦОС (2)

Слайд 8
Описание слайда:
Особенности Арифметика с насыщением Команды 2-28 байт Отсутствует проверка на совместимость операций во время исполнения Прогнозирование операций Специализированные операции

Слайд 9
Описание слайда:
Внутрипроцессорная многопоточность (1) (a) – (c) Три потока. Пустые квадраты означают простой в ожидании данных из памяти (d) Мелкомодульная многопоточность (e) Крупномодульная многопоточность

Слайд 10
Описание слайда:
Внутрипроцессорная многопоточность (2) Многопоточность в сдвоенном процессоре (a) Мелкомодульная многопоточность (b) Крупномодульная многопоточность (c) Синхронная многопоточность

Слайд 11
Описание слайда:
Варианты повышения производительности Повышение тактовой частоты Размещение на одной микросхеме двух процессоров Введение новых функциональных блоков Удлинение конвейера Использование многопоточности

Слайд 12
Описание слайда:
Стратегии управления совместным потреблением ресурсов Дублирование ресурсов Жёсткое разделение ресурсов Полное разделение ресурсов Пороговое разделение ресурсов

Слайд 13
Описание слайда:
Многопоточность в Pentium 4 Разделение ресурсов между программными потоками в микроархитектуре NetBurst Pentium 4.

Слайд 14
Описание слайда:
Гомогенные однокристальные микропроцессоры Однокристальные мультипроцессоры. (a) Два конвейера (b) Два ядра

Слайд 15
Описание слайда:
Гетерогенные однокристальные мультипроцессоры

Слайд 16
Описание слайда:
Архитектура CoreConnect An example of the IBM CoreConnect architecture.

Слайд 17
Описание слайда:
Мультипроцессоры (a) Мультипроцессор с 16 ЦПУ, разделяющих общую память (b) Изображение, разбивается на 16 частей, каждое обрабатывается своим ЦПУ

Слайд 18
Описание слайда:
Мультикомпьютеры (1)

Слайд 19
Описание слайда:
Мультикомпьютеры (2)

Слайд 20
Описание слайда:
Классификация Флинна (1)

Слайд 21
Описание слайда:
Классификация Флинна (2) A taxonomy of parallel computers.

Слайд 22
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти (shared memory)… Обеспечивается однородный доступ к памяти (uniform memory access or UMA), Являются основой для построения: векторных параллельных процессоров (parallel vector processor or PVP). Примеры: Cray T90, симметричных мультипроцессоров (symmetric multiprocessor or SMP). Примеры: IBM eServer, Sun StarFire, HP Superdome, SGI Origin.

Слайд 23
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти…

Слайд 24
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти… Проблемы: Доступ с разных процессоров к общим данным и обеспечение, в этой связи, однозначности (когерентности) содержимого разных кэшей (cache coherence problem), Необходимость синхронизации взаимодействия одновременно выполняемых потоков команд

Слайд 25
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти… Проблема: Обеспечение однозначности (когерентности) содержимого разных кэшей (cache coherence problem)

Слайд 26
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти… Проблема: Необходимость синхронизации взаимодействия одновременно выполняемых потоков команд…

Слайд 27
Описание слайда:
Классификация вычислительных систем Пример: Пусть процессоры выполняют последовательность команд над общей переменной N (в скобках указывается значение этой переменной) Вариант исполнения 1 Вариант исполнения 2

Слайд 28
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти… Проблема: Необходимость синхронизации взаимодействия одновременно выполняемых потоков команд… Рассмотренный пример может рассматриваться как проявление общей проблемы использования разделяемых ресурсов (общих данных, файлов, устройств и т.п.)

Слайд 29
Описание слайда:
Классификация вычислительных систем Для организации разделения ресурсов между несколькими потоками команд необходимо иметь возможность: - определения доступности запрашиваемых ресурсов (ресурс свободен и может быть выделен для использования, ресурс уже занят одним из потоков и не может использоваться дополнительно каким-либо другим потоком); - выделения свободного ресурса одному из процессов, запросивших ресурс для использования; - приостановки (блокировки) потоков, выдавших запросы на ресурсы, занятые другими потоками.

Слайд 30
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти Проблема: Необходимость синхронизации взаимодействия одновременно выполняемых потоков команд Доступ к общей переменной в рассмотренном примере в самом общем виде должен быть организован следующим образом:

Слайд 31
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием физически распределенной памяти (distributed shared memory or DSM): Неоднородный доступ к памяти (non-uniform memory access or NUMA), Среди систем такого типа выделяют: cache-only memory architecture or COMA (системы KSR-1 и DDM), cache-coherent NUMA or CC-NUMA (системы SGI Origin 2000, Sun HPC 10000, IBM/Sequent NUMA-Q 2000), non-cache coherent NUMA or NCC-NUMA (система Cray T3E).

Слайд 32
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием физически распределенной памяти…

Слайд 33
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием физически распределенной памяти: Упрощаются проблемы создания мультипроцессоров (известны примеры систем с несколькими тысячами процессоров) Возникают проблемы эффективного использования распределенной памяти (время доступа к локальной и удаленной памяти может различаться на несколько порядков).

Слайд 34
Описание слайда:
Мультикомпьютеры… Мультикомпьютеры… Не обеспечивают общий доступ ко всей имеющейся в системах памяти (no-remote memory access or NORMA), Каждый процессор системы может использовать только свою локальную память

Слайд 35
Описание слайда:
Мультикомпьютеры Для доступа к данным, располагаемых на других процессорах, необходимо явно выполнить операции передачи сообщений (message passing operations), Основные операции передачи данных: Отправить сообщение (send), Получить сообщение (receive) Пример:

Слайд 36
Описание слайда:
Мультикомпьютеры Данный подход используется при построении двух важных типов многопроцессорных вычислительных систем: массивно-параллельных систем (massively parallel processor or MPP), например: IBM RS/6000 SP2, Intel PARAGON, ASCI Red, транспьютерные системы Parsytec, кластеров (clusters), например: AC3 Velocity и NCSA NT Supercluster.

Слайд 37
Описание слайда:
Кластеры Преимущества: Могут быть образованы на базе уже существующих у потребителей отдельных компьютеров, либо же сконструированы из типовых компьютерных элементов; Повышение вычислительной мощности отдельных процессоров позволяет строить кластеры из сравнительно небольшого количества отдельных компьютеров (lowly parallel processing), Для параллельного выполнения в алгоритмах достаточно выделять только крупные независимые части расчетов (coarse granularity).

Слайд 38
Описание слайда:
Кластеры Недостатки: Организация взаимодействия вычислительных узлов кластера при помощи передачи сообщений обычно приводит к значительным временным задержкам Дополнительные ограничения на тип разрабатываемых параллельных алгоритмов и программ (низкая интенсивность потоков передачи данных)

Слайд 39
Описание слайда:
Спасибо за внимание!


Скачать презентацию на тему Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8) можно ниже:

Похожие презентации