Теория компиляторов. Часть II. Лекция 3. Общие методы распараллеливания кода презентация

Содержание


Презентации» Информатика» Теория компиляторов. Часть II. Лекция 3. Общие методы распараллеливания кода
Теория компиляторов Часть II
 Лекция 3. Общие методы распараллеливания кодаОбщая схема распараллеливания программы 
 Необходимо преобразовать линейный список инструкций [w1,w2,…,wn]1. Управляющий граф программы
 Вершины–источники - 2, 5 и 10. 
Этапы
 1. Формирование модели макроуровня. Объект – исходный поток инструкций.
 1.1.Структура ПКРасстановка меток
 Для каждой тетрады определяются ее атрибуты, относящие тетраду кПостроение управляющего графа 
 УГ содержит описание линейных блоков программы
 УГПланирование трасс
 «Хорошие» линейные участки - длинные
 «Плохие» линейные участки: короткиеЭвристики
 Предсказание на основе истории ветвлений. Сбор статистики об исходах операцийПример
 В первую очередь, избегаем плохих инструкций (4). Если бы (4)Преобразование трасс
 Метод дублирования остаткаЛинейные участки
 ЛУ - последовательность инструкций, у которой имеется вход иГраф зависимости по данным
 Пусть имеется участок программы – список инструкцийПример ГЗД
 S = p*(p–a)*((p–b)*(p–c))
 1. (-, p, a, T1)
 2.Ярусно-параллельная форма
 1. Построение дерева
 Для преобразования ГЗД к дереву (лесуЯрусно-параллельная форма
 Пример. a=(b+c)*(c+d)*(b+d)Построение ЯПФ
 ЯПФ – эта форма разметки дерева. В ЯПФ каждойАлгоритм построения ЯПФ
 Вход: поток тетрад {T}
 Выход: граф G вПример
 (+,a,b,c) 	-- c:=a+b
 (+,a,b,c) 	-- c:=a+b
 (+,a,b,b) 	-- b:=a+b
 (+,d,e,f)Распределение регистров
 11 регистровОптимальная загрузка регистров
 Регистров обычно не хватает
 Сведем задачу распределения регистровГраф конфликтов
 Граф конфликтов – это неориентированный граф, вершинами которого являютсяПример
 a:=b+c;
 k:=a*d
 e:=b+f
 m:=b*gПостроение графа конфликтов
 Далее - раскраска графа
 Использованы краски с именамиРаскраска графа (1)
 Гипотеза о четырех красках:
 Хроматическое число любого планарногоРаскраска графа (2)
 Нахождение оптимальной раскраски – это NP–полная задача. ПоэтомуСтратегии последовательных раскрасок 
 1. НП–стратегия («Наибольшие–Первыми»). Упорядочить вершины v1,…,vn поИтоговая последовательность
 1. Формирование модели макроуровня. Объект – исходный поток инструкций.



Слайды и текст этой презентации
Слайд 1
Описание слайда:
Теория компиляторов Часть II Лекция 3. Общие методы распараллеливания кода


Слайд 2
Описание слайда:
Общая схема распараллеливания программы Необходимо преобразовать линейный список инструкций [w1,w2,…,wn] в список широких командных слов [VLIW1,VLIW2,…,VLIWm].

Слайд 3
Описание слайда:
1. Управляющий граф программы Вершины–источники - 2, 5 и 10. Стоки-вершины 5 и 9.

Слайд 4
Описание слайда:
Этапы 1. Формирование модели макроуровня. Объект – исходный поток инструкций. 1.1. Расстановка меток. 1.2. Построение управляющего графа. 1.3. Планирование трасс. 1.4. Преобразование трасс. 1.5. Формирование линейных участков. 2. Формирование модели микроуровня. Объект – линейные участки. 2.1. Построение графа зависимости по данным (ГЗД). 2.2. Преобразование ГЗД к ярусно-параллельной форме. 2.3. Построение графа конфликтов 2.3. Распределение регистров.

Слайд 5
Описание слайда:
Структура ПК

Слайд 6
Описание слайда:
Расстановка меток Для каждой тетрады определяются ее атрибуты, относящие тетраду к типу «развилка», «сток», «плохая инструкция». «Плохая инструкция» (операции ввода-вывода, вызовы подпрограмм, операции синхронизации и т.п.) Если тетрада - операция условного перехода, то это – «развилка». Если адрес (номер) тетрады используется где-либо в качестве адреса перехода, то это – «сток». Тетрада может иметь несколько подобных атрибутов (быть и «развилкой», и «стоком»).

Слайд 7
Описание слайда:
Построение управляющего графа УГ содержит описание линейных блоков программы УГ - орграф, вершины которого - линейные участки программы, а дуги указывают пути передачи управления. УГ имеет единственную входную и единственную выходную вершину. Каждая вершина имеет не более двух потомков.

Слайд 8
Описание слайда:
Планирование трасс «Хорошие» линейные участки - длинные «Плохие» линейные участки: короткие или содержащие «плохие» операции. "Плохие" инструкции: вызовы внешних подпрограмм; возвраты из подпрограмм; операции ввода-вывода; операции синхронизации по времени; переходы по вычисляемым адресам (т.к. адрес перехода неизвестен заранее, то оптимизировать нельзя); операции с данными, находящимися по вычисляемым адресам (невозможно проследить зависимости по данным на этапе трансляции).

Слайд 9
Описание слайда:
Эвристики Предсказание на основе истории ветвлений. Сбор статистики об исходах операций ветвления и построение на ее основе строится предположение о результате выполнения текущей операции. Предсказание на основе пробных прогонов программы. Для этого производится имитация выполнения программы на одном или нескольких наборах данных. Собирается статистика. Недостаток очевиден: метод работает лишь при определенных обстоятельствах и исходных данных. Использование эвристик выбора доминирующей ветви. Избегание «плохих» инструкций. Условия с указателями. Обычно справедливы условия PtrNULL Ptr1Ptr2 if((ptr=malloc(…))!=NULL) … for(p=p0;p!=NULL;p=p–>next) … Эвристика исполнения циклов. Если при ветвлении одна из ветвей содержит цикл, то обычно именно она и будет доминировать. По статистике исполнение циклов занимает до 90% времени выполнения программы в целом. Эвристика направления ветвления. Возврат назад более вероятен (высока вероятность неявного цикла с постусловием). Предсказание по коду операции: при сравнении чисел с плавающей точкой более вероятно неравенство; отрицательные числа менее вероятны.

Слайд 10
Описание слайда:
Пример В первую очередь, избегаем плохих инструкций (4). Если бы (4) была хорошей командой, то мы от (2) перешли на (3), т.к. чаще всего при выполнении сравнения числа не равны друг другу. После (6) идем на (7), т.к. вероятнее движение по циклу.

Слайд 11
Описание слайда:
Преобразование трасс Метод дублирования остатка

Слайд 12
Описание слайда:
Линейные участки ЛУ - последовательность инструкций, у которой имеется вход и два выхода. ЛУ заканчивается тогда, когда осуществляется переход или ставится метка. ЛУ – это основной объект оптимизации. Чем длиннее ЛУ, тем больше возможностей для параллельных вычислений. ЛУ  ГЗД  ЯПФ  распределение регистров  {VLIW}.

Слайд 13
Описание слайда:
Граф зависимости по данным Пусть имеется участок программы – список инструкций A=(a1,a2,…,an) Каждая инструкция ai представлена в тетрадной форме ai=(OPi, Ii(1), Ii(2), Ri) ГЗД участка A - граф (A,V) с вершинами aiA и дугами (ai, aj)  V V={(ai, aj): i<j, (Ri=Ij)(Rj=Ii)(Ri=Rj)=true}

Слайд 14
Описание слайда:
Пример ГЗД S = p*(p–a)*((p–b)*(p–c)) 1. (-, p, a, T1) 2. (-, p, b, T2) 3. (-, p, c, T3) 4. (*, T2, T3, T4) 5. (*, p, T1, T5) 6. (*, T5, T4, T6)

Слайд 15
Описание слайда:
Ярусно-параллельная форма 1. Построение дерева Для преобразования ГЗД к дереву (лесу бинарных деревьев) используется дублирование переменных. Дублирование производится для вершин deg–(aiA)>1 В результате вершина дублируется deg–(ai)–1 раз Пример. S = p*(p–a)*((p–b)*(p–c))

Слайд 16
Описание слайда:
Ярусно-параллельная форма Пример. a=(b+c)*(c+d)*(b+d)

Слайд 17
Описание слайда:
Построение ЯПФ ЯПФ – эта форма разметки дерева. В ЯПФ каждой вершине графа приписывается некое число – ранг (номер яруса). Вершины, имеющие один ранг (находящиеся на одном ярусе) могут исполняться одновременно. Пусть ГЗД оперирует двумя видами тетрад (вершин) – полными тетрадами вида T4=(OP, A1, A2, R) и неполными (вырожденными) тетрадами вида T3=(OP, A, ,R) (+,A,B,C) -- C:=A+B (*,A,B,C) -- C:=A*B (:=,A, , C) -- C:=A Представление графа ЯПФ Граф ЯПФ – множество вершин-структур

Слайд 18
Описание слайда:
Алгоритм построения ЯПФ Вход: поток тетрад {T} Выход: граф G в ярусно-параллельной форме Очистить список вершин графа G Цикл по всем тетрадам T Выбрать очередную тетраду T. Если тип тетрады T соответствует T4 (T=(OP, A1, A2, R)), то -- Анализируем аргумент A1. Если ГЗД нет элемента с именем A1, то -- добавляем новый элемент g1 в G g1.name := A1; g1.rank:= 0; g1.left := NULL; g1.right := NULL. добавить элемент g1 в G иначе запомнить элемент g1 (g1.name=A1) -- Анализируем аргумент A2. Если ГЗД нет элемента с именем A2, то -- добавляем новый элемент g2 в G g2.name := A2; g2.rank:= 0; g2.left := NULL; g2.right := NULL. добавить элемент g2 в G иначе запомнить элемент g2 (g2.name=A2) -- Анализируем аргумент R. Найти элемент g3 с максимальным рангом, использующий R в качестве аргумента A1 или A2. Найти элемент g4 максимального ранга с именем R. Выбираем максимальный из рангов среди найденных элементов gi: rmax = max(g1.rank, g2.rank, g3.rank, g4.rank) (при этом если какой-либо из элементов gi не был найден в G, то считаем его ранг равным нулю) Помещаем элемент R на ярус со значением rmax+1. КонецЕсли Если тип тетрады T соответствует T3=(OP, A,, R), то -- Далее все аналогично, только вместо двух анализируется один аргумент – операнд A. КонецЕсли КонецЦикла

Слайд 19
Описание слайда:
Пример (+,a,b,c) -- c:=a+b (+,a,b,c) -- c:=a+b (+,a,b,b) -- b:=a+b (+,d,e,f) -- f:=d+e (:=,b,,a) -- a:=b (:=,b,,f) -- f:=b (:=,h,,g) -- g:=h

Слайд 20
Описание слайда:
Распределение регистров 11 регистров

Слайд 21
Описание слайда:
Оптимальная загрузка регистров Регистров обычно не хватает Сведем задачу распределения регистров к задаче раскраски графа: Создать граф, вершинами которого являются данные, а дуги определяют пересечение времен жизни (одновременность использования данных). Раскрасить граф – приписать каждой вершине графа свой цвет – используемый регистр. Количество цветов (красок) – это и есть количество регистров. Прежде следует определиться с тем, какие команды (вершины) вообще могут конфликтовать друг с другом из-за регистров.

Слайд 22
Описание слайда:
Граф конфликтов Граф конфликтов – это неориентированный граф, вершинами которого являются используемые переменные (данные), а ребра соединяют вершины с пересекающимися временами жизни. Строить граф конфликтов мы будем, опираясь на ЯПФ. Одновременно "живут" (сосуществуют) те вершины, которые находятся на одном ярусе. Кроме того: сохраняются связи, полученные в ЯПФ учитываются связи с вершинами предыдущего ярусами. Определяется связь со всеми вершинами, которые находятся выше и имеют потомков ниже или на том же уровне, что и текущая: Для вершины ak строится связь (ak, ai) с вершиной ai такой, что: L(ai)<L(ak) и  aj: L(aj)L(ak)}

Слайд 23
Описание слайда:
Пример a:=b+c; k:=a*d e:=b+f m:=b*g

Слайд 24
Описание слайда:
Построение графа конфликтов Далее - раскраска графа Использованы краски с именами 0-4. Итого - 5 цветов (регистров)

Слайд 25
Описание слайда:
Раскраска графа (1) Гипотеза о четырех красках: Хроматическое число любого планарного графа не превосходит 4 Но: наш граф не обязан быть планарным

Слайд 26
Описание слайда:
Раскраска графа (2) Нахождение оптимальной раскраски – это NP–полная задача. Поэтому чаще всего реализуют алгоритмы поиска субоптимального решения. Последовательная раскраска Пусть дано упорядоченное множество вершин графа v1,…,vn. вершине v1 приписываем цвет c1; если подграф H(v1,…,vi–1), порожденный вершинами v1,…,vi–1 k'–раскрашен, ki–1, то вершина vi получает цвет cm, где mk+1, т.е. цвет с наименьшим номером, не встречающимся на смежных с vi вершинах. Число цветов k при этом заранее не фиксируется. Этот алгоритм дает точную k–раскраску только для полных k–дольных графов. k–дольным называется граф, множество вершин которого можно разбить на k непересекающихся подмножеств X1,…,Xk так, что никакие 2 вершины из подмножества Xi, i=1,..,n, не смежны. k–дольный граф называется полным k–дольным, если каждая вершина из множества Xi смежна с каждой вершиной из Xj, ij.

Слайд 27
Описание слайда:
Стратегии последовательных раскрасок 1. НП–стратегия («Наибольшие–Первыми»). Упорядочить вершины v1,…,vn по убыванию их степеней связности, т.е. сначала раскрашиваются вершины с максимальными степенями. В данном случае упорядочивание может выглядеть так: {2,1,3,4,5,6}. Поэтому раскраску начнем с вершины V1=2. 2. ПН–стратегия («Последними–Наименьшие») для n=|V| в качестве vn выбирается вершина минимальной степени в G; для i=n–1,n–2,…,2,1 в качестве vi выбирается вершина минимальной степени в подграфе H(V\{vn,…,vi+1}). Выберем вершину минимальной связности: V6=6. Далее рассматриваем граф, где нет 6-й вершины. В этом графе V5=5. Далее в оставшемся графе определим V4=4, затем V3=1, V2=2 и V1=3. Итого: {3,2,1,4,5,6}

Слайд 28
Описание слайда:
Итоговая последовательность 1. Формирование модели макроуровня. Объект – исходный поток инструкций. 1.1. Расстановка меток. 1.2. Построение управляющего графа. 1.3. Планирование трасс. Эвристики. 1.4. Преобразование трасс. 1.5. Формирование линейных участков. 2. Формирование модели микроуровня. Объект – линейные участки. 2.1. Построение графа зависимости по данным (ГЗД). 2.2. Преобразование ГЗД к ярусно-параллельной форме. 2.3. Построение графа конфликтов 2.3. Распределение регистров.


Скачать презентацию на тему Теория компиляторов. Часть II. Лекция 3. Общие методы распараллеливания кода можно ниже:

Похожие презентации