Кластеризация. Понятие кластеризации презентация

Содержание


Презентации» Математика» Кластеризация. Понятие кластеризации
КластеризацияПонятие кластеризации
 Кластеризация (или кластерный анализ) — это задача разбиения множестваЭтапы кластеризации
 Отбор выборки объектов для кластеризации.
 Определение множества переменных, поМеры расстояний
 составить вектор характеристик для каждого объекта 
 можно провестиПримеры формул для вычислений
 Евклидово расстояние
 Квадрат евклидова расстоянияПримеры формул для вычислений (2)
 Расстояние городских кварталов (манхэттенское расстояние) –Примеры формул для вычислений (3)
 Расстояние Чебышева. Это расстояние может оказатьсяПримеры формул для вычислений (4)
 Степенное расстояние. Применяется в случае, когдаПримеры формул для вычислений (5)
 где r и p – параметры,Практическое заданиеПрактическое задание (2)
 Сформулировать 5-10 характеристических свойств для картинок. 
 ОпределитьАлгоритмы кластеризации
 Алгоритмы иерархической кластеризации
 восходящие и нисходящие алгоритмы. 
 НисходящиеАлгоритмы кластеризации (2)
 Алгоритмы квадратичной ошибки
 Задачу кластеризации можно рассматривать какАлгоритмы кластеризации (3)
 Нечеткие алгоритмы
 Наиболее популярным алгоритмом нечеткой кластеризации являетсяАлгоритмы кластеризации (4)
 Алгоритмы, основанные на теории графов
 Суть таких алгоритмовАлгоритмы кластеризации (5)
 Алгоритм выделения связных компонент
 В алгоритме выделения связныхАлгоритмы кластеризации (6)
 Алгоритм минимального покрывающего дерева
 Алгоритм минимального покрывающего дереваАлгоритмы кластеризации (7)
 Послойная кластеризация
 Алгоритм послойной кластеризации основан на выделении



Слайды и текст этой презентации
Слайд 1
Описание слайда:
Кластеризация


Слайд 2
Описание слайда:
Понятие кластеризации Кластеризация (или кластерный анализ) — это задача разбиения множества объектов на группы, называемые кластерами. Внутри каждой группы должны оказаться «похожие» объекты, а объекты разных групп должны быть как можно более отличны. Главное отличие кластеризации от классификации состоит в том, что перечень групп четко не задан и определяется в процессе работы алгоритма.

Слайд 3
Описание слайда:
Этапы кластеризации Отбор выборки объектов для кластеризации. Определение множества переменных, по которым будут оцениваться объекты в выборке. При необходимости – нормализация значений переменных. Вычисление значений меры сходства между объектами. Применение метода кластерного анализа для создания групп сходных объектов (кластеров). Представление результатов анализа

Слайд 4
Описание слайда:
Меры расстояний составить вектор характеристик для каждого объекта можно провести нормализацию, чтобы все компоненты давали одинаковый вклад при расчете «расстояния». для каждой пары объектов измеряется «расстояние» между ними — степень похожести.

Слайд 5
Описание слайда:
Примеры формул для вычислений Евклидово расстояние Квадрат евклидова расстояния

Слайд 6
Описание слайда:
Примеры формул для вычислений (2) Расстояние городских кварталов (манхэттенское расстояние) – среднее разностей по координатам. В большинстве случаев эта мера расстояния приводит к таким же результатам, как и для обычного расстояния Евклида. Однако для этой меры влияние отдельных больших разностей (выбросов) уменьшается .

Слайд 7
Описание слайда:
Примеры формул для вычислений (3) Расстояние Чебышева. Это расстояние может оказаться полезным, когда нужно определить два объекта как «различные», если они различаются по какой-либо одной координате.

Слайд 8
Описание слайда:
Примеры формул для вычислений (4) Степенное расстояние. Применяется в случае, когда необходимо увеличить или уменьшить вес, относящийся к размерности, для которой соответствующие объекты сильно отличаются

Слайд 9
Описание слайда:
Примеры формул для вычислений (5) где r и p – параметры, определяемые пользователем. Параметр p ответственен за постепенное взвешивание разностей по отдельным координатам, параметр r ответственен за прогрессивное взвешивание больших расстояний между объектами.

Слайд 10
Описание слайда:
Практическое задание

Слайд 11
Описание слайда:
Практическое задание (2) Сформулировать 5-10 характеристических свойств для картинок. Определить их значения для каждого изображения. Посчитать расстояние между картинками, используя разные меры.

Слайд 12
Описание слайда:
Алгоритмы кластеризации Алгоритмы иерархической кластеризации восходящие и нисходящие алгоритмы. Нисходящие алгоритмы работают по принципу «сверху-вниз»: в начале все объекты помещаются в один кластер, который затем разбивается на все более мелкие кластеры. Более распространены восходящие алгоритмы, которые в начале работы помещают каждый объект в отдельный кластер, а затем объединяют кластеры во все более крупные, пока все объекты выборки не будут содержаться в одном кластере. Таким образом строится система вложенных разбиений.

Слайд 13
Описание слайда:
Алгоритмы кластеризации (2) Алгоритмы квадратичной ошибки Задачу кластеризации можно рассматривать как построение оптимального разбиения объектов на группы. При этом оптимальность может быть определена как требование минимизации среднеквадратической ошибки разбиения.

Слайд 14
Описание слайда:
Алгоритмы кластеризации (3) Нечеткие алгоритмы Наиболее популярным алгоритмом нечеткой кластеризации является алгоритм c-средних (c-means). Он представляет собой модификацию метода k-средних.

Слайд 15
Описание слайда:
Алгоритмы кластеризации (4) Алгоритмы, основанные на теории графов Суть таких алгоритмов заключается в том, что выборка объектов представляется в виде графа G=(V, E), вершинам которого соответствуют объекты, а ребра имеют вес, равный «расстоянию» между объектами.

Слайд 16
Описание слайда:
Алгоритмы кластеризации (5) Алгоритм выделения связных компонент В алгоритме выделения связных компонент задается входной параметр R и в графе удаляются все ребра, для которых «расстояния» больше R. Соединенными остаются только наиболее близкие пары объектов. Смысл алгоритма заключается в том, чтобы подобрать такое значение R, лежащее в диапазон всех «расстояний», при котором граф «развалится» на несколько связных компонент. Полученные компоненты и есть кластеры.

Слайд 17
Описание слайда:
Алгоритмы кластеризации (6) Алгоритм минимального покрывающего дерева Алгоритм минимального покрывающего дерева сначала строит на графе минимальное покрывающее дерево, а затем последовательно удаляет ребра с наибольшим весом.

Слайд 18
Описание слайда:
Алгоритмы кластеризации (7) Послойная кластеризация Алгоритм послойной кластеризации основан на выделении связных компонент графа на некотором уровне расстояний между объектами (вершинами). Уровень расстояния задается порогом расстояния c.


Скачать презентацию на тему Кластеризация. Понятие кластеризации можно ниже:

Похожие презентации