» » »

9.1.Применение алгоритмов типа АВО (вычислительных оценок) для построение итерационных алгоритмов поиска. Обучение машин распознаванию образов. Алгоритмы автоматического построения классификаций.

Применение алгоритмов типа АВО (вычисления оценок) для построения итерационных алгоритмов поиска
В практике поиска необходимо учитывать, что число записей, просмотренных пользователем, и суждение о релевантности которых известно, со­ставляет незначительную часть от общего числа записей базы данных. Снятие этой проблемы связано с отысканием критериев устойчивости статистической выборки по функционалу ошибки.Часто поиск пользователем ведется не по отдельным дескрипторам, а по различным их сочетаниям. Класс АВО исходит из того, что неизвестно, какие сочетания атрибутов наиболее информативны. Поэтому критерию в классе АВО сопоставляются всевозможные комбинации атрибутов и их сочетаний.
Обучение машин распознаванию образов
Обычная стратегия обучения понятиям с учителем заключается в том, что задаются первоначальные приближения формулировки понятия и затем по мере того как программа или система формирует очередное приближение понятия, она предъявляет его пользователю для оценки. Пользователь может использовать бинарную шкалу оценки, отмечая релевантность или нереле­вантность понятия исходной постановке задачи, но может использовать так­же балльные или весовые оценки. Пользователь испытывает затруднения в формулировке понятия, тем более заранее не известны релевантные и нере­левантные объекты. При обучении машин пользователь выступает в роли учителя, формулирующего первоначальное задание (разбиение записей базы данных на классы). Затем на каждом этапе пользователь лишь оценивает разбиение записей на классы, производимое машиной.
 Алгоритмы автоматического построения классификаций
Автоматическая классификация объединяет весь набор методов и алгоритмов, предназначенных для разбиения совокупности объектов, каждый из которых описан набором переменных на какое-то число однородных (в определенном смысле) классов. Эти классы могут быть в той или иной степени связаны между собой, например в форме графа или дерева, каждая вершина которого представляет один класс.
После выбора атрибутов, способа представления их весов в документах и единиц измерения, информация о каждом признаке любого объекта записывается в таблицу, в которой множество строк представляет индивидуумы (объекты), а множество столбцов — признаки (дескрипторы).
ОБЩЕЕ ОПИСАНИЕ МЕТОДОВ ПАРТИЦИАЛЬНОЙ КЛАСТЕРИЗАЦИИ
Наиболее широко используемые методы кластеризации основываются на критерии квадратичной ошибки. Общая цель состоит в том, чтобы получить разбиения, которые для фиксированного числа кластеров минимизируют квадратичную ошибку
АЛГОРИТМ ПАРТИЦИАЛЬНОЙ КЛАСТЕРИЗАЦИИ. МЕТОД k-СРЕДНИХ (k-means)
Алгоритм k-внутригрупповых средних является алгоритмом построения неиерархической классификации. Основная идея алгоритма заключается в том, чтобы найти некоторое начальное приближение и перемещать реализа­ции из одной группы в другую так, чтобы улучшить значение функции кри­теяри
 
АЛГОРИТМЫ ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ
Иерархическая кластеризация — это метод или процедура для преобразования матрицы близости в последовательность вложенных разбиений, Кластеризация— это разбиение. Компоненты разбиения называются кластерами. Иерархическая кластеризация— это последовательность разбиений, в которой каждое разбиение вкладывается в следующее разбиение в последовательности.
Типичный агломеративный алгоритм иерархической кластеризации начинает работу с формирования несвязных кластеров, помещая каждый из n объектов в отдельный кластер. Используемый алгоритм кластеризации оп­ределяет, как следует интерпретировать матрицу близости, чтобы объеди­нить два или более таких тривиальных кластера в кластер следующего уров­ня. Процесс повторяется, чтобы сформировать последовательность вложен­ных кластеров, в которых число кластеров уменьшается, пока не будет сформирован один кластер, объединяющий все объекты.
Дивизимный алгоритм производит все действия в обратном порядке.

Друзья! Приглашаем вас к обсуждению. Если у вас есть своё мнение, напишите нам в комментарии.