Главная
»
Информационные системы
»
Интеллектуальные ИС
»
Применение алгоритмов типа АВО (вычислительных оценок) для построения итерационных алгоритмов поиска. Обучение машин распознаванию образов. Алгоритмы автоматического построения классификаций.
Применение алгоритмов типа АВО (вычислительных оценок) для построения итерационных алгоритмов поиска. Обучение машин распознаванию образов. Алгоритмы автоматического построения классификаций.
(вычисления оценок) для построения итерационных алгоритмов поиска
В практике поиска необходимо учитывать, что число записей, просмотренных пользователем, и суждение о релевантности которых известно, составляет незначительную часть от общего числа записей базы данных. Снятие этой проблемы связано с отысканием критериев устойчивости статистической выборки по функционалу ошибки.Часто поиск пользователем ведется не по отдельным дескрипторам, а по различным их сочетаниям. Класс АВО исходит из того, что неизвестно, какие сочетания атрибутов наиболее информативны. Поэтому критерию в классе АВО сопоставляются всевозможные комбинации атрибутов и их сочетаний.
Обычная стратегия обучения понятиям с учителем заключается в том, что задаются первоначальные приближения формулировки понятия и затем по мере того как программа или система формирует очередное приближение понятия, она предъявляет его пользователю для оценки. Пользователь может использовать бинарную шкалу оценки, отмечая релевантность или нерелевантность понятия исходной постановке задачи, но может использовать также балльные или весовые оценки. Пользователь испытывает затруднения в формулировке понятия, тем более заранее не известны релевантные и нерелевантные объекты. При обучении машин пользователь выступает в роли учителя, формулирующего первоначальное задание (разбиение записей базы данных на классы). Затем на каждом этапе пользователь лишь оценивает разбиение записей на классы, производимое машиной.
Автоматическая классификация объединяет весь набор методов и алгоритмов, предназначенных для разбиения совокупности объектов, каждый из которых описан набором переменных на какое-то число однородных (в определенном смысле) классов. Эти классы могут быть в той или иной степени связаны между собой, например в форме графа или дерева, каждая вершина которого представляет один класс.
После выбора атрибутов, способа представления их весов в документах и единиц измерения, информация о каждом признаке любого объекта записывается в таблицу, в которой множество строк представляет индивидуумы (объекты), а множество столбцов — признаки (дескрипторы).
Наиболее широко используемые методы кластеризации основываются на критерии квадратичной ошибки. Общая цель состоит в том, чтобы получить разбиения, которые для фиксированного числа кластеров минимизируют квадратичную ошибку
Алгоритм k-внутригрупповых средних является алгоритмом построения неиерархической классификации. Основная идея алгоритма заключается в том, чтобы найти некоторое начальное приближение и перемещать реализации из одной группы в другую так, чтобы улучшить значение функции критеяри
Иерархическая кластеризация — это метод или процедура для преобразования матрицы близости в последовательность вложенных разбиений, Кластеризация— это разбиение. Компоненты разбиения называются кластерами. Иерархическая кластеризация— это последовательность разбиений, в которой каждое разбиение вкладывается в следующее разбиение в последовательности.
Типичный агломеративный алгоритм иерархической кластеризации начинает работу с формирования несвязных кластеров, помещая каждый из n объектов в отдельный кластер. Используемый алгоритм кластеризации определяет, как следует интерпретировать матрицу близости, чтобы объединить два или более таких тривиальных кластера в кластер следующего уровня. Процесс повторяется, чтобы сформировать последовательность вложенных кластеров, в которых число кластеров уменьшается, пока не будет сформирован один кластер, объединяющий все объекты.
производит все действия в обратном порядке.
Друзья! Приглашаем вас к обсуждению. Если у вас есть своё мнение, напишите нам в комментарии.