» » »

8.1.Открытие знаний.. Типы закономерностей, выявляемых метолами ИАД. Бизнес-приложения методов ИАД. Классы систем ИАД. Архитектура систем ИАД.

Открытие знаний
Интен­сивно разрабатывались методы автоматического извлечения знаний из на­копленных факто.в В отечественной литературе привился термин «Интеллектуаль­ный анализ данных» (ИАД)
Классической основой извлечения знаний из накопленных данных явля­ется математическая статистика. Обычно необходима специальная подготовка исходных данных (например, формирование выборок), определенный выбор моделей из совокупности допущенных (для проверки адекватности описания данных) и, наконец, профессиональная интерпретация результатов. Поэтому развитие таких пакетов шло в основном по пути создания обширных биб­лиотек программ, реализующих методы обработки и использования дости­жений компьютерной технологии (например, возможностей распределенной обработки данных в сети)..
ИАД — это процесс поддержки принятия решений, основанный на поис­ке в данных скрытых закономерностей, то есть извлечения информации, ко­торая может быть охарактеризована как знания.
В общем случае процесс ИАД состоит из трех стадий:
1) выявление закономерностей (свободный поиск);
2) использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование);
3) анализ исключений, предназначенный для выявления и толкования
аномалий в найденных закономерностях.
Типы закономерностей, выявляемых методами НАД
Выделяют пять стандартных типов закономерностей, которые позволяют выявлять методы ИАД:
ассоциация, последовательность, классификация, 
кластеризация, прогнозирование.
Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и «кока-колу», а при наличии скидки за такой комплект «колу» приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.
Последовательность. Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в преде­лах двух недель 60% новоселов обзаводятся холодильником.
Классификация. С помощью классификации выявляются признаки, ха­рактеризующие группу, к которой принадлежит тот или иной объект. Это делается посредствам анализа уже классифицированных объектов и форму­лирования некоторого набора правил. Там, где кластеризация помогает оп­ределить классы, классификация приписывает новые записи к существую­щим классам. Например, банк может изучить базу данных своих заемщиков, чтобы разделить их на две группы: те, которые могут разориться и те, кото­рые чувствуют себя хорошо.
Кластеризация отличается от классификации тем, что сами группы за­ранее не заданы. С помощью кластеризации средства ИАД самостоятельно выделяют различные однородные группы данных. Кластеризация часто ис­пользуется для того, чтобы помочь маркетологу выявить различные группы в их базе данных клиентов. Компании используют эти методы для того, что­бы разработать программы целевого маркетинга. Например, компания может использовать кластеризацию для того, чтобы идентифицировать:
  • Покупателей, которые вероятно приобретут домой видеомагнитофоны;
  • Магазины, которые вероятно продают спутниковые тарелки;
  • Покупателей с различными способами использования мобильных теле­фонов.
Прогнозирование. Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных ря­дов. Если удается построить, найти шаблоны, адекватно отражающие дина­мику поведения целевых показателей, есть вероятность, что с их помощью можно прогнозировать поведение системы в будущем.
Бизнес-приложения методов ИАД
В первую очередь ИАД интересен для коммерче­ские предприятия, развертывающие проекты на основе информационных хранилищ данных (Data Warehousing
ИАД представляет большую ценность для руководителей и аналитиков в их повседневной деятельности. Деловые люди осознали, что с помощью ме­тодов ИАД они могут получить ощутимые преимущества в конкурентной борьбе. Рассмотрим примеры успешного применения методов ИАД.
Предприятия розничной торговли сегодня собирают подробную информа­цию о каждой отдельной покупке, используя кредитные карточки с маркой магазина и компьютеризированные системы контроля. Вот типичные задачи, которые можно решать с помощью ИАД в сфере розничной торговли:
Анализ покупательской корзины (анализ сходства) предназначен для выявления товаров, которые покупатели стремятся приобретать вместе.
Исследование временных шаблонов помогает торговым предприятиям ринимать решения о создании торговых запасов. Оно дает ответы на во­просы типа: «Если сегодня покупатель приобрел видеокамеру, то через какое время он вероятнее всего купит батарейки и пленку?»
 Создание прогнозирующих моделей дает возможность торговым предприятиям узнавать характер потребностей различных категорий клиентов с определенным поведением, например, покупающих товары известных дизайнеров, или посещающих распродажи. Эти знания нужны для разра­ботки точно направленных экономичных мероприятий по продвижению товаров
Классы систем ИАД
Предметно-ориентированные аналитические системы
Наиболее широкий подкласс таких систем, получивший распространение в области исследования финансовых рынков, носит название «технический анализ». Он представляет собой совокупность нескольких десятков методов прогноза динамики цен и выбора оптимальной структуры инвестиционного портфеля, основанных на различных эмпирических моделях динамики рынка.
Статистиче­киех пакетов можно назвать SAS (компания SAS Institute), SPSS (SPSS
СИСТЕМЫ РАССУЖДЕНИЙ НА ОСНОВЕ АНАЛОГИЧНЫХ СЛУЧАЕВ
ДЕРЕВЬЯ РЕШЕНИЙ - если..то в виде дерева
Эволюционное программирование -
 система «выращивает» несколько генетических линий программ, которые конкурируют между собой в точности выражения искомой зависи­мости.
Генетические алгоритмы - ИАД, как мощное средство решения разнообразных комбинаторных задач и задач оптимизации в них.
Архитектура систем ИАД
Для обозначения объединения технологий MD&KD и OLAP применяется название — «OLAP Mining» и предлагается несколько вариантов интеграции двух технологий:

«Cubing then mining». Возможность выполнения интеллектуального ана­лиза должна обеспечиваться над любым результатом запроса к многомерному концептуальному представлению, т.е. над любым фрагментом любой проекции гиперкуба показателей.

«Mining then cubing». Подобно данным, извлеченным из хранилища, результаты интеллектуального анализа должны представляться в гиперкубической форме для последующего многомерного анализа.

«Cubing while mining». Этот гибкий способ интеграции позволяет ав­томатически активизировать однотипные механизмы интеллектуальной обработки над результатом каждого шага многомерного анализа (перехо­да между уровнями обобщения, извлечения нового фрагмента гиперкуба и т.д.).



Друзья! Приглашаем вас к обсуждению. Если у вас есть своё мнение, напишите нам в комментарии.

Поделиться

Оплаченная реклама

Дисциплины