Главная
»
Информационные системы
»
Интеллектуальные ИС
»
Открытие знаний.. Типы закономерностей, выявляемыхметолами ИАД. Бизнес-приложения методов ИАД. Классы систем ИАД.Архитектура систем ИАД.
Открытие знаний.. Типы закономерностей, выявляемыхметолами ИАД. Бизнес-приложения методов ИАД. Классы систем ИАД.Архитектура систем ИАД.
Интенсивно разрабатывались методы автоматического извлечения знаний из накопленных факто.в В отечественной литературе привился термин «Интеллектуальный анализ данных» (ИАД)
Классической основой извлечения знаний из накопленных данных является математическая статистика. Обычно необходима специальная подготовка исходных данных (например, формирование выборок), определенный выбор моделей из совокупности допущенных (для проверки адекватности описания данных) и, наконец, профессиональная интерпретация результатов. Поэтому развитие таких пакетов шло в основном по пути создания обширных библиотек программ, реализующих методы обработки и использования достижений компьютерной технологии (например, возможностей распределенной обработки данных в сети)..
ИАД — это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей, то есть извлечения информации, которая может быть охарактеризована как знания.
В общем случае процесс ИАД состоит из трех стадий:
1) выявление закономерностей (свободный поиск);
2) использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование);
3) анализ исключений, предназначенный для выявления и толкования
аномалий в найденных закономерностях.
Выделяют пять стандартных типов закономерностей, которые позволяют выявлять методы ИАД:
ассоциация, последовательность, классификация, кластеризация, прогнозирование.
Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и «кока-колу», а при наличии скидки за такой комплект «колу» приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.
Последовательность. Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.
Классификация. С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредствам анализа уже классифицированных объектов и формулирования некоторого набора правил. Там, где кластеризация помогает определить классы, классификация приписывает новые записи к существующим классам. Например, банк может изучить базу данных своих заемщиков, чтобы разделить их на две группы: те, которые могут разориться и те, которые чувствуют себя хорошо.
Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации средства ИАД самостоятельно выделяют различные однородные группы данных. Кластеризация часто используется для того, чтобы помочь маркетологу выявить различные группы в их базе данных клиентов. Компании используют эти методы для того, чтобы разработать программы целевого маркетинга. Например, компания может использовать кластеризацию для того, чтобы идентифицировать:
- Покупателей, которые вероятно приобретут домой видеомагнитофоны;
- Магазины, которые вероятно продают спутниковые тарелки;
- Покупателей с различными способами использования мобильных телефонов.
Прогнозирование. Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов. Если удается построить, найти шаблоны, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно прогнозировать поведение системы в будущем.
В первую очередь ИАД интересен для коммерческие предприятия, развертывающие проекты на основе информационных хранилищ данных (Data Warehousing
ИАД представляет большую ценность для руководителей и аналитиков в их повседневной деятельности. Деловые люди осознали, что с помощью методов ИАД они могут получить ощутимые преимущества в конкурентной борьбе. Рассмотрим примеры успешного применения методов ИАД.
Предприятия розничной торговли сегодня собирают подробную информацию о каждой отдельной покупке, используя кредитные карточки с маркой магазина и компьютеризированные системы контроля. Вот типичные задачи, которые можно решать с помощью ИАД в сфере розничной торговли:
Анализ покупательской корзины (анализ сходства) предназначен для выявления товаров, которые покупатели стремятся приобретать вместе.
помогает торговым предприятиям ринимать решения о создании торговых запасов. Оно дает ответы на вопросы типа: «Если сегодня покупатель приобрел видеокамеру, то через какое время он вероятнее всего купит батарейки и пленку?»
дает возможность торговым предприятиям узнавать характер потребностей различных категорий клиентов с определенным поведением, например, покупающих товары известных дизайнеров, или посещающих распродажи. Эти знания нужны для разработки точно направленных экономичных мероприятий по продвижению товаров
Предметно-ориентированные аналитические системы
Наиболее широкий подкласс таких систем, получивший распространение в области исследования финансовых рынков, носит название «технический анализ». Он представляет собой совокупность нескольких десятков методов прогноза динамики цен и выбора оптимальной структуры инвестиционного портфеля, основанных на различных эмпирических моделях динамики рынка.
Статистичекиех пакетов можно назвать SAS (компания SAS Institute), SPSS (SPSS
система «выращивает» несколько генетических линий программ, которые конкурируют между собой в точности выражения искомой зависимости.
ИАД, как мощное средство решения разнообразных комбинаторных задач и задач оптимизации в них.
Для обозначения объединения технологий MD&KD и OLAP применяется название — «OLAP Mining» и предлагается несколько вариантов интеграции двух технологий:
«Cubing then mining». Возможность выполнения интеллектуального анализа должна обеспечиваться над любым результатом запроса к многомерному концептуальному представлению, т.е. над любым фрагментом любой проекции гиперкуба показателей.
«Mining then cubing». Подобно данным, извлеченным из хранилища, результаты интеллектуального анализа должны представляться в гиперкубической форме для последующего многомерного анализа.
«Cubing while mining». Этот гибкий способ интеграции позволяет автоматически активизировать однотипные механизмы интеллектуальной обработки над результатом каждого шага многомерного анализа (перехода между уровнями обобщения, извлечения нового фрагмента гиперкуба и т.д.).
Друзья! Приглашаем вас к обсуждению. Если у вас есть своё мнение, напишите нам в комментарии.