» » »

16. Методы классификации объектов в информационных системах;

Разработаны три метода классификации объектов, которые различаются разной стратегией примене-
ния классификационных признаков:
• иерархический. Учитывая достаточно жесткую процедуру по-
строения структуры классификации, необходимо перед началом ра-
боты определить ее цель, т.е. какими свойствами должны обладать
объединяемые в классы объекты. Эти свойства принимаются в
дальнейшем за признаки классификации.
src=img/16-1.png
В иерархической системе классификации каждый объект на любом
уровне должен быть отнесен к одному классу, который характери-
зуется конкретным значением выбранного классификационного признака. Для последующей группиров-
ки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким
образом, выбор классификационных признаков будет зависеть от семантического содержания того клас-
са, для которого необходима группировка на последующем уровне иерархии. Количество уровней клас-
сификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует
ГЛУБИНУ КЛАССИФИКАЦИИ.
Достоинства иерархической системы классификации: простота построения и использование независимых
классификационных признаков в различных ветвях иерархической структуры.
Недостатки иерархической системы классификации: жесткая структура, которая приводит к сложности
внесения изменений, так как приходится перераспределять все классификационные группировки; невоз-
можность группировать объекты по заранее не предусмотренным сочетаниям признаков.
• ФАСЕТНЫЙ. В отличие от иерархической позволяет выбирать признаки классификации независимо как
друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классифика-
ции называются ФАСЕТАМИ (facet — рамка). Каждый фасет (содержит совокупность однородных значе-
ний данного классификационного признака. Причем значения в фасете могут располагаться в произволь-
ном порядке, хотя предпочтительнее их упорядочение.
Схема построения фасетной системы классификации представляется в виде таблицы. Названия столбцов
соответствуют выделенным классификационным признакам (фасетам). В каждой клетке таблицы хранит-
ся конкретное значение фасета. Процедура классификации состоит в присвоении каждому объекту соот-
ветствующих значений из фасетов.
Достоинства фасетной системы классификации: возможность создания большой емкости классификации,
т.е. использования большого числа признаков классификации и их значений для создания группировок;
возможность простой модификации всей системы классификации без изменения структуры существую-
щих группировок.
Недостатком фасетной системы классификации является сложность ее построения, так как необходимо
учитывать все многообразие классификационных признаков.
• дескрипторный. Для организации поиска информации, для ведения тезаурусов (словарей) эффективно
используется дескрипторная (описательная) система классификации, язык которой приближается к есте-
ственному языку описания информационных объектов. Особенно широко она используется в библиотеч-
ной системе поиска.
• система кодирования. Применяется для замены названия объекта на условное обозначение (код) в целях
обеспечения удобной и более эффективной обработки информации. СИСТЕМА КОДИРОВАНИЯ - совокуп-
ность правил кодового обозначения объектов. Код строится на базе алфавита, состоящего из букв, цифр и
других символов. Код характеризуется: длиной - число позиций в коде, и структурой — порядок распо-
ложения в коде символов, используемых для обозначения классификационного признака.

Друзья! Приглашаем вас к обсуждению. Если у вас есть своё мнение, напишите нам в комментарии.

Поделиться

Оплаченная реклама

Дисциплины