Главная » Информационные системы » Проектирование ИС » Кодирование технико-экономической информации

Кодирование технико-экономической информации

Для того чтобы обеспечить эффективный поиск, обработку на ЭВМ и передачу по каналам связи технико-экономической информации, ее необходимо представить в цифровом виде. С этой целью ее нужно сначала упорядочить (классифицировать), а затем формализовать (закодировать).

Кодирование технико-экономической информации

Для полной формализации информации недостаточно простой классификации, поэтому проводят следующую процедуру — кодирование.

Кодирование - представление обозначения объектов в виде двоичных символов.

Кодовые таблицы - (ASCII, EBCDIC, KOI8, Windows-1251, UTF-8, UTF-16) представление в машинном виде, по определенным правилам.

Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов.

Код - это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой.

Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Типы алфавитов: цифровой, буквенный и смешанный.

Параметры кода:

- длина;

- основание кодирования;

- структура кода (распределение знаков по признакам);

- степень информативности ([общее количество признаков]/[длина кода]);

- коэффициент избыточности ([максимальное количество объектов]/[фактическое]).

Требования к методам кодирования:

- код должен осуществлять идентификацию объекта в пределах заданного множества объектов классификации;

- желательно предусматривать использование в качестве алфавита кода десятичных цифр и букв;

- необходимо обеспечивать по возможности минимальную длину кода и достаточный резерв незанятых позиций для кодирования новых объектов без нарушения структуры классификатора.

Методы кодирования могут носить самостоятельный характер (регистрационные), или быть основанными на предварительной классификации объектов (классификационные).

Регистрационные методы кодирования бывают двух видов: порядковый и серийно-порядковый.

Порядковый: каждый из объектов классифицируемого множества кодируется путем присвоения ему текущего порядкового номера. Преимущества: большая долговечность классификаторапри незначительной избыточности кода, наибольшая простота, использует наиболее короткие коды и лучше обеспечивает однозначность каждого объекта классификации.

Недостатки: отсутствие в коде какой-либо конкретной информации о свойствах объекта, сложность машинной обработки информации при получении итогов по группе объектовклассификации с одинаковыми признаками.

Серийно-порядковый: коды - числа натурального ряда с закреплением их интервалов за объектами классификации с одинаковыми признаками. В каждой серии предусматриваются коды для резерва.

Классификационные методы используют для отражения классификационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации - системы последовательного и параллельного кодирования.

Последовательные - базируются на предварительной классификации по иерархической системе. Код объекта классификации образуется с использованием кодов последовательно расположенных подчиненных группировок, полученных при иерархическом методе кодирования (код нижестоящей группировки образуется путем добавления соответствующего количества разрядов к коду вышестоящей группировки).

Параллельные - кодирование характеризуются тем, что они строятся на основе использования фасетной системы классификации и коды группировок по фасетам формируются независимо друг от друга.

В параллельной системе кодирования возможны два варианта записи кодов объекта:

1.Каждый фасет и признак внутри фасета имеют свои коды, которые включаются в состав кода объекта (удобно применять, когда объекты характеризуются неодинаковым набором признаков, при формировании кода какого-либо объекта берутся только необходимые признаки)

2.Для определения групп объектов выделяется фиксированный набор признаков и устанавливается стабильный порядок их следования, (фасетная формула), и не надо каждый раз указывать, значение какого из признаков приведено в определенных разрядах кода объекта.

Преимущества: гибкость структуры кода, обусловленная независимостью признаков, из кодов которых строится код объекта.

Метод позволяет использовать при решении конкретных технико-экономических и социальных задач коды только тех признаков объектов, которые необходимы, что дает возможность работать в каждом отдельном случае с кодами небольшой длины.

Друзья! Приглашаем вас к обсуждению. Если у вас есть своё мнение, напишите нам в комментарии.

Дисциплины