Главная » Самолетостроение » Теория информационных процессов и систем » Статистические свойства источников сообщений

Статистические свойства источников сообщений

Статистические свойства источника сообщений

Источник секретных сведений (источник сообщений) передает информацию с использованием того или иного алфавита или системы счисления, если информация носит сугубо цифровой характер. Подлежащие передаче сведения формируются за счет усилий одного пользователя или группы лиц. Аналогичные сведения могут быть образованы и автоматическими устройствами, используемыми в информационном процессе.

Главной особенностью информации, представленной на естественном языке исполнителя, является наличие статистики в повторении букв алфавита того или иного языка, используемых для написания осмысленного текста. Указанная статистическая зависимость является неравномерной. В ней есть буквы, которые в текстах повторяются больше других, а есть буквы, которые повторяются довольно редко. Например, наиболее повторяемой буквой русского языка является буква «о». Для английского языка такой буквой является буква «е». Наименее повторяемой в осмысленном тексте русского языка является буква «ъ».

Естественно, указанная статистика проявляется на достаточно больших по объему текстах, но отмеченная закономерность используется злоумышленниками для взлома шифра без знания ключа.

Возьмем достаточно длинный осмысленный текст, написанный на русском языке, в котором содержится множество букв. Решим рутинную задачу, определяя и суммируя появление каждой буквы в тексте. Пусть буква «а» в итоговом результате имеет значение накопленной суммы, тогда частота ее появления для данного текста будет определяться отношением . Подводя общий итог, можно заметить, что результатом эксперимента является цепочка неравенств

Указанную закономерность можно представить в виде гистограммы

Анализ зашифрованного сообщения с использованием данной закономерности получил название частотного анализа.

Принцип частотного анализа использовался выдающимися писателями А. Конан Дойлом в рассказе «Пляшущие человечки» и Э. По в рассказе «Золотой жук», когда главные герои этих произведений вскрывали содержание текстов, одинаковые буквы которых заменялись на некие условные знаки (другие буквы), всегда одинаковые для одних и тех же букв исходного текста. Правила замены были понятен только отправителю сообщения и его получателю. В общей классификации шифров подобное преобразование исходного текста получило название шифра замены.

Известно, что код Морзе, используемый в слуховой радиосвязи, является неравномерным кодом, адаптированным к английскому языку. Его приспособленность заключается в том, что наиболее употребляемая буква этого языка «е» передается самым коротким знаком азбуки Морзе – единственной точкой.

Из сказанного можно сделать вывод: замена одних и тех же букв алфавита в скрываемом тексте на другие знаки (буквы), но всегда одни и те же для данной буквы алфавита, однозначно взламывается злоумышленником, который в своих действиях использует статистику языка, на котором написано сообщение.

Другим важным выводом является то, что шифрование одного открытого осмысленного текста другим осмысленным текстом не приводит к существенному нарушению статистики языка и лишь не намного увеличивает время взлома первого и второго сообщения с использованием частотного анализа.

Друзья! Приглашаем вас к обсуждению. Если у вас есть своё мнение, напишите нам в комментарии.

Дисциплины