База знаний для подготовки к ОГЭ и ЕГЭ, проверенная Российской академией наук

Кодирование символов одного алфавита с помощью кодовых слов в другом алфавите, кодовая таблица, декодирование

Кодирование и декодирование информации. Общие сведения

Информация передаётся от источника к приёмнику по каналу связи в виде сигналов.

Сигна́л (в теории информации и связи) — носитель информации, используемый для передачи сообщений в системе связи.

При передаче информации в целях ускорения процесса или исправления возникающих ошибок часто требуется её кодирование.

Кодирование — процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для передачи, хранения или автоматической переработки. Обратный процесс называется декодированием[1].

Код — взаимно однозначное отображение конечного упорядоченного множества символов, принадлежащих некоторому конечному алфавиту, на иное, не обязательно упорядоченное, как правило более обширное множество символов для кодирования передачи, хранения или преобразования информации.

Последовательность сигналов, которая соответствует передаваемому символу, называется кодовым словом. То есть код, используемый при передаче для кодирования и декодирования информации, состоит из кодовых слов.

Например, код Морзе, в котором любая буква/символ кодируются последовательностями точек и тире. Другой пример — кодирование чисел, букв и прочих символов последовательностями нулей и единиц в компьютерах[2].

Кодирование символов

Для определённости будем говорить о кодировании символов, подразумевая, что общие принципы кодирования справедливы для всех типов компьютерной информации.

Основной способ кодирования заключается в присвоении каждому символу определённого кода, известного как источнику информации, так и приёмнику.

Источник преобразует символы в соответствующие коды, которые передаются по каналу связи в виде сигналов и затем декодируются приёмником.

Кодовая таблица

Кодовая страница — таблица, представляющая собой набор цифровых (двоичных) кодов и их соответствующих символов. Каждому значению байта сопоставляется некоторый символ (или его отсутствие). Обычно код символа имеет размер 8 бит, так что кодовая страница может содержать максимум 256 символов, из чего вытекает резкая недостаточность всякой 8-битной кодовой страницы для представления многоязычных текстов. К тому же часть символов используется как управляющие, из-за чего число печатных символов редко превышает 223. Кодовые таблицы необходимы для правильного отображения текста на веб-страницах.

Типы кодов

Коды могут быть равномерными (всем символам соответствуют кодовые слова одинаковой длины) или неравномерными (кодовые слова разной длины для разных символов), что создаёт дополнительные сложности при декодировании.

Пример равномерного кода
Символ А Б В Г Д
Код символа 000 001 010 011 100

Предположим, нам нужно закодировать последовательность символов ГВАБД.

Получим последовательность: 011010000001100.

При использовании равномерного кода процесс декодирования происходит очень просто, так как приёмнику известно, что каждый символ записывается тремя битами.

Используем теперь неравномерный код, например, такой:

Пример неравномерного кода
Символ А Б В Г Д
Код символа 000 001 00 1 10

Получив на приёмнике для того же сообщения ГВАБД последовательность 10000000110, мы не знаем, как её верно разделить на кодовые слова.

Примечания

Категории

© Правообладателем данного материала является АНО «Интернет-энциклопедия «РУВИКИ».
Использование данного материала на других сайтах возможно только с согласия АНО «Интернет-энциклопедия «РУВИКИ».
  1. Кодирование и декодирование информации. foxford.ru. Дата обращения: 2 июля 2025.
  2. Кодирование и декодирование информации. maximumtest.ru. Дата обращения: 2 июля 2025.