Акушерство Анатомия Анестезиология Вакцинопрофилактика Валеология Ветеринария Гигиена Заболевания Иммунология Кардиология Неврология Нефрология Онкология Оториноларингология Офтальмология Паразитология Педиатрия Первая помощь Психиатрия Пульмонология Реанимация Ревматология Стоматология Терапия Токсикология Травматология Урология Фармакология Фармацевтика Физиотерапия Фтизиатрия Хирургия Эндокринология Эпидемиология

Опишите алгоритм арифметического кодирования

По исходному распределению вероятностей для выбранной для кодирования д.с.в. строится таблица, состоящая из пересекающихся только в граничных точках отрезков для каждого из значений этой д.с.в.; объединение этих отрезков должно образовывать отрезок[0,1],а их длины должны быть пропорциональны вероятностям соответствующих значений д.с.в. Алгоритм кодирования заключается в построении отрезка, однозначно определяющего данную последовательность значений д.с.в. Затем для построенного отрезка находится число, принадлежащее его внутренней части и равно его целому числу, деленному на минимально возможную положительную целую степень двойки. Это число и будет кодом для рассматриваемой последовательности. Всевозможные конкретные коды—это числа строго большие нуля и строго меньшие одного, поэтому можно отбрасывать лидирующий ноль и десятичную точку, но нужен еще один специальный код-маркер, сигнализирующий о конце сообщения. Отрезки строятся так. Если имеется отрезок для сообщения длины n−1,то для построения отрезка для сообщения длины n, разбиваем его на столько же частей, сколько значений имеет рассматриваемая д.с.в. Это разбиение делается совершенно также как и самое первое(с сохранением порядка).Затем выбирается из полученных отрезков тот, который соответствует заданной конкретной последовательности длины n.

Звучит это довольно сложно. Давайте попробуем разобраться с помощью небольшого примера. Закодируем сообщение «ЭТОТ_МЕТОД_ЛУЧШЕ_ХАФФМАНА» с помощью описанного метода.

Пусть имеется некий алфавит, а также данные о частотности использования символов (опционально). Тогда рассмотрим на координатной прямой отрезок от 0 до 1.

Назовём этот отрезок рабочим. Расположим на нём точки таким образом, что длины образованных отрезков будут равны частоте использования символа, и каждый такой отрезок будет соответствовать одному символу.

Теперь возьмём символ из потока и найдём для него отрезок среди только что сформированных, теперь отрезок для этого символа стал рабочим. Разобьём его таким же образом, как разбили отрезок от 0 до 1. Выполним эту операцию для некоторого числа последовательных символов. Затем выберем любое число из рабочего отрезка. Биты этого числа вместе с длиной его битовой записи и есть результат арифметического кодирования использованных символов потока.

Дата добавления: 2015-11-28 | Просмотры: 405 | Нарушение авторских прав

При использовании материала ссылка на сайт medlec.org обязательна! (2.704 сек.)

Главная | О нас | Полезные cсылки | Контакты