Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Подход Хаффмана



Читайте также:
  1. Decide which answer А, В, С or D best fits each space. Подумайте, какие из предложенных ответов лучше подходят для данных выражений.
  2. Decide which answer А, В, С or D best fits each space. Подумайте, какие из предложенных ответов лучше подходят для данных выражений.
  3. II. Прочитайте и переведите предложения, обращая внимание употребление эквивалентов модальных глаголов. Где возможно замените эквивалент подходящим по смыслу модальным глаголом.
  4. IV. ПСИХОАНАЛИТИЧЕСКИЙ ПОДХОД К ПОНИМАНИЮ АГРЕССИВНОСТИ
  5. V3: Научные подходы к психодиагностическому исследованию
  6. Акмеологический подход в исследовании развития профессионала
  7. Аксиологический подход в изучении педагогических явлений

Попытки создать оптимальный неравномерный код начинается с азбуки Морзе (код неравномерный, если объем кодировки для разных знаков различный).

Основная идея неравномерного кода – если буква встречается чаще, то код её должен быть короче. Такими оптимизированными неравномерными кодами занимались так же Шеннон и Фано.

Хаффман предложил строить коды по типу бинарного дерева. Он исходил из того, что кодировать придется в двоичном коде через 0 и 1, поэтому он предложил разместить буквы какого-то текста в порядке убывания его частоты или вероятности (частота – количество букв в тексте; вероятность – отношение количества данной буквы к общему количеству букв).

Подход Хаффмана хорош тем, что получаем неравномерный код в соответствии с частотами каждой буквы.

Доказана теорема: данный код является оптимальным, то есть любой другой неравномерный код не может сжать информацию более, чем данный.

Данный принцип позволяет строить в двоичной системе координат коды для алфавитов, число букв которых не есть степень двойки.

Алгоритм Хаффмана легко реализуется в ЭВМ и воспроизводится. Образуется в результате кодирования дерево, выражается в качестве табличного соответствия и прилагается к сжатому документу. Это самый быстрый алгоритм.

Если заданы произвольные бытовые данные, то размер буквы можно устанавливать самому. Наибольшую эффективность на практике оказывают буквы размером 18-20 бит.

Слишком короткие буквы (по битам) встречаются очень часто, но степень сжатия будет невысока, слишком длинные буквы (более 3 байт) фактически приближается к алгоритму KWE, так как буквы встречаются все меньше и меньше. Значит, есть некий оптимальный выбор длины буквы.

Как можно убедиться алгоритмы RLE и KWE они дополняют друг друга, поэтому их комбинируют.


Дата добавления: 2015-07-11; просмотров: 115 | Нарушение авторских прав






mybiblioteka.su - 2015-2025 год. (0.008 сек.)