Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Теоретические основы сжатия данных

Читайте также:
  1. frac34; Методические основы идентификации типа информационного метаболизма психики.
  2. II. Аналитический ум рассчитывает, основываясь на различиях. Реактивный ум рассчитывает, основываясь на тождествах.
  3. III. Основы деятельности
  4. IX. Исторические основы еврейского мирового господства
  5. V. Системно-теоретические модели
  6. А. Создание и заполнение базы данных
  7. Абсорбция. Физические основы процесса абсорбции. Влияние температуры и давления на процесс абсорбции.

Лекция № 8

 
 


Тема: Архивирование информации. Программы-архиваторы. Архивные файлы

 

 

П л а н:

  1. Архивирование информации.

 

  1. Архивные файлы.

 

  1. Программы-архиваторы.

 

1) Как известно вся информация представляемая в ЭВМ кодируется последовательностью сигналов высокого и низкого напряжения, которые мы обозначаем логической 1 и логическим 0. 1 или 0 – это информация в 1 бит. 8 последовательных бит – это 1 байт.

Таким образом, каждый символ, каждая графическая точка, выводимая на дисплей монитора занимают в памяти ЭВМ определённое количество байт. Сохраняя информацию на физическом носителе, мы занимаем определённое количество байт этого носителя. Например, если мы создали и сохранили новый текстовый файл, который содержал следующую информацию: «Это текстовый файл», то мы заняли 20 байт дискового пространства.

Дистрибутивы (инсталяшки (INSTALL), программы-установщики (SETUP)) современных программных продуктов (операционных систем, офисных приложений, систем обработки графики, библиотеки, массивы данных, игры и т.д.) занимают на дисках огромное пространство. Есть такие большие программные продукты, что распространение их на оптических дисках было бы просто невозможно, если бы не существовало сжатие информации. Архивирование информации позволяет существенно экономить место на физических носителях, представлять большие файловые пакеты в виде одного или нескольких файлов.

Архивирование информации – это процесс сжатия данных путем специальных программ-упаковщиков, которые с помощью удаления незначительных данных из файлов существенно уменьшают их размер.

Различная информация имеет различную степень сжатия. Хорошо подлежат архивированию текстовые файлы и файлы документов, графические файлы. Плохо подлежат архивированию программные файлы, архивные файлы, музыкальные файлы и видеофайлы.

2) Назовём исходным файлом тот файл, который подлежит архивированию. Архивным файлом назовём файл, который был обработан программой-архиватором и содержит один или несколько исходных файлов. Программой-архиватором (программой упаковщиком) назовём программу осуществляющую сжатие (архивацию) исходных файлов в один архивный файл.

Архивный файл может иметь любое имя, но должен иметь уникальное расширение, которое присваивает ему программа-архиватор.

Архивный файл обычно занимает на диске меньше места, чем исходный один или несколько файлов.

3) Существует огромное количество различных программ-архиваторов. Есть программы-архиваторы старого типа (под Ms Dos) которые работают с помощью командной строки или имеют свою собственную среду для работы (arj.exe, ain.exe, rar.exe, pkzip.exe/pkunzip.exe и т.д.). В настоящий момент широкое распространение получили программы-архиваторы работающие в среде Windows (WinArj, WinRar, Winzip, WinAce, Zip Magic). Все эти программы имели раньше прототип для работы в среде Ms Dos. С распространением Windows старые версии ушли в прошлое. Все перечисленные программы можно характеризовать следующими параметрами: одинаковый принцип работы, примерно одинаковый внешний интерфейс. Существенные различия заключаются только в степени сжатия информации.

Теоретические основы сжатия данных

Характерной особенностью большинства «классических» типов данных, с которыми традиционно работают люди, является определенная избыточность. Степень избыточности зависит от типа данных. Например, у видеоданных степень избы­точности обычно в несколько раз больше, чем у графических данных, а степень избыточности графических данных в несколько раз больше, чем текстовых. Кроме того, степень избыточности данных зависит от принятой системы кодирования. Так, например, можно сказать, что кодирование текстовой информации средствами русского языка (с использованием русской азбуки) дает в среднем избыточность на 20-30% больше, чем кодирование адекватной информации средствами англий­ского языка.

 

Для человека избыточность информации нередко связана с представлением о ее качестве, поскольку избыточность, как правило, улучшает восприятие, особенно в неблагоприятных условиях (просмотр телепередач при наличии помех, восстанов­ление поврежденного графического материала, чтение текстов в условиях недо­статочной освещенности и т. п.).

При обработке информации избыточность также играет важную роль. Так, напри­мер, при преобразовании или селекции информации избыточность используют для повышения ее качества (репрезентативности, актуальности, адекватности и т. п.). Однако, когда речь заходит не об обработке, а о хранении готовых документов или их передаче, то избыточность можно уменьшить, что дает эффект сжатия данных.

Если методы сжатия информации применяют к готовым документам, то нередко термин сжатие данных подменяют термином архивация данных, а программные средства, выполняющие эти операции, называют архиваторами.

 


Дата добавления: 2015-12-08; просмотров: 57 | Нарушение авторских прав



mybiblioteka.su - 2015-2024 год. (0.007 сек.)