Читайте также: |
|
Все форматы сжатия семейства MPEG (MPEG 1, MPEG 2, MPEG 4, MPEG 7) используют высокую избыточность информации в изображениях, разделенных малым интервалом времени. Между двумя соседними кадрами обычно изменяется только малая часть сцены – например, происходит плавное смещение небольшого объекта на фоне фиксированного заднего плана. В этом случае полная информация о сцене сохраняется выборочно – только для опорных изображений. Для остальных кадров достаточно передавать разностную информацию: о положении объекта, направлении и величине его смещения, о новых элементах фона, открывающихся за объектом по мере его движения. Причем эти разности можно формировать не только по сравнению с предыдущими изображениями, но и с последующими (поскольку именно в них по мере движения объекта открывается ранее скрытая часть фона).
Форматы сжатия семейства MPEG сокращают объем информации следующим образом:
Устраняется временная избыточность видео (учитывается только разностная информация).
Устраняется пространственная избыточность изображений путем подавления мелких деталей сцены.
Устраняется часть информации о цветности.
Повышается информационная плотность результирующего цифрового потока путем выбора оптимального математического кода для его описания.
Форматы сжатия MPEG сжимают только опорные кадры – I-кадры (Intra frame – внутренний кадр). В промежутки между ними включаются кадры, содержащие только изменения между двумя соседними I-кадрами – P-кадры (Predicted frame – прогнозируемый кадр). Для того чтобы сократить потери информации между I-кадром и P-кадром, вводятся так называемые B-кадры (Bidirectional frame – двунаправленный кадр). В них содержится информация, которая берется из предшествующего и последующего кадров. При кодировании в форматах сжатия MPEG формируется цепочка кадров разных типов. Типичная последовательность кадров выглядит следующим образом: IBBPBBIBBPBBIBB… Соответственно, последовательность кадров в соответствии с их номерами будет воспроизводиться в следующем порядке: 1423765…
Форматы сжатия видео изображения MPEG 1 и MPEG 2
В качестве начального шага обработки изображения форматы сжатия MPEG 1 и MPEG 2 разбивают опорные кадры на несколько равных блоков, над которыми затем производится дискетное косинусное преобразование (DCT). По сравнению с MPEG 1, формат сжатия MPEG 2 обеспечивает лучшее разрешение изображения при более высокой скорости передачи видео данных за счет использования новых алгоритмов сжатия и удаления избыточной информации, а также кодирования выходного потока данных. Также формат сжатия MPEG 2 дает возможность выбора уровня сжатия за счет точности квантования. Для видео с разрешением 352х288 пикселей формат сжатия MPEG 1 обеспечивает скорость передачи 1,2 – 3 Мбит/с, а MPEG 2 – до 4 Мбит/с.
По сравнению с MPEG 1, формат сжатия MPEG 2 обладает следующими преимуществами:
Как и JPEG2000, формат сжатия MPEG 2 обеспечивает масштабируемость различных уровней качества изображения в одном видеопотоке.
В формате сжатия MPEG 2 точность векторов движения увеличена до 1/2 пикселя.
Пользователь может выбрать произвольную точность дискретного косинусного преобразования.
В формат сжатия MPEG 2 включены дополнительные режимы прогнозирования.
Формат сжатия MPEG 2 использовал снятый сейчас с производства видеосервер AXIS 250S компании AXIS Communications, 16-канальный видеонакопитель VR-716 компании JVC Professional, видеорегистраторы компании FAST Video Security и многие другие устройства системы видеонаблюдения.
AVI (Audio Video Interleaved) - "перемежающееся аудио/видео"
Стандарт системы Windows для сохранения звуковых и видеоданных. Порции видеоданных следуют за порциями аудиоданных в строгом порядке. Особенность формата - отсутствие жесткой системы кодирования данных: аудио и видео могут кодироваться совершенно разными кодеками, что позволяет оптимизировать сжатие данных.
Современные алгоритмы видеокодирования
В настоящее время существует множество алгоритмов, позволяющих сжимать видео - часть из них зафиксирована в международных стандартах JPEG, MPEG, H.26x, более современные алгоритмы являются пока нестандартизованными.
Преимущество использования стандартов для сжатия видео-информации заключается в том, что любая стандартная программа проигрывателя (декодер) будет работать с любой сжатой по соответствующему стандарту видеопоследовательностью. При этом программы сжатия (кодер) могут производить различающиеся по своим качественным характеристикам потоки сжатого видео в зависимости от качества реализации алгоритмов сжатия.
Потенциальные преимущества нестандартных решений по сжатию могут заключаться только в улучшении параметров кодирования видео - степени сжатия, качества сжатого видео, поскольку заведомо существенным их недостатком по сравнению со стандартными решениями является наличие нестандартных декодеров.
В общем сжатие видео-информации может существовать в различных пределах, определяемых в том числе:
Кодером - набором алгоритмов сжатия и их реализацией;
Пространственным разрешением кодируемого видео - геометрическими размерами кадра в пикселях;
Пропускной способностью телекоммуникационного канала связи, под который сжимается видеопоследовательность, или "скоростью" устройства декодирования;
Требованиями к качеству видео, включающему как визуальное качество отдельных кадров, так и скорость кадров;
Пространственное разрешение определяется горизонтальным и вертикальным размерами кадра в пикселах - минимальных элементах изображения, представляемых яркостной и цветоразностными компонентами видеосигнала (1 пиксел в результате оцифровки исходного аналогового изображения обычно представляется 3 байтами). Пространственное разрешение в основном определяет, какой выходной поток сжатого видео в битах в секунду - битовая скорость - будет сформирован конкретным кодером. Битовая скорость при конкретном пространственном разрешении дальше будет определяться степенью пространственного сжатия. Чем больше степень сжатия, тем меньшее количество бит информации передается на один видеокадр и тем хуже будет результирующее визуальное качество.
23.
Примером несистематического кода является код с конт- рольным суммированием – итеративный код. В этом коде проверочные 74 разряды формируются в результате суммирования значений разрядов как в данной кодовой комбинации, так и одноименных разрядов в ряде соседних с ней комбинаций, образующих совместный блок. Итератив- ные коды позволяют получить так называемые мощные коды, т. е. коды с длинными блоками и большим кодовым расстоянием при сравни- тельно простой процедуре декодирования. Итеративные коды могут стро- иться как комбинационные посредством произведения двух или более систематических кодов.
Блочный итеративный код, исправляет одну ошибку с помощью набора проверок на четность по строкам и столбцам таблицы. Блочными называются коды, в которых информационный поток сим- волов разбивается на отрезки и каждый из них преобразуется в опреде- ленную последовательность (блок) кодовых символов. В блочных кодах кодирование при передаче (формирование проверочных элементов) и декодирование при приеме (обнаружение и исправление ошибок) вы- полняются в пределах каждой кодовой комбинации (блока) в отдельно- сти по соответствующим алгоритмам.
Блочные коды делятся на равномерные и неравномерные. В равно- мерных кодах, в отличие от неравномерных, все кодовые комбинации 72 содержат одинаковое число n-символов (разрядов) с постоянной дли- тельностью τ0 импульсов символов кода. Равномерные коды в основ- ном и применяются в системах связи, так как это упрощает технику передачи и приема.
Важным этапом в развитии теории кодирования является появление каскадных кодов [24], в основе построения которых лежит идея совместного использования нескольких составляющих кодов. Данный подход позволил существенно повысить эффективность применения кодирования по сравнению с базовыми некаскадными методами. Пример использования каскадного кода, состоящего из двух составляющих кодов, показан на рис. 4.1. Здесь данные
источника сначала кодируются внешним {щ, к\) кодом. В качестве внешнего кода часто используются недвоичные коды, например, коды Рида-Соломона. Затем закодированные символы внешнего кода кодируются кодером внутреннего («2, Лг) кода. Общая длина кодового слова каскадного кода оказывается равной М=п\П2 двоичных символов, причем К=к]к2 из них являются информационными. Следовательно, кодовая скорость полученного каскадного кода оказывается равной
где гь ^2 - кодовые скорости составляющих кодеров. Также отметим, что минимальное расстояние сформированного каскадного кода будет равно D=d\d2, где d\ и J2 - минимальные расстояния составляющих кодов.
Декодирование каскадного кода осуществляется в обратном порядке, т.е. принятая из канала последовательность сначала декодируется декодером внутреннего кода, а затем полученная последовательность декодируется декодером внешнего кода. Подчеркнем, что хотя общая длина кода равна Л^, структура каскадного кода позволяет применять для декодирования два декодера кодов с длинами всего лишь щ и «2 соответственно. Данное свойство позволяет существенно снизить сложность декодирования по сравнению с сопоставимыми по эффективности декодерами некаскадных блоковых или сверточных кодов.
24.
Совокупность амплитуд Ak называют амплитудным, а совокупность фаз j k – фазовым спектрами. Амплитудный и фазовый спектры сигнала в совокупности однозначно определяют его форму (временную зависимость).еоретически ширина спектра сигналов бесконечна.
Учитывая, что интенсивность спектральных составляющих реальных сигналов уменьшается с ростом их частоты (не обязательно монотонно), можно ввести понятие практической (конечной) ширины спектров (рис. 2.3 и 2.4). Практическую ширину спектра DW можно определять как ширину частотного интервала, в пределах которого амплитудный спектр S(w) не меньше некоторого условного уровня g (например g = 0,1) от S(w)max или энергия (мощность) сигнала составляет определённую часть g (например g = 0,9) от полной
.
Для импульсов простых форм (прямоугольной, треугольной и т.п.), спектральная функция которых периодически принимает нулевые значения с ростом частоты (рис. 2.3 и 2.4), практическую ширину спектра часто определяют по первому или второму или иному «нулю» амплитудного спектра.
Независимо от способа определения практической ширины спектра Т-финитного сигнала выполняется общая закономерность – произведение практической ширины спектра на длительность сигнала D t есть константа C, зависящая только от формы импульса
DW·D t = C.
Это соотношение имеет фундаментальное значение в теории связи. Из него вытекает, что чем короче сигнал, тем шире его спектр и, следовательно, тем более широкополосный канал требуется для его передачи.
Дата добавления: 2015-07-21; просмотров: 86 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Методы сжатия изображений | | | Теплотехнический расчет |