Читайте также: |
|
Декодер на основе БПФ, как сказано в предыдущей главе, требует достаточно большой длины БПФ, чтобы обеспечить значительное разрешение по частоте в области низких частот. В результате разрешение на высоких частотах выше, чем нужно, и следовательно, требования к памяти декодера на основе БПФ гораздо больше, чем требуется. Чтобы снизить разрешение по частоте в области ВЧ, используют банк гибридных комплексных фильтров.
To be more specific, a hybrid complex-modulated quadrature mirror filter bank (QMF) is used which is an extension to the filter bank as used in spectral band replication (SBR) techniques [5, 6, 90]. The outline of the QMF-based parametric-stereo decoder is shown in Figure 6.
Figure 6: Structure of the QMF-based decoder. The signal is first fed through a hybrid QMF analysis filter bank. The filter-bank output and a decorrelated version of each filter-bank signal are subsequently fed into the mixing and phase-adjustment stage. Finally, two hybrid QMF banks generate the two output signals.
Figure 7: Structure of the hybrid QMF analysis and synthesis filter banks.
The input signal is first processed by the hybrid QMF analysis filter bank. A copy of each filter-bank output is processed by a decorrelation filter. This filter has the same purpose as the decorrelation filter in the FFT-based decoder; it generates a decorrelated version of the input signal in the QMF domain. Subsequently, both the QMF output and its decorrelated version are fed into the mixing and phaseadjustment stage. This stage generates two hybrid QMFdomain output signals with spatial parameters that match the transmitted parameters. Finally, the output signals are fed through a pair of hybrid QMF synthesis filter banks to result in the final output signals. The hybrid QMF analysis filter bank consists of a cascade of two filter banks. The structure is shown in Figure 7. The first filter bank is compatible with the filter bank as used in SBR algorithms. The subband signals which are generated by this filter bank are obtained by convolving the input signal with a set of analysis filter impulse responses hk [ n ] given by
Если быть более точным, гибридные комплексно-модулированные квадратурные зеркальные фильтры, которые являются расширением банка фильтров, используемого в методах копирования спектральной полосы (SBR) [5, 6, 90]. Обобщенная структура параметрического стерео декодера на базе QMF показана на рисунке 6.
Рисунок 6: Структура декодера на базе QMF. Сигнал сначала подается на банк гибридных анализирующих QMF фильтров. Затем сигналы с выхода банка фильтров и некоррелированная версия этих сигналов подаются на устройство перемешивания и фазовой регулировки. В конце два банка гибридных QMF генерируют два выходных сигнала.
Рисунок 7. Структура анализирующего и синтезирующего банка гибридных квадратурных зеркальных фильтров.
Входной сигнал сначала обрабатывается банком анализирующих фильтров. Копия каждого сигнала, прошедшего фильтры, обрабатывается корреляционным фильтром. У него такая же цель, как у корреляционного фильтра в декодере на базе БПФ. Он создает некоррелированную версию входного сигнала в QMF области. Потом сигналы с выхода банка QMF фильтров и корреляционного фильтра подаются на устройство перемешивания и фазовой регулировки. Это устройство создает два выходных сигнала в QMF области с пространственными параметрами, соответствующими переданным. В конце выходные сигналы подаются на банк синтезирующих фильтров, чтобы получить конечные выходные сигналы. Банк анализирующих фильтров состоит из каскадного соединения двух банков фильтров. Его структура показана на рисунке 7. Первый банк фильтров сочетается с банком фильтров, используемых в алгоритмах SBR. Сигналы субполос, которые создаются банком фильтров, получаются путем выполнения операции свертки входного сигнала с импульсными характеристиками hk [ n ] анализирующих фильтров.
with p 0[ n ], for n = 0, ..., Nq − 1, the prototype window of the filter, K = 64 the number of output channels, k the subband index (k = 0, ..., K − 1), and Nq = 640 the filter length. The filtered outputs are subsequently down sampled by a factor K, to result in a set of down-sampled QMF outputs (or subband signals) Sk [ q ]:1
The magnitude responses of the first 4 frequency bands (k = 0, ..., 3) of the QMF analysis bank are illustrated in Figure 8.
Figure 8: Magnitude responses of the first 4 of the 64-band SBR complex-exponential modulated analysis filter bank. The magnitude for k = 0 is highlighted.
The down-sampled subband signals Sk [ q ] of the lowest QMF subbands are subsequently fed through a second complex-modulated filter bank (sub-filter bank) to further enhance the frequency resolution; the remaining subband signals are delayed to compensate for the delay which is introduced by the sub-filter bank. The output of the hybrid (i.e., combined) filter bank is denoted by Sk, m [ q ], with k the subband index of the initial QMF bank, and m the filter index of the sub-filter bank. To allow easy identification of the two filter banks and their outputs, the index k of the first filter bank will be denoted “subband index,” and the index m of the subfilter bank is denoted “sub-subband index.” The sub-filter bank has a filter order of Ns = 12, and an impulse response Gk, m [ q ] given by
with gk [ q ] the prototype window associated with QMF band k, q the sample index, and Mk the number of sub-subbands in QMF subband k (m = 0, ..., Mk − 1).
1The equations given here are purely analytical; in practice the computational efficiency of the filter bank can be increased using decomposition methods.
Где p 0[ n ], при n = 0, ..., Nq − 1, окно-прототип фильтра, K = 64 – число выходных каналов, k – номер субполосы(k = 0, ..., K − 1), а Nq = 640 – порядок фильтра. После выхода фильтров, частоту дискретизации понижают в K раз, чтобы последовательность выходных сигналов QMF с пониженной частотой дискретизации (или субполосных сигналов) Sk [ q ]:1
Амплитудные характеристики первых четырех субполос (k = 0, ..., 3) банка анализирующих QMF фильтров показаны на рисунке 8.
Рисунок 8: Амплитудные характеристики первых четырех субполос банка 64-полосных SBR комплексно-экспоненциальных модулированных анализирующих фильтров. Амплитуда при k = 0 выделена сплошной линией.
Субполосные сигналы с пониженной частотой дискретизации Sk [ q ], имеющие нижние индексы субполос, подаются на второй банк комплексно-модулированных фильтров (банк суб-фильтров) для дальнейшего повышения разрешения по частоте. Сигналы остальных полос задерживаются, чтобы скомпенсировать задержку, возникающую в банке субфильтров. Выход банка гибридных (т.е. совмещенных) фильтров обозначается Sk, m [ q ], где k – номер субполосы исходного банка QMF,а m – номер фильтра в банке субфильтров. Чтобы было проще определять выходы двух банков фильтров, индекс k называют «индекс субполосы», а m – «индекс суб-субполосы». Банк субфильтров содержит фильтры порядка Ns = 12 с импульсными характеристиками
где gk [ q ] – окно-прототип, связанный с банком QMF k, q – номер отсчета, а Mk – количество суб-субполос в субполосе k (m = 0,...,Mk − 1).
1. Выражения, приведенные здесь чисто аналитические. На практике вычислительную эффективность можно повысить, используя методы разложения.
Table 2 gives the number of sub-subbands Mk as a function of the QMF band k, for both the 34 and 20 analysis-band configurations. As an example, the magnitude response of the 4-band sub-filter bank (Mk = 4) is given in Figure 9.Obviously, due to the limited prototype length (Ns = 12), the stop-band attenuation is only in the order of 20 dB.
Table 2: Specification of Mk for the first 5 QMF subbands.
Figure 9: Magnitude response of the 4-band sub-filter bank. The response for m = 0 is highlighted.
As a result of this hybrid QMF filter-bank structure, 91 (for B = 34) or 77 (B = 20) down-sampled filter outputs Sk, m [ q ] and their filtered (decorrelated) counterparts Sk, m, d [ q ] are available for further processing. The decorrelation filter can be implemented in various ways. An elegant method comprises a reverberator [24]; a low-complexity alternative consists of a (frequency-dependent) delay Tk of which the delay time depends on the QMF subband index k.
The next stage of the QMF-based spatial synthesis stage performs a mixing and phase-adjustment process. For each sub-subband signal pair Sk, m [ q ], Sk, m, d [ q ], an output signal pair Yk, m,1[ q ], Yk, m,2[ q ] is generated by
В таблице 2 приведены номера суб-субполос Mk как функции от банка фильтров k для 34 и 20 полос анализа. В качестве примера, на рисунке 9 приведены амплитудно-частотные характеристики четырехполосного банка субфильтров (Mk = 4). Очевидно, что из-за ограниченной длины прототипа (Ns = 12), ослабление в полосе ослабления только порядка 20 дБ.
Таблица 2. Спецификация Mk для первых пяти субполос QMF
Рисунок 9. Амплитудно-частотная характеристика четырехполосного банка субфильтров. Характеристика при m = 0 выделена сплошной линией.
Результатом такой структуры является 91 (при B = 34) либо 77 (B = 20) выходных Sk, m [ q ] с пониженной частотой дискретизации, а так же их отфильтрованные (декоррелированные) аналоги Sk, m, d [ q ], доступные для дальнейшей обработки. Корреляционный фильтр можно реализовать разными способами. Элегантный метод представлен в [24]; он включает в себя ревербератор. Альтернативный менее сложный способ включает в себя (частотно зависимую) задержку Tk, время задержки которой зависит от номера субполосы k QMF.
Следующим этапом пространственного синтеза на основеQMF является смешивание и фазовая регулировка. Для каждой суб-субполосной сигнальной пары Sk, m [ q ], Sk, m, d [ q ] генерируется выходная сигнальная пара Yk, m,1[ q ], Yk, m,2[ q ]:
The mixing matrix R k, m is determined as follows. Each quartet of the parameters IID, IPD, OPD, and IC for a single parameter subband b represents a certain frequency range and a certain moment in time. The frequency range depends on the specification of the encoder analysis frequency bands (i.e., the grouping of FFT bins), while the position in time depends on the encoder time-domain segmentation. If the encoder is designed properly, the time/frequency localization of each parameter quartet coincides with a certain sample index in a sub-subband or set of sub-subbands in the QMF domain. For that particular QMF sample index, the mixing matrices are exactly the same as their FFT-based counterparts (as specified by (25)–(32)). For QMF sample indices in between, the mixing matrices are interpolated linearly (i.e., its real and imaginary parts are interpolated individually). The mixing process is followed by a pair of hybrid QMF synthesis filter banks (one for each output channel), which also consist of two stages. The first stage comprises summation of the sub-subbands m which stem from the same subband k:
Finally, upsampling and convolution with synthesis filters (which are similar to the QMF analysis filters as specified by (33)) results in the final stereo output signal. The fact that the same filter-bank structure is used for both PS and SBR enables an easy and low-cost integration of SBR and parametric stereo in a single decoder structure (cf. [23, 24, 91, 92]). This combination is known as enhanced aacPlus and is under consideration for standardization in MPEG-4 as the HE-AAC/PS profile [93]. The structure of the decoder is shown in Figure 10. The incoming bit stream is demultiplexed into a band-limited AAC bit stream, SBR parameters, and parametric-stereo parameters. The AAC bit stream is decoded by an AAC decoder and fed into a 32- band QMF analysis bank. The output of this filter bank is processed by the SBR stage and by the sub-filter bank as described in Section 7. The resulting full-bandwidth mono signal is converted to stereo by the PS stage, which performs decorrelation and mixing. Finally, two hybrid QMF synthesis banks result in the final output signals. More details on enhanced aacPlus can be found in [23, 92].
Матрица смешивания R k, m определяется следующим образом. В каждой группе параметров IID, IPD, OPD и IC для каждого параметра субполоса b занимает определенный диапазон частот в определенный момент времени. Частотный диапазон зависит от особенностей анализа полос кодером (т.е. от группировки отсчетов БПФ), тогда как момент времени зависит от того, как кодер выполнит сегментацию во временной области. Если кодер сконструирован верно, частотно-временное положение каждой группы параметров совпадает с определенным номером суб-субполосы или нескольких суб-субполос в области QMF. Для некоторых номеров отсчетов матрицы смешивания точно такие же, как их аналоги, основанные на БПФ (как указано в (25)–(32)). Для отсчетов, находящихся посередине, матрицы смешивания линейно интерполируются (т.е. их вещественные и мнимые части интерполируются отдельно). После смешивания следует пара банков гибридных синтезирующих фильтров (один на каждый канал). Процедура синтеза тоже состоит из двух этапов. На первом этапе выполняется суммирование суб-субполос m, относящихся к одной субполосе k:
И наконец, для получения выходного стерео сигнала выполняется повышение частоты дискретизации и свертка с импульсными характеристиками синтезирующих фильтров (которые аналогичны анализирующим, как указано в (33)). Тот факт, что для PS и SBR используются банки фильтров одинаковой структуры, позволяет легко и без особых затрат совместить SBR и параметрическое кодирование в одном декодере (см. [23, 24, 91, 92]). Эта комбинация известна как расширенное aacPlus и рассматривается как стандарт для MPEG-4 в качестве HE-AAC/PS профиля [93]. Структура декодера показана на рисунке 10. Входящий цифровой поток демультиплексируется в поток ААС с ограниченной шириной полосы, параметрами SBR и данными о параметрическом стерео. ААС поток декодируется с помощью ААС декодера и подается на банк 32-полосных анализирующих фильтров. Выход этого банка фильтров обрабатывается путем SBR и банком субфильтров, как описано в главе 7. Результирующий широкополосный монофонический сигнал преобразуется в стерео с помощью процедуры PS, которая заключается в декорреляции и смешивании. В конце два банка гибридных синтезирующих фильтров создают выходной сигнал. Более подробную информацию о расширенном aacPlus можно найти в [23, 92].
Figure 10: Structure of enhanced aacPlus.
Дата добавления: 2015-11-14; просмотров: 41 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
QMF-BASED DECODER | | | Контрольное прослушивание 1 |