Читайте также: |
|
В этом эксперименте участвовали 9 слушателей. У всех их уже был опыт оценки аудио кодеков, и они были специально проинструктированы оценивать как качество стерео панорамы, так и другие заметные явления. В ходе теста, проводимого по «слепому» методу MUSHRA,[94] слушателям нужно было сравнить субъективное качество восприятия нескольких обработанных фрагментов с оригиналом (необработанным) по 100-бальной шкале. Всем им были предоставлены наушники Stax Lambda Pro. Обработанные фрагменты включали в себя:
(1) кодирование и декодирование с помощью современного алгоритма MPEG-1 layer 3 (MP3) со скоростью 128 кбит/c и максимально возможными параметрами качества;
(2) кодирование и декодирование с помощью кодера на основе БПФ без моно кодера, как было сказано выше (т.е. предполагается прозрачное моно кодирование) со скоростью 8 кбит/c;
(3) encoding and decoding using the FFT-based parametric- stereo coder without mono coder operating at a bit rate of 5 kbps (using 20 analysis frequency bands instead of 34);
(4) the original as hidden reference.
The 13 test excerpts are listed in Table 3. All items are stereo, 16-bit resolution per sample, at a sampling frequency of 44.1 kHz. The subjects could listen to each excerpt as often as they liked and could switch in real time between the four versions of each item. The 13 selected items showed to be the most critical items from an 80-item test set for either parametric stereo or MP3 during development and in-between evaluations of the algorithms described in this paper. The items had a duration of about 10 seconds and contained a large variety of audio classes. The average scores of all subjects are shown in Figure 11. The top panel shows mean MUSHRA scores for 8 kbps parametric stereo (black bars) and MP3 at 128 kbps (white bars) as a function of the test item. The rightmost bars indicate the mean across all test excerpts. Most excerpts show very similar scores, except for excerpts 4, 8, 10, and 13. Excerpts 4 (“Harpsichord”) and 8 (“Plucked string”) show a significantly higher quality for parametric stereo. These items contain many tonal components, a property that is typically problematic for waveform coders due to the large audibility of quantization noise for such material. On the other hand, excerpts 10 (“Man in the long black coat”) and 13 (“Two voices”) have higher scores forMP3. Item13 exhibits an (unnaturally) large amount of channel separation, which is partially lost after parametric-stereo decoding. On average, both coders have equal scores.
The middle panel shows results for the parametric-stereo coder working at 5 kbps (black bars) and 8 kbps (white bars). In most cases, the 8 kbps coder has a higher quality than the 5 kbps coder, except for excerpts 5 (“Castanets”) and 7 (“Glockenspiel”). On average, the quality of the 5 kbps coder is only marginally lower than for 8 kbps, which demonstrates the shallow bit-rate/quality slope for the parametric-stereo coder.
The bottom panel shows 128 kbps MP3 (white bars) against the hidden reference (black bars). As expected, the hidden reference scores are close to 100. For fragments 7 (“Glockenspiel”) and 10 (“Man in the long black coat”), the hidden reference scores lower than MP3 at 128 kbps, which indicates transparent coding.
(3) кодирование и декодирование с помощью кодера на основе БПФ без моно кодера со скоростью 5кбит/c (используя 20 частотных полос анализа вместо 34);
(4) оригинал в качестве скрытого эталона.
В таблице 3 приведены 13 фрагментов. Все они являются стереофоническими и имеют 16-разрядние отсчеты с частотой дискретизации 44.1 кГц. Каждый отрывок можно слушать столько раз, сколько хочется, и можно в режиме реального времени переходить к одной из четырех версий фрагмента. Выбранные для таблицы 13 фрагментов оказались самыми критичными в списке из 80 пунктов как для параметрического стерео или МРЗ, так и для промежуточной оценки алгоритмов, описанных в данной статье. Все фрагменты длились около 10 секунд и принадлежали к разным музыкальным жанрам. Средняя оценка всех испытателей показана на рис 11. Сверху показано среднее значение оценок MUSHRA для параметрического стерео 8 кбит/с (черные столбики) и МРЗ со скоростью 128 кбит/с (белые) как функция от номера фрагмента. Столбики справа показывают среднее арифметическое всех исследуемых отрывков. Большинство фрагментов получили примерно одинаковые оценки, кроме фрагментов 4,8,10 и 13. Фрагмент 4 (“Harpsichord”) и 8 (“Plucked string”) значительно более качественные при использовании параметрического стерео кодирования. В них много тональных компонент, что является проблемой при кодировании формы сигнала из-за высокого уровня шума квантования в этом случае. С другой стороны, фрагмент 10 (“Человек в длинном черном пальто”) и 13 («Два голоса») получили более высокие оценки при МРЗ. Фрагмент 13 представляет собой (искусственно) большую независимость каналов, что практически потерялось после параметрического стерео декодирования. В итоге оба кодера получили равные оценки.
На среднем рисунке показаны результаты для параметрического стерео со скоростью 5 кбит/с (черные столбики) и 8 кбит/с (белые). В большинстве случаев кодер с 8 кбит/с обладает лучшим качеством, чем при 5 кбит/с, кроме фрагмента 5 («Кастаньеты») и 7 (“Glockenspiel”). В итоге качество кодера при 5 кбит/с незначительно ниже, чем при 8 кбит/с, что показывает медленно убывающее отношение скорость/качество при параметрическом кодировании.
Самый нижний график показывает результаты для МРЗ со скоростью 128 кбит/с (белые столбики) и скрытого эталона (черные). Как и ожидалось, у скрытого эталона оценки близки к 100. Для фрагментов 7 (“Glockenspiel”) и 10 (“Человек в длинном черном пальто”), оценки эталона ниже, чем МРЗ при скорости 128 кбит/c, что указывает на «прозрачное» кодирование.
Table 3:Description of test material.
Figure 11: MUSHRA scores averaged across listeners as a function of test item and various coder configurations (see text). The upper panel shows the results for 8kbps parametric stereo (black bars) against stereoMP3 at 128 kbps (white bars). The middle panel shows the results for 5 kbps parametric stereo (black bars) versus 8 kbps parametric stereo (white bars). The lower panel shows the hidden reference (black bars) versus MP3 at 128 kbps (white bars).
Дата добавления: 2015-11-14; просмотров: 26 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Декодер на базе квадратурных зеркальных фильтров (QMF) | | | Контрольное прослушивание 2. |