Психоакустична модель кодування МР3

Читайте также:

Як і формат JPEG, MP3 використовує спектральні відсікання, згідно психоакустичної моделі. Звуковий сигнал розбивається на рівні за тривалістю відрізки, кожен з яких після обробки упаковується в свій фрейм (кадр). Розкладання в спектр вимагає безперервності вхідного сигналу, тому для розрахунків використовується також попередній і наступний фрейм. У звуковому сигналі є гармоніки з меншою амплітудою і гармоніки, що лежать поблизу більш інтенсивних - такі гармоніки відсікаються, так як середньостатистичне людське вухо не завжди зможе визначити присутність або відсутність таких гармонік. Така особливість слуху називається ефектом маскування. Також можлива заміна двох і більше довколишніх піків одним усередненим (що як правило і призводить до спотворення звуку). Критерій відсікання визначається вимогою до вихідного потоку. Оскільки весь спектр актуальний, високочастотні гармоніки не відсікаються, як в JPEG, а тільки вибірково видаляються, щоб зменшити потік інформації за рахунок розрідження спектра. Після спектральної «зачистки» застосовуються математичні методи стиснення та упаковка у фрейми. Кожен фрейм може мати кілька контейнерів, що дозволяє зберігати інформацію про декілька потоках (лівий і правий канал або центральний канал і різниця каналів). Ступінь стиснення можна варіювати, в тому числі в межах одного кадру. Інтервал можливих значень бітрейту складає 8-320 бит/c.

Психоакустичні моделі слуху дозволяють з високою якістю виробляти компресію сигналу з втратою інформації (коли відновлений сигнал не збігається з вихідним), за рахунок того, що дозволяють точно описати, що можна безпечно видалити з вихідного сигналу - тобто без значного погіршення якості звуку. На перший погляд може здатися, що навряд чи це дозволить забезпечити сильне стиснення сигналу, однак програми, що використовують психоакустические моделі, дозволяють домогтися зменшення обсягів файлів з музикою в 10-12 разів, і при цьому різниця в якості буде не дуже значна.

19. Формати збереження аудіо-даних: WAV, MIDI, МР3, AC3

WAV — це формат для зберігання нестисненого аудиопотока, широко використовуваний в медіаіндустрії. Його особливість у тому, що для кодування амплітуди виділяється фіксований число біт. Це позначається на розмірі вихідного файлу, але робить його дуже зручним для читання. Типовий wave-файл складається з заголовної частини, тіла відповідатиме звуку і хвоста для додаткової інформації, куди аудіоредактор можуть записувати власні метадані.

З заголовної частини витягуються основні параметри - число каналів, бітрейт, число фреймів - на підставі яких здійснюється розбір аудиопотока. Wave-файл зберігає в собі 1 або 2 канали, кожен з яких кодується 8, 16, 24 або 32 бітами. Послідовність біт, що описує амплітуду хвилі в момент часу, називається семплом. Послідовність семплів для всіх каналів в певний момент називається фреймом.

MIDI — стандарт цифрового звукозапису на формат обміну даними між електронними музичними інструментами.

Інтерфейс дозволяє одноманітно кодувати в цифровій формі такі дані як натискання клавіш, настройку гучності та інших акустичних параметрів, вибір тембру, темпу, тональності та ін, з точною прив'язкою в часі. В системі кодувань присутня безліч вільних команд, які виробники, програмісти та користувачі можуть використовувати на свій розсуд. Тому інтерфейс MIDI дозволяє, крім виконання музики, синхронізувати управління іншим обладнанням, наприклад, освітлювальним, піротехнічним.

Послідовність MIDI-команд може бути записана на будь-який цифровий носій у вигляді файлу, передана по будь-яких каналах зв'язку. Відтворює пристрій або програма називається синтезатором (секвенсором) MIDI і фактично є автоматичним музичним інструментом.

MP3 використовує алгоритм стиснення з втратами, розроблений для істотного зменшення розміру даних, необхідних для відтворення запису і забезпечення якості відтворення звуку дуже близького до оригінального (на думку більшості слухачів), хоча аудіофіли говорять про відчутне розходженні. При створенні MP3 із середнім бітрейтом 128 кбіт / с в результаті виходить файл, розмір якого приблизно дорівнює 1 / 11 від оригінального файлу з CD- Audio. Саме по собі нестиснене аудіо формату CD -Audio має бітрейт 1411,2 кбіт / с. MP3- файли можуть створюватися з високим або низьким бітрейтом, який впливає на якість файлу - результату. Принцип стиснення полягає в зниженні точності деяких частин звукового потоку, що практично невиразно для слуху більшості людей. Даний метод називають кодуванням сприйняття. [ 1 ] При цьому на першому етапі будується діаграма звуку у вигляді послідовності коротких проміжків часу, потім на ній видаляється інформація, що не помітна людським вухом, а залишилася інформація зберігається в компактному вигляді. Даний підхід схожий на метод стиснення, використовуваний при стисненні картинок в формат JPEG.

AC3: Сістотна різниця між MP3 і AC3 полягає лише в тому, що в потоці MP3 присутні тільки один (моно) або два (стерео) каналу, а в AC3 може бути присутнім будь-яку кількість каналів аж до 5.1.

20. 3D-звук. HRTF та HRIR функції

Об'ємний звук - відтворення багатоканальних фонограм через систему гучномовців, розташованих по колу від слухача, для збільшення просторового звукового ефекту, з системою 5D, що виражається у відтворенні акустичної атмосфери в обмеженому просторі кінозалу або кімнати домашнього кінотеатру.

HRTF (Head Related Transfer Function) це процес, за допомогою якого наші два вуха визначають чутне місце розташування джерела звуку; наші голова і тулуб є в деякій мірі перешкодою, задерживающим і фільтруючим звук, тому вухо, приховане від джерела звуку головою сприймає змінені звукові сигнали, які при " декодуванні " мозком інтерпретуються відповідним чином для визначення місця розташування джерела звуку. Звук, уловлює нашим вухом, створює тиск на барабанну перетинку. Для визначення створюваного звукового тиску необхідно визначити характеристику імпульсу сигналу від джерела звуку, що потрапляє на барабанну перетинку, тобто силу, з якою звукова хвиля від джерела звуку впливає на барабанну перетинку. Цю залежність називають Head Related Impulse Response (HRIR), а її інтегральне перетворення по Фур'є називається HRTF.

21.Синтез бінауральних сигналів

Бінауральні ритми - артефакт роботи головного мозку, уявні звуки керованої музики, які мозок сприймає («чує»), хоча реальні звуки цієї частоти відсутні.

Щоб спостерігати бінауральні ритми, досить надягти стереонавушники, в яких на різні вуха подаються сигнали, що трохи відрізняються за частотою, різницю сигналів мозок сприймає як природні биття низької частоти. Для того, щоб такі биття були чутні, їх частота тонів повинна бути не вище 1000-1500 Гц, а різниця частот не вище 30 Гц, але все ж переважно не більше 25 Гц. При більшій різниці частот людина чує два роздільних тони, і биття не виникає. З фізичної точки зору це злиття двох хвиль, фази яких періодично збігаються, тим самим створюючи побічну хвилю низької частоти.

22. Особливості відтворення 3D-звучання за допомогою стереосистем

23. Створення ефекту множинних аудіо-подій

24. Апаратне забезпечення технології 3D-звуку

Щоб долучити свій комп'ютер до світу навколишнього звуку (surround), потрібно дві речі: звукова карта з підтримкою 5.1 і сама акустична система 5.1. До складу комп'ютерної системи 5.1 можуть входити різні апаратні декодери (наприклад, Dolby Digital), а можуть не входити. Декодування може здійснюватися на рівні драйверів звукової карти. Як правило, сучасні багатоканальні звукові карти містять цифровий вихід S / PDIF. Якщо в складі системи 5.1 мається декодер, то ви можете підключити систему 5.1 через цей цифровий інтерфейс, тоді декодування багатоканального цифрового потоку здійснюватиметься апаратним декодером системи 5.1.

25. Узагальнена структурна схема аудіоплати

Звукова карта перетворює аналоговий сигнал в сигнал двійкового коду (цифровий сигнал) і навпаки. Це основна виконувана функція звукової карти.

Звуковий сигнал з мікрофону або плеєра подається на один із входів звукової карти. Це аналоговий сигнал. Він надходить на вхідний мікшер, який служить для змішування сигналів, якщо їх надходить на вхід декілька. Потім сигнал з вхідного мікшера надходить на аналого-цифровий перетворювач (АЦП), за допомогою якого відбувається оцифровка аналогового сигналу, тобто перетворення його в дискретний двійковий сигнал.

Потім цифрові дані надходять в серці звукової плати - процесор (DSP - Digital Signal Processor). Цей процесор управляє обміном даними з комп'ютером через шину PCI материнської плати.

Коли центральний процесор комп'ютера виконує програму запису звуку, то цифрові дані надходять через шину PCI або прямо на жорсткий диск, або в оперативну пам'ять комп'ютера. Присвоївши цими даними ім'я, ми отримаємо звуковий файл.

Структурная схема звуковой карты

рис 25.1

26. Основні характеристики аудіоплат

[Здесь 4, но вроде Сулема давала больше. Если у кого-то есть, поправьте/дополните, пожалуйста.]

Акустичні характеристики:

Амплітудно-частотна характеристика (АЧХ) - залежність амплітуди коливання на виході звукової карти (вихід на звукові колонки) від частоти вхідного аналогового сигналу при постійній за амплітудою вхідного сигналу. Амплітудно-частотна характеристика показує, як передаються окремі частотні складові аналогового сигналу через звукову плату, і дозволяє оцінити спотворення його спектра.

Відношення сигнал / шум - являє собою відношення значень (в децибелах) неспотвореного максимального сигналу на виході звукової плати до рівня шумів електроніки, що виникають у власних електричних схемах плати. Так як людина сприймає шум на різних частотах по-різному, був розроблений стандарт, який враховує дратівливий рівень шуму. Чим це співвідношення вище, тим звукова система якісніше. Зниження цього параметра до 75 дБ неприпустимо.

Сумарні нелінійні спотворення - відображає вплив спотворень, що вносяться окремими каналами посилення звуку і шумів, що генеруються самою платою. Він вимірюється у відсотках від рівня неспотвореного вихідного сигналу. Пристрій з рівнем нелінійних спотворень більш 0. 1% не може вважатися якісним. Нелінійні спотворення більш проявляються у вигляді спотворення якості відтвореного звуку

Динамічний діапазон. Виражена в децибелах різниця між max і min сигналом, яку плата може пропустити. В ідеальній цифрової аудіосистеми динамічний діапазон повинен бути близький до 98 дБ.

Технічні характеристики:

Розрядність звуку, біт

Частота дискретизації, кГц

Розрядність АЦП/ЦАП, біт

Поліфонія - кількість голосів, що можуть звучати одночасно.

Кількість інструментів, семпл для яких записаний в ПЗП.

Інтерфейс-USB

28. Колір та його атрибути. CIE Chromaticity Diagram. Кольорова система

Дата добавления: 2015-10-29; просмотров: 148 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
WT-синтез звуку	\|	CIE Chromaticity Diagram

mybiblioteka.su - 2015-2025 год. (0.008 сек.)