
Посилальний рівень аудіо для домашнього кінотеатру
Інтегратори мають можливість запропонувати найвищу якість аудіо для домашніх кінотеатрів. Девід Майер пояснює, як правильно поєднати всю технологію, а не просто впроваджувати найдорожче обладнання.
У попередніх номерах я писав про рекомендовану практику RP22 Immersive Audio Design та її майбутнього компаньйона RP23 Immersive Video Design. Цього разу я зосереджусь на одному аспекті RP22, а саме на здатності рівня звуку (для тих, хто знайомий з RP22, це Розділ 6.1.4 з параметрами продуктивності 12-14), порівнюючи його з референсним аудіо рівнем контенту.
Номіновані значення рівня звукового тиску (SPL) в RP22 зосереджуються навколо 105 дБ референсу комерційного кіно, що рекомендовано для екранних динаміків в системі RP22 рівня 2 та є мінімумом для рівня 3. Продуктивність рівня 1 на 6 дБ нижча за це, тоді як рівень 4 на 6 дБ вищий, щоб максимально розширити динамічний діапазон.
Це викликало питання у деяких людей щодо походження цих чисел, тому робоча група стандартів CEDIA, яка розробила RP22, вирішила пояснити. Але в процесі вони натрапили на цікаве питання з різними змінними.
Результатом стала нова технічна звітність CEDIA під назвою “Референсний рівень аудіо та здатність SPL”. Мені пощастило бути залученим у цей процес, і хоча я рекомендую ознайомитися зі звітом, я хотів би поділитися деякими своїми спостереженнями та інтерпретаціями тут.
По-перше, вони висвітлили той факт, що аудіомікси для домашнього формату (відомі в спільноті пост-продакшну як “near-field” або “домашній розважальний” мікс) не мають такої ж послідовності між студіями, як театральний мікс для комерційного релізу. “Референс” – це не просто одне число, і це може мати наслідки щодо того, як це звучить вдома.
Як ми чуємо на різних рівнях звуку
Спосіб, яким ми чуємо повний діапазон аудіочастот, змінюється залежно від того, наскільки гучно. Ми більш чутливі до верхнього середнього діапазону (близько 3,5-4 кГц), ніж до високих і низьких частот, і ця різниця збільшується з пониженням рівня звуку.
У 1933 році дослідження цього явища призвело до формулювання контурів рівної гучності Флетчера-Мансона. Britannica добре це визначає: “Криві показують, які інтенсивності чистого тону мають однакову гучність для вуха на різних частотах.”
І якщо вам цікаво, “фон” – це одиниця сприйнятої гучності. Кожен контур (червона лінія) прив’язується до відповідного рівня звуку (ось Y, в дБ) на позначці 1 кГц.
Наприклад, простежуючи контур 60 фон, 1 кГц на 60 дБ сприймалося б як така ж гучність, як 45 Гц і 16 кГц приблизно на 80 дБ, або 3 кГц приблизно на 58 дБ. Ще один спосіб на це подивитися – це якщо всі частоти мали б однаковий рівень звуку, 45 Гц звучали б, ніби були на 20 дБ тихішими в порівнянні з 1 кГц. Ураховуючи, що зниження на 6 дБ SPL зазвичай представляє половину сприйнятої гучності, це величезна кількість! Але підвищте гучність до 100 дБ на 1 кГц (100 фон), і контур вирівнюється до 40 Гц.
Для всіх охочих до відео, які можуть читати це, це аналогічно гамма-кривій (хоча набагато складнішій), щоб врахувати, як наше зір більш чутливе до сірого, середнього контрасту, ніж до чорного або білого.
На практиці ці контури рівної гучності пояснюють, чому навіть неосвічене вухо може легко розпізнати, що музика, яка звучить “повно”, на одній гучності, здається, втрачає деякі високі частоти і, особливо, баси, відносно середнього діапазону, коли гучність зменшується. Це не обов’язково означає, що аудіосистема змінює звук; це наші вуха та слухова перцепція.
Саме для цього і призначена кнопка гучності в базових системах; це універсальна компенсація для низької гучності. Це також пояснює, чому людям подобається класичний “усміхнений обличчя” графічний еквалайзер, щоб трохи зменшити середній діапазон, одночасно підвищуючи бас і високі частоти. Але якщо він використовується, це також має бути тільки на низькій гучності. Коли гучність збільшується, контури вирівнюються, особливо нижче 600 Гц, тому вони можуть звучати “гудяче”, якщо гучність підвищується без переналаштування (але, чорт, деяким людям це теж подобається!).
Референсний рівень
Контури рівної гучності демонструють дві важливі взаємопов’язані речі:
Необхідність аудіоінженерів змішувати та EQ контент, який вони створюють, на рівні звуку, на якому він має бути відтворений.
Необхідність відтворювальних систем мати плоску частотну відповідь, щоб вони могли найбільш точно відтворювати контент з першого пункту.
Тепер розгляньте, що відбувається, коли фільм змішується в студії на 85 дБ, щоб найкраще передати художній намір, грається в кінотеатрі, каліброваному на 85 дБ, але гучність зменшується до середнього 70 дБ. Високі частоти трохи заглушуються (не зважаючи на X-криву, для тих, хто знайомий). Критично, бас, швидше за все, буде знижений на 6 дБ або більше. Це не добре. У протилежному випадку, якщо це було змішано, щоб звучати оптимально на 70 дБ, але відтворювалося на 85 дБ, сталося б зворотне, ймовірно, звучало б басисто.
Тому необхідно узгодити, наскільки це практично, рівні змішування та запланованого відтворення. Це те, що відоме як референсний рівень, метою якого є забезпечити консистентність від початку до кінця і зберегти художній задум.
Протягом десятиліть середній рівень 85 дБ (зазвичай використовуючи діалог як якорь) був референсом для театральних міксів, з 20 дБ запасу вище цього для гучніших частин саундтреку. Саме звідси походить число 105 дБ в RP22 — це 85 дБ референс + 20 дБ динамічного запасу.
Але деякі кажуть, що це надто гучно, навіть для комерційного кіно.
Коли гучність є занадто гучною?
Під час обговорень, що призвели до звіту, робоча група стандартів CEDIA спілкувалася з кількома незалежними експертами в області звуку в кіно. Серед них було загальне відчуття, що 105 дБ часто є занадто гучно. Але експерти в групі стандартів CEDIA вірно зауважили, що проблемою часто є спотворення. Динамічний саундтрек з піками 105 дБ може сприйматися як незручно гучний, якщо система навіть трохи спотворює, але якщо вона без спотворень, то пики до 105 дБ є більш іммерсивними і не повинні бути стомлюючими.
Необхідно також пам’ятати про безпеку, і не лише для підсилювачів і динаміків. Кілька джерел вказують, що постійне пошкодження слуху може виникнути після кількох годин Постійного загального впливу на 85 дБ, шести годин на 95 дБ або всього через 15 хвилин впливу з навушників (вкладиші) на 105 дБ. Закони безпеки на робочому місці в багатьох юрисдикціях встановлюють обмеження часу на вплив на 105 дБ без належного захисту слуху.
Але у фільмі такі рівні можуть досягатися лише на кілька секунд або кілька хвилин за раз. Іноді довше. Тому ці попередження не застосовуються. Концерти музики зазвичай є значно гучнішими протягом тривалого часу!
Також визнано, що маленькі кімнати зазвичай звучать голосніше, ніж великі кімнати на одному й тому ж SPL, особливо якщо в них мало чи взагалі немає акустичного оброблення. Це пов’язано з коротшими часами поширення звуку та збільшеними відбиттями, що можуть збільшити густину звуку, навіть якщо вимірюється як той же SPL. Тому широко визнаною практикою є змішування аудіотреків для малих кімнат на нижчих референсних рівнях. Аудіозмішувальні студії роблять саме це, фактично в менших кімнатах, щоб наблизити розмір планованих відтворювальних просторів, і на nearfield моніторах, щоб виготовити домашній розважальний мікс для споживачів.
Проблема в тому, що різні студії використовують різні референсні рівні та кімнати різних розмірів. Тому, натхненний роботою CEDIA Standards, я почав шукати приклади.
Аудіомікси для домашнього розваги
Я досліджував лише кілька студій, щоб зрозуміти, що вони роблять. Це різноманітна картина. Disney, Netflix і Warner Bros. узгодили своїй near-field референсні рівні, номінуючи 79 дБ або 82 дБ (C-вагова) плюс 18-20 дБ запасу, базуючись на специфікаціях Dolby Atmos, тоді як Paramount, схоже, дотримується театрального стандарту 85+20 дБ. Sony Pictures Entertainment більш консервативні – 75-79 дБ плюс 20 дБ запасу.
Спільне число серед більшості становить 79 дБ. Якщо обрати 20 дБ запасу для покриття всіх основ, це дає 99 дБ, що відповідає мінімальній вказівці продуктивності рівня 1 згідно RP22. Ось і все.
Всі вищезгадані творці контенту, а також безліч інших, включаючи HBO, Apple, Amazon та традиційні телевізійні мережі тощо, також застосовують контур “нормалізації гучності”. Відомий як K-вагування, він визначається стандартом ITU-R BS.1770 і є основою стандартів A/85 (ATSC) і EBU R128 (Європа).
Для тих, хто хоче впевненості в театральних міксах для свого найкращого приватного театру, деякі висококласні дизайнері можуть організувати контент Digital Cinema Package (DCP) через комерційні процесори та підлягає управлінню цифровими правами (DRM), зазвичай коштує тисячі доларів за заголовок для перегляду.
Так що, що все це означає?
Ну, наскільки б ідеаліст в мені не хотів думати, що більшість приватних розважальних просторів оптимізовані згідно RP22, реальність полягає в тому, що лише деякі преміальні спеціалізовані простори могли б відповідати цим вимогам.
Типова система домашнього кінотеатру, яка існує, знаходиться в загальному просторі з відносно високим шумовим фоном і малою або відсутньою акустичною обробкою. Ймовірно, вона не калібрована, частотна відповідь далеко не плоска, і власники виявляють, що підвищують гучність для тихих діалогів і знову знижують під час екшн-сцен. Промити та повторити.
Як прагматик, я завжди вважав, що справжня міра успіху системи – це чи задоволені власники нею, але це також залежить від того, чи дійсно вони знають, що можна порівняти.
У будь-якому випадку важливо оснастити іммерсивну аудіосистему достатньою потужністю, щоб забезпечити відтворення без спотворень на найвищих запланованих рівнях — подумайте про найгучніші піки під час демонстрації системи друзям. Але для повсякденного використання система повинна звучати найкраще, якщо калібрована на типовий запланований рівень відтворення. Ви не можете контролювати референтний рівень контенту, але можете оптимізувати систему в просторі. Поза цим завжди є регулятор гучності.
Публікація “Референсний рівень аудіо для домашнього кінотеатру” вперше з’явилася в Connected Magazine.
December 15, 2025 at 01:16AM

Залишити відповідь