
PCM аудіо пояснено: як звук перетворюється на числа
https://ift.tt/XMWvK4A
Коли ви прослуховуєте WAV-файл, записуєте аудіо через мікрофон або обробляєте мовні дані для машинного навчання, швидше за все ви працюєте з PCM-аудіо.
Але що саме таке PCM і чому він такий важливий?
Що таке PCM?
PCM означає Pulse Code Modulation (імпульсна кодова модуляція).
Це один із найпоширеніших методів подання аудіо в цифровій формі.
Замість того, щоб зберігати звук як неперервну хвилю, PCM зберігає послідовність числових значень. Кожне значення представляє амплітуду звукової хвилі в певний момент часу.
Наприклад:
120
135
140
138
125
110
Ці числа є цифровимиRepresentаціями оригінального звукового сигналу.
Як працює PCM
Аудіо PCM створюється завдяки двом важливим крокам.
1. Відбір (Sampling)
Аудіосигнал вимірюють через регулярні проміжки часу.
Наприклад, частота відбору 44 100 Гц означає, що сигнал вимірюють 44 100 разів на секунду.
Кожне вимірювання стає зразком (sample).
2. Квантизація (Quantization)
Отримані значення переводяться в числові рівні, які комп’ютер може зберігати.
Точність цієї конверсії залежить від бітової глибини (bit depth).
Популярні бітові глибини:
– 8 біт
– 16 біт
– 24 біт
– 32-бітове плаваюче число (floating point)
Більша бітова глибина забезпечує більшу точність та ширший динамічний діапазон.
Чому PCM важливий
PCM простий, надійний і зберігає якість звуку.
Багато професійних аудіосистем використовують PCM, тому що він зберігає звук без стиснення.
Це робить PCM корисним для:
– аудіоінженерії
– музичного виробництва
– обробки мовлення
– машинного навчання
– систем розпізнавання голосу
PCM у WAV-файлах
WAV-файл зазвичай зберігає звук із використанням кодування PCM.
Типовий WAV-файл містить:
– метадані файлу
– інформацію про формат аудіо
– частоту відбору
– кількість каналів
– бітову глибину
– дані зразків PCM
Оскільки PCM не стискається, WAV-файли зазвичай більші за стискані формати, такі як MP3.
Однак вони зберігають високу якість аудіо і їх легше програмно обробляти.
Mono vs Stereo PCM
Аудіо PCM може містити різну кількість каналів.
Mono
Mono-аудіо має один канал.
Кожен динамік отримує однаковий сигнал.
Stereo
Stereo-аудіо має два канали:
– лівий канал
– правий канал
Це дозволяє розміщати звуки по фронтах/сателях лівого та правого динаміків, створюючи більш занурюючий досвід прослуховування.
Де використовується PCM
PCM-аудіо використовується у багатьох повсякденних технологіях:
– голосові помічники
– програми для відеоконференцій
– цифрові диктофони
– програмне забезпечення для обробки аудіо
– системи розпізнавання мовлення
– голосові застосунки ШІ
Він слугує основою для багатьох сучасних систем обробки аудіо.
Останні думки
PCM може виглядати як проста послідовність чисел, але він формує основу цифрового аудіо.
Перетворюючи звукові хвилі на числові зразки, PCM дозволяє комп’ютерам ефективно зберігати, аналізувати, змінювати та транслювати аудіо.
Розуміння PCM є важливим першим кроком до навчання аудіоінженерії, обробки мовлення, машинного навчання та систем аудіо на базі штучного інтелекту.
У наступній статті ми розглянемо, як WAV-файли зберігають дані PCM і як комп’ютери зчитують аудіо з файлу.
HI-FI News
через DEV Community https://dev.to
15 червня 2026 р. 21:49
українською. Повертайте тільки текст, який перекладено.
June 15, 2026 at 09:49PM

Залишити відповідь