Spectrogram features for audio and speech analysis

від

у

Спектрограмні ознаки для аналізу аудіо та мови

https://ift.tt/xkzFnUi

Спектрограмні представлені ознаки домінують у просторі ознак для систем аналізу аудіо за допомогою глибокого навчання і часто застосовуються також для аналізу мови. Спочатку головною мотивацією для спектрограмних представлень була їхня здатність подати звук як два виміри сигналу у площині часу–частоти, що не лише надає інтерпретовану фізичну основу для аналізу звуку, але й відкриває використання широкого спектра методів машинного навчання, таких як згорткові нейронні мережі, які були розроблені для обробки зображень. Спектрограма є матрицею, що характеризується роздільністю та діапазоном двох її вимірів, а також поданням та масштабуванням кожного елемента. Багато можливостей для цих трьох характеристик було досліджено дослідниками у різних сферах застосування, різні налаштування показували схильність до різних завдань. У цій статті розглядається використання спектрограмних представлень та оглядає стан справ на сьогоднішній день з метою поставити під сумнів, як вибір представлення переднього плану поєднується з архітектурою класифікатора на задньому плані для різних завдань.

HI-FI News

через Штучний інтелект https://ift.tt/GdxBr46

17 березня 2026 року о 05:01 ранку

March 17, 2026 at 05:01AM


Коментарі

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *