Switchcodec: адаптивна резидуальна експертна розріджена векторна квантизація для високоякісного нейронного аудіокодування
https://ift.tt/9OmBXtZ
Останні моделі нейронного аудіокодиравання часто покладаються на резидуальну векторну квантизацію для високоякісного кодування, але використання фіксованої кількості кодових словників на кадр є субоптимальним для широкої варіативності аудіоконтенту — особливо для сигналів, які або дуже прості, або високо складні. Щоб подолати це обмеження, ми пропонуємо SwitchCodec, нейронний аудіокодек, заснований на резидуальній експертній векторній квантизації (REVQ). REVQ поєднує спільний квантезатор із динамічно маршрутизованими експертними квантизаторами, які активуються залежно від вхідного аудіо, відокремлюючи бітрейт від ємності кодових словників і підвищуючи ефективність стискання. Ця конструкція забезпечує повне навчання та використання кожного квантизатора. Крім того, механізм з змінним бітрейтом регулює кількість активних експертних квантизаторів під час інференсу, що дозволяє багатобітрейтну роботу без повторного навчання. Експерименти демонструють, що SwitchCodec перевершує існуючі базові моделі як за об’єктивними метриками, так і за суб’єктивними тестами прослуховування.
HI-FI News
за допомогою штучного інтелекту https://ift.tt/WKwN5EL
29 січня 2026 року об 04:14
January 29, 2026 at 04:14AM

Залишити відповідь