Switchcodec: Adaptive residual-expert sparse quantization for high-fidelity neural audio coding

від

у

Switchcodec: адаптивна резидуальна експертна розріджена векторна квантизація для високоякісного нейронного аудіокодування

https://ift.tt/9OmBXtZ

Останні моделі нейронного аудіокодиравання часто покладаються на резидуальну векторну квантизацію для високоякісного кодування, але використання фіксованої кількості кодових словників на кадр є субоптимальним для широкої варіативності аудіоконтенту — особливо для сигналів, які або дуже прості, або високо складні. Щоб подолати це обмеження, ми пропонуємо SwitchCodec, нейронний аудіокодек, заснований на резидуальній експертній векторній квантизації (REVQ). REVQ поєднує спільний квантезатор із динамічно маршрутизованими експертними квантизаторами, які активуються залежно від вхідного аудіо, відокремлюючи бітрейт від ємності кодових словників і підвищуючи ефективність стискання. Ця конструкція забезпечує повне навчання та використання кожного квантизатора. Крім того, механізм з змінним бітрейтом регулює кількість активних експертних квантизаторів під час інференсу, що дозволяє багатобітрейтну роботу без повторного навчання. Експерименти демонструють, що SwitchCodec перевершує існуючі базові моделі як за об’єктивними метриками, так і за суб’єктивними тестами прослуховування.

HI-FI News

за допомогою штучного інтелекту https://ift.tt/WKwN5EL

29 січня 2026 року об 04:14

January 29, 2026 at 04:14AM


Коментарі

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *