Reliable Audio Deepfake Detection in Variable Conditions via Quantum-Kernel SVMs

від

у

Надійне виявлення аудіо глибоких фейків в змінних умовах за допомогою квантових ядер SVM

Виявлення синтетичної мови є складним завданням, коли помічених даних мало, а умови запису відрізняються. Існуючі глибокі моделі “з кінця в кінець” часто перенавчаються або не можуть узагальнити, і хоча методи з ядрами можуть залишатися конкурентоспроможними, їхня продуктивність сильно залежить від обраного ядра. У цій роботі ми показуємо, що використання квантового ядра у виявленні аудіо глибоких фейків зменшує рівні хибнопозитивних результатів без збільшення розміру моделі. Квантові функціональні карти вбудовують дані у високомірні простори Гільберта, що дозволяє використовувати виразні міри схожості та компактні класифікатори. Ґрунтуючись на цій мотивації, ми порівнюємо квантові ядерні SVM (QSVM) з класичними SVM, використовуючи ідентичну підготовку мел-спектрограм і стратифіковану 5-кратну крос-валідацію на чотирьох корпусах (ASVspoof 2019 LA, ASVspoof 5 (2024), ADD23, та набір In-the-Wild). QSVM демонструють послідовно нижчі рівні рівноважних помилок (EER): 0.183 проти 0.299 на ASVspoof 5 (2024), 0.081 проти 0.188 на ADD23, 0.346 проти 0.399 на ASVspoof 2019, і 0.355 проти 0.413 на In-the-Wild. У точці роботи EER (де FPR дорівнює FNR) це відповідає абсолютним зниженням рівнів хибнопозитивних результатів на 0.116 (38.8%), 0.107 (56.9%), 0.053 (13.3%), та 0.058 (14.0%) відповідно. Ми також повідомляємо про те, наскільки стабільні результати на різних фолдах крос-валідації та мірах розділу класів на основі границі, використовуючи ідентичні налаштування для обох моделей. Єдине модифікація – це ядро; функції та SVM залишаються незмінними, не вводяться додаткові навчальні параметри, а квантове ядро обчислюється на звичайному комп’ютері.

December 23, 2025 at 04:44AM


Коментарі

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *