AFSS: Artifact-Focused Self-Synthesis for Mitigating Bias in Audio Deepfake Detection

від

у

AFSS: Самостійне синтетичне формування артефактів для зменшення упередженості у детекції аудіо-Deepfake

https://ift.tt/o6R3FTz

Швидке зростання можливостей генеративних моделей дозволяє створювати надреалістичні аудіо-Deepfake, але сучасні детектори страждають від критичної проблеми упередженості, що призводить до поганої узагальнюваності на непереглянутих наборах даних. У цій роботі запропоновано Artifact-Focused Self-Synthesis (AFSS), метод, розроблений для зменшення цієї упередженості шляхом генерації псевдо-фейкових зразків з реального аудіо за допомогою двох механізмів: самоконверсія та самовідтворення. Головна ідея AFSS полягає у примусові до однаковості спікера: забезпечується сигнали, що реальні та псевдо-фейкові зразки мають ідентичність спікера та семантичний зміст. Це змушує детектор зосередитися виключно на артефактах генерації, а не на нерелевантних заплутуючих факторах. Крім того, ми вводимо навчаєму втрату (reweighting loss), яка динамічно підкреслює вагомість синтетичних зразків під час навчання. Розгорнуті експерименти на 7 наборах даних показують, що AFSS досягає найкращої у своєму класі продуктивності зі середнім EER 5.45%, включаючи значне зниження до 1.23% на WaveFake та 2.70% на In-the-Wild, все це без залежності від попереднього збору фальшивих даних. Наш код відкрито доступний за адресою https://ift.tt/QIFzAY6.

HI-FI News

через Штучний Інтелект https://ift.tt/QUVfdDN

31 березня 2026 р. о 05:20 AM

March 31, 2026 at 05:20AM


Коментарі

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *