AudioGuard: Toward Comprehensive Audio Safety Protection Across Diverse Threat Models

Кві 13, 2026

—

від

AudioGuard: До всебічної захисту аудіобезпеки серед різноманітних моделей загроз

https://ift.tt/aJPZ4Bj

Аудіо швидко стало первинним інтерфейсом для моделей фундаментального навчання, забезпечуючи голосових асистентів у режимі реального часу. Забезпечення безпеки в аудіосистемах за своєю суттю складніше, ніж просто «небезпечний текст, який вимовили вголос»: реальні ризики можуть залежати від аудіо‑власних шкідливих звукових подій, атрибутів мовця (наприклад, голос дитини), зловживань з імітацією/клонуванням голосу та шкідливості за змістом голосу, такої як поєднання голосу дитини з сексуальним контентом. Природа аудіо ускладнює розробку всебічних бенчмаркiв або систем захисту від цього унікального ландшафту ризиків. Щоб заповнити цю прогалину, ми проводимо масштабне «червоне командування» (red teaming) аудіосистем, систематично виявляємо вразливості в аудіо та розробляємо всебічну, орієнтовану на політику таксономію аудіоризиків та AudioSafetyBench — перший орієнтований на політику бенчмарк аудіобезпеки серед різноманітних моделей загроз. AudioSafetyBench підтримує різні мови, підозрілі голоси (наприклад, зі зірок та імитація/притворство, голос дитини), ризиковані комбінації голосу та контенту, а також звукові події без мови. Для захисту від цих загроз ми пропонуємо AudioGuard — єдиний набір засобів захисту, що складається з 1) SoundGuard для детекції на рівні хвиль WAV та 2) ContentGuard для семантичного захисту, базованого на політиці. Розгорнені експерименти на AudioSafetyBench та чотирьох додаткових бенчмарках показують, що AudioGuard стабільно покращує точність захисних механізмів порівняно з сильними базовими моделями на основі аудіо‑LLM, із значно меншим затримкою.

HI-FI News

via Artificial Intelligence https://ift.tt/GdH0mLR

13 квітня 2026 року, 05:09 AM

April 13, 2026 at 05:09AM

AudioGuard: Toward Comprehensive Audio Safety Protection Across Diverse Threat Models

Коментарі

Залишити відповідь Скасувати коментар