Eroding Trust in Real Speech: A Large-Scale Study of Human Audio Deepfake Perception

від

у

Ерозія довіри реальної мові: велике дослідження сприйняття людського аудіо-діпфейку
https://ift.tt/Rlfyv6g

Аудіодіпфейки останнім часом швидко вдосконалюються, але їх вплив на довіру людей до реальної мови досі не вивчався. Ми представляємо найбільше на сьогодні дослідження слухання щодо сприйняття аудіодіпфейків, зібравши 35 532 оцінки від 1 768 учасників через 138 систем перетворення тексту на мову та голосового конвертаційного зображення. Наш основний висновок — зсув у скептицизмі: порівняно з базовим рівнем 2021 року, точність людей на фальшивих зразках майже не змінилася (72,9% до 71,2%), але точність на реальних зразках знизилася з 72,7% до 64,1%. Учасники не гірші у виявленні ознак синтезу; радше вони зростаюче не довіряють автентичній мові. Зразки, згенеровані комерційними системами та autoregressive моделями мови, виявлятися найважче (61,3 – 65,9%), тоді як зразки з традиційних seq2seq та моделей за принципом вирівнювання потоку залишаються легшими для виявлення (75,4 – 76,8%). ML-детектор, який слугував як відправна точка, зберігав понад 94,5% точності у всіх умовах. Наші результати свідчать, що основна загроза, яку створюють сучасні глибокі підробки, може полягати не лише в обмані, а в ерозії довіри до справжнього аудіо.

HI-FI News

через Штучний інтелект https://ift.tt/FJAeDjz

27 травня 2026 року о 06:22.

May 27, 2026 at 06:22AM


Коментарі

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *