CMU research shows spatial audio makes AI agents feel more human

Дослідження в CMU свідчать, що просторовий звук робить AI-агентів більш людяними

https://ift.tt/2WhzcKL

Дослідження CMU свідчить, що просторовий звук робить AI-агентів більш людяними

Дослідники з Карнегі-Маліннського університету вивчають взаємодію людей з штучним інтелектом-агентами, які імітують фізичну присутність за допомогою аудіо, що може вплинути на розвиток систем штучного інтелекту з аудіо лише для розумних очок та інклюзивних інструментів. Команда з Школи комп’ютерних наук та Кафедри психології створила інтерфейс для чат-ботів, що покладається виключно на аудіо-сигнали для підвищення залученості користувача.

Дейвід Ліндльбауер, асистент-професор Інституту взаємодії людини та комп’ютера, зазначив, що дослідження досліджує, як зробити звук AI більш людяним, аби змінити взаємодію користувачів. “Питання полягає в тому, що станеться, якби у мене був AI-помічник, і що сталося б, якби аудіо-компонент став набагато ближчим до справжньої людини?” — сказав він. Результати здивували дослідників.

Здобувачі використали просторовизацию та Foley-ефекти для створення інтерфейсу. Просторовизация дозволяє користувачам відчувати, що звук AI надходить з певних місць у кімнаті, тоді як Foley-ефекти — це реалістичні звукові ефекти, які підсилюють занурення, наприклад друкування на клавіатурі та ллється вода. Лорі Хеллер, професор психології, підкреслила необхідність цих ефектів для створення вірогідного досвіду, заявивши: «Якщо вони не входять до музичної частини фільму, це не здається реалістично.»

У експериментальному дизайні учасники взаємодіяли з AI-агентами, використовуючи різні комбінації просторових та Foley-ефектів, ознайомлюючись із кімнатою. Після розмов із AI учасники заповнювали опитувальники, щоб повідомити про свій досвід. Ліндльбауер повідомив статистично значущі результати, які показують підвищення залученості користувачів, коли використовуються просторові та Foley-ефекти.

У дослідженні було виявлено несподіваний аспект: учасники стали очікувати, що AI дотримується людських соціальних норм. “Як тільки учасники відчули, що їх агент зайнятий чимось іншим, вони вважали це грубим,” — сказав Ліндльбауер. Це виникло через те, що автоматичні Foley-ефекти не були безпосередньо пов’язані з розмовою.

Ченг запропонував зробити аудіо-сигнали більш контекстно-усвідомленими, щоб зменшити відчуття відволікання під час взаємодії. Ліндльбауер вважав, що фінальна аудіо-система може містити ефекти, які не залежать від конкретного середовища, не втрачаючи своїх якостей для підвищення залученості. Учасники можуть візуально реагувати на звуки, наприклад дивитися на екран, коли чують друкування, але це не зменшило загального досвіду.

Дослідники презентували свої висновки на Конференції ACM з питань людяного фактору в системах обчислювальної техніки (CHI 2026) у Барселоні. Результати дослідження зафіксовані в матеріалах конференції.

Зображення у прикладі

HI-FI News

via Dataconomy https://dataconomy.com

26 травня 2026 р. 06:34 AM

May 26, 2026 at 06:34AM

CMU research shows spatial audio makes AI agents feel more human

Коментарі

Залишити відповідь Скасувати коментар