CBT-Audio: Evaluating Audio Language Models for Patient-Side Distress Intensity Estimation in CBT Session Recordings

від

у

CBT-Audio: Оцінювання аудіо-моделей мови для оцінювання рівня страждання пацієнта під час записів сеансів CBT

https://ift.tt/3H12x9I

Когнітивно-поведінкова терапія широко використовується для допомоги пацієнтам у розумінні та управлінні психологічним стражданням. Вона часто проводиться за допомогою усної бесіди, де терапевти звертають увагу не лише на те, що говорять пацієнти, але й на те, як вони це говорять, адже ці сигнали можуть допомогти терапевтам вирішити, як реагувати і адаптувати лікування. Прогрес у створенні систем штучного інтелекту для CBT залишається переважно обмеженим текстовим форматам, частково через те, що більшість доступних наборів даних є текстовими, а розповсюджувані аудіодані CBT обмежені з етичних та приватних міркувань. Це створює «сліпу зону», бо текстові моделі та оцінки не можуть враховувати невідповідність між транскрипцією та голосом пацієнта, хоча терапевти часто покладаються на цю невідповідність, щоб розуміти страждання пацієнта. Ми представляємо CBT-Audio, набір даних для оцінювання оцінки страждання пацієнтів з розмовними сеансами CBT за допомогою аудіо-моделей мови. CBT-Audio містить 1 802 пацієнтські репліки з 96 публічно доступних записів CBT, з мітками рівня страждання на рівні репліки, підтверджені експертно-анотованою підколюстою вибіркою. Ми оцінюємо 10 відкритих аудіо-моделей мови за трьома умовами вхідних даних, де моделі отримують лише аудіо пацієнта, лише транскрипт або і те, й інше — аудіо та транскрипт. Наші результати демонструють, що аудіо може надавати корисну інформацію понад текст, особливо у поєднанні з транскриптами. Додавання аудіо до введення з транскриптом покращує оцінку страждання порівняно з використанням лише транскрипту в 8 із 10 сімей моделей, при значних покращеннях у 4-х випадках, а кейс-стаді показують найбільш явну перевагу, коли вербальний зміст і вокальна подача відрізняються. CBT-Audio робить вимірювану поведінку пацієнтів придатною для оцінки AI у задачах, пов’язаних з CBT, та підтримує майбутні дослідження аудіо-моделей мови для взаємодії у сфері психічного здоров’я.

HI-FI News

через штучний інтелект https://ift.tt/xneOgwm

19 травня 2026 року, 07:23 за київським часом

в українському перекладі. Надайте лише перекладений текст.

May 19, 2026 at 07:23AM


Коментарі

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *