Decoding Ambiguous Emotions with Test-Time Scaling in Audio-Language Models

від

у

Розшифрування неоднозначних емоцій за допомогою масштабування під час тестування в аудіо-мовних моделях (ALMs)

https://ift.tt/Tv9bnXx

Розпізнавання емоцій за людською вимовою є критично важливим фактором для соціально обізнаного розмовного штучного інтелекту. Однак, хоча більшість попередніх робіт розглядають розпізнавання емоцій як задачу категорійної класифікації, реальні афективні стани часто є неоднозначними, перекриваються та залежать від контексту, що створює значні труднощі як для анотації, так і для автоматичного моделювання. Нещодавні великомасштабні моделі аудіо-мов (ALMs) відкривають нові можливості для нюансованого афективного розуміння без явного нагляду за емоціями, але їхня здатність обробляти неоднозначні емоції залишається недостатньо вивченою. У той же час досягнення в техніках на стадії висновку, таких як масштабування під час тестування (TTS), обіцяють покращити узагальнення та адаптивність у складних завданнях НЛП, але їхня релевантність до афективних обчислень все ще суттєво невивчена. У цій роботі ми вперше представляємо бенчмарк для неоднозначного розпізнавання емоцій у мовленні з використанням ALMs за масштабуванням під час тестування. Наша оцінка систематично порівнює вісім сучасних ALMs та п’ять стратегій TTS на трьох відомих наборах даних з емоціями у мові. Також ми надаємо поглиблений аналіз взаємодії між потужністю моделі, TTS та афективною неоднозначністю, пропонуючи нові висновки щодо обчислювальних та репрезентативних викликів у розумінні неоднозначних емоцій. Наш бенчмарк закладає основу для розробки більш надійних, контекстно обізнаних та емоційно розумних систем на основі мовлення, а також висвітлює ключові майбутні напрямки для подолання розриву між припущеннями моделі та складністю реальних людських емоцій.

HI-FI News

через штучний інтелект https://ift.tt/kbG1TRZ

5 лютого 2026 р., о 04:11 ранку

February 5, 2026 at 04:11AM


Коментарі

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *