ALICE: A Multifaceted Evaluation Framework of Large Audio-Language Models’ In-Context Learning Ability

від

у

АЛІСА: Многоаспектна рамка оцінки здатності великих аудіо-мовних моделей до вивчення в контексті (in-context) навчання

https://ift.tt/A5mKRLx

Хоча було продемонстровано, що великі аудіо-мовні моделі (LALMs) демонструють зниження здатності дотримуватися інструкцій, їхня здатність виводити патерни завдань з прикладів у контексті за умов аудіо- Conditioning лишається нерозглянутою. Щоб заповнити цю прогалину, ми презентуємо ALICE — трьохетапну рамку, яка послідовно зменшує текстове керівництво, щоб систематично оцінити здатність LALMs до навчання в контексті за умов аудіо Conditioning. Оцінюючи шість LALMs на чотирьох завданнях з розуміння аудіо за двома категоріями обмежень виходу, ми виявляємо послідовну асиметрію на всіх етапах і серед усіх LALMs: демонстрації в контексті надійно покращують відповідність формату, але не покращують основні завдання, а часто знижують їхню продуктивність. Це свідчить про те, що LALMs можуть уловлювати поверхневі патерни форматування з демонстрацій, але можуть мати труднощі з використанням крос-модальної семантичної прив’язки для надійного виведення цілей завдань з аудіо-обумовлених прикладів, підкреслюючи потенційні обмеження сучасної крос-модальної інтеграції.

HI-FI News

через Штучний Інтелект https://ift.tt/BAjXN8y

24 березня 2026 р. о 04:28 (AM)

March 24, 2026 at 04:28AM


Коментарі

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *