Синтетичне розширення даних для медичної аудіокласифікації: попередня оцінка
https://ift.tt/5XUzoS4
Медична аудіокласифікація залишається складною через низьке відношення сигналу до шуму, тонкі дискримінативні ознаки та значну внутрішньокласову варіативність, часто ускладнену дисбалансом класів та обмеженими навчальними даними. Синтетичне розширення даних було запропоновано як потенційну стратегію для пом’якшення цих обмежень; однак попередні дослідження повідомляють про непослідовні методологічні підходи та змішані емпіричні результати. У цьому попередньому дослідженні ми досліджуємо вплив синтетичного розширення на класифікацію дихальних звуків за допомогою базової глибокої згорткової нейронної мережі, навченої на помірно незбалансованому наборі даних (73%:27%). Три стратегії генеративного розширення (вариаційні автокодувачі, генеративно-змагальні мережі та дифузійні моделі) були оцінені за контрольованих експериментальних умов. Базова модель без розширення досягла F1-оцінки 0.645. Протягом окремих стратегій розширення не спостерігалося підвищення продуктивності; кілька конфігурацій демонстрували нейтральні або знижені результати класифікації. Лише ансамбль розширених моделей дав помірне покращення F1-оцінки (0.664). Ці висновки свідчать, що для класифікації медичного звуку синтетичне розширення може не стабільно підвищувати продуктивність при використанні стандартного CNN-класифікатора. Майбутні дослідження повинні зосередитися на визначенні завдання-специфічних характеристик даних, сумісності моделі з розширенням та рамок оцінювання, необхідних для того, щоб синтетичне розширення було ефективним у медичних аудіо застосуваннях.
HI-FI News
через штучний інтелект https://ift.tt/OKuJQ7k
4 лютого 2026 р. о 04:15
February 4, 2026 at 04:15AM

Залишити відповідь