Перехід від біологічного слуху до нейроморфних обчислень: повноцінна обробка аудіосигналів у часовій області з використанням резервоарних обчислень
https://ift.tt/o1hmI2g
Незважаючи на досягнення у найсучасніших технологіях, обробка аудіосигналів залишається складною та не досягає точності систем обробки людської мови. Щоб подолати ці виклики, ми пропонуємо новий підхід, який спрощує обробку аудіосигналів за допомогою технік часової області та резервоарних обчислень. У ході нашого дослідження ми розробили систему обробки аудіосигналів у реальному часі шляхом спрощення обробки аудіосигналів за допомогою резервоарних комп’ютерів, які значно легше навчати. Витяг ознак є фундаментальним кроком у обробці мовних сигналів, причому коефіцієнти мел-частотного кепстрування (MFCC) домінують через їх перцепційну релевантність до людського слуху. Проте традиційний видобуток MFCC базується на обчислювально інтенсивних перетвореннях у часово-частотному просторі, що обмежує ефективність у реальному часі. Щоб подолати це, ми пропонуємо новий підхід, який використовує резервоарні обчислення для спрощення видобутку MFCC. Замінюючи традиційні конверсії у частотному домені на операції згортки, ми усуваємо потребу у складних трансформаціях, зберігаючи при цьому дискримінативність ознак. Ми представили повноцінну рамкаху обробки аудіо, яка інтегрує цей метод, демонструючи його потенціал для ефективного та реального часу мовного аналізу. Наші результати сприяють розвитку енергоефективних технологій обробки аудіо, що забезпечує безшовне розгортання в вбудованих системах та голосо-орієнтованих застосунках. Ця робота зменшує розрив між біологічно натхненним вилученням ознак та сучасними нейроморфними обчисленнями, пропонуючи масштабоване рішення для систем розпізнавання мов наступного покоління.
HI-FI News
через штучний інтелект https://ift.tt/tCGfY4k
26 березня 2026 року о 04:09 ранку
March 26, 2026 at 04:09AM

Залишити відповідь