
Microsoft MAI-Transcribe-1 працює в 2,5 рази швидше за попередник за 0,36 долара за аудіо-годину
https://ift.tt/zkhAWIX
Microsoft представила MAI-Transcribe-1, модель розпізнавання мови з текстом, що підтримує 25 мов і досягає найнижчої помилки слів серед усіх моделей, тестованих на бенчмарку FLEURS, обігруючи Scribe v2, Whisper-large-V3, GPT-Transcribe та Gemini 3.1 Flash-Lite. За словами Microsoft, модель також розроблена для роботи в складних умовах запису, таких як фоновий шум, погана якість аудіо та перетинальна мова.

Microsoft розгортає MAI-Transcribe-1 по лінії Copilot Voice та Microsoft Teams. Розробники можуть спробувати його у публічному попередньому перегляді через Microsoft Foundry та Microsoft AI Playground. Модель працює у 2,5 раза швидше за попереднє рішення Azure Fast Microsoft та коштує 0,36 долара за аудіо-годину. Поєднана з MAI-Voice-1 та мовною моделлю, вона також може живити голосових агентів, зазначає Microsoft.
Cohere та Mistral нещодавно випустили відкриті альтернативи, які демонструють подібний рівень продуктивності.
AI-новини без хайпу – відбирає люди
Як підписник THE DECODER, ви отримуєтеReading без реклами, наше щотижневе AI-електронне видання, ексклюзивний «AI Radar» Frontier Report 6× на рік, доступ до коментарів та наш повний архів.
HI-FI News
через The Decoder https://ift.tt/lzWKXFd
2 квітня 2026 р., 18:33.
April 2, 2026 at 06:33PM

Залишити відповідь