Microsoft’s MAI-Transcribe-1 runs 2.5x faster than its predecessor at $0.36 per audio hour

від

у

Microsoft MAI-Transcribe-1 працює в 2,5 рази швидше за попередник за 0,36 долара за аудіо-годину

https://ift.tt/zkhAWIX

Microsoft представила MAI-Transcribe-1, модель розпізнавання мови з текстом, що підтримує 25 мов і досягає найнижчої помилки слів серед усіх моделей, тестованих на бенчмарку FLEURS, обігруючи Scribe v2, Whisper-large-V3, GPT-Transcribe та Gemini 3.1 Flash-Lite. За словами Microsoft, модель також розроблена для роботи в складних умовах запису, таких як фоновий шум, погана якість аудіо та перетинальна мова.

MAI-Transcribe-1 (зелений) лідирує за точністю розпізнавання слів на бенчмарку FLEURS у більшості з 25 мов, що тестувалися, випереджаючи Scribe v2, Gemini 3.1 Flash-Lite, Whisper-large-v3 та GPT-Transcribe. | Зображення: Microsoft

Microsoft розгортає MAI-Transcribe-1 по лінії Copilot Voice та Microsoft Teams. Розробники можуть спробувати його у публічному попередньому перегляді через Microsoft Foundry та Microsoft AI Playground. Модель працює у 2,5 раза швидше за попереднє рішення Azure Fast Microsoft та коштує 0,36 долара за аудіо-годину. Поєднана з MAI-Voice-1 та мовною моделлю, вона також може живити голосових агентів, зазначає Microsoft.

Cohere та Mistral нещодавно випустили відкриті альтернативи, які демонструють подібний рівень продуктивності.

AI-новини без хайпу – відбирає люди

Як підписник THE DECODER, ви отримуєтеReading без реклами, наше щотижневе AI-електронне видання, ексклюзивний «AI Radar» Frontier Report 6× на рік, доступ до коментарів та наш повний архів.


Підписатися зараз

HI-FI News

через The Decoder https://ift.tt/lzWKXFd

2 квітня 2026 р., 18:33.

April 2, 2026 at 06:33PM


Коментарі

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *