Audio Intelligence: Transcription + Speaker Labels for $0.002/min (with Free Diarization)

Бер 4, 2026

—

від

Інтелект аудіо: транскрипція + позначення спікерів за $0.002/хв (з безкоштовною діаризацією)

https://ift.tt/IRuQW6q

LeanVox почався як API тексту до мови. Сьогодні він обробляє обидві сторони аудіо.
Познайомтеся з Audio Intelligence — транскрипція, діаризація спікерів та резюмування за один виклик API. Та самий ключ API. Та сама панель управління. Жодного нового облікового запису.

Одне кінцеве точка. Три виходи.

from leanvox import Leanvox

client = Leanvox(api_key=”lv_live_…”)

result = client.audio.transcribe(
file=”meeting.mp3″,
features=[“transcribe”, “diarize”, “summarize”]
)

print(result.formatted_transcript)
# SPEAKER_0: Welcome to the show.
# SPEAKER_1: Thanks for having me.
print(result.summary)
# “Team discussed Q1 roadmap priorities…”

Або з Node.js:

const result = await client.audio.transcribe({
file: “meeting.mp3”,
features: [“transcribe”, “diarize”, “summarize”]
})

console.log(result.formatted_transcript)
console.log(result.summary)

Ціни, що дійсно мають сенс
Ми тестували Whisper Large V3 + Pyannote 3.1 на виділеному GPU-обладнанні:
Характеристика LeanVox AssemblyAI Deepgram
Транскрипція $0.002/хв $0.0025/хв $0.0043/хв
Діаризація спікерів Free +$0.007/хв +$0.014/хв
Загалом (транскрипція + спікери) $0.002/хв $0.0095/хв $0.018/хв

4.75× дешевше за AssemblyAI. 9× дешевше за Deepgram. Мітки спікерів включені безкоштовно.
Ваш кредит на реєстрацію в $1.00 покриває 500 хв транскрипції. 1 година зустрічі коштує $0.12.

Чому діаризація безкоштовна
Більшість провайдерів стягують додатково за виявлення спікера. Ми ні — наша інфраструктура забезпечує майже нуль маржинальних витрат (менше 0.5 с до обробки). Краще зібрати все в пакет і дати вам кращий продукт.

Працює з MCP-сервером теж
Без коду з Claude:
{“mcpServers”: {“leanvox”: {“command”: “npx”, “args”: [“leanvox-mcp”], “env”: {“LEANVOX_API_KEY”: “lv_live_…”}}}
Скажіть Claude: “Розпиши цей аудіофайл і дай мені підсумок із позначенням спікерів.” Жодного коду.

Що підтримується
– Формати: mp3, wav, ogg, flac, m4a, webm (до 500MB)
– Мови: 99 (авто-визначення або зазначте)
– Обробка: синхронно для файлів ≤5 хв, асинхронно з вебхуками для довших файлів
– SDK: Python та Node.js (версія v0.3.0)

Початок роботи
# Встановити
pip install leanvox # або npm install leanvox

# Транскрипція
curl -X POST https://ift.tt/xrN4MAT \
-H “Authorization: Bearer lv_your_key_here” \
-F “file=@audio.mp3”

→ Quickstart guide · API reference · Get your API key

HI-FI News
via DEV Community https://dev.to

4 березня 2026 р., 11:08 AM

Примітка: наданий переклад містить лише текст, що було перекладено.

March 4, 2026 at 11:08AM

Audio Intelligence: Transcription + Speaker Labels for $0.002/min (with Free Diarization)

Коментарі

Залишити відповідь Скасувати коментар