
Інтелект аудіо: транскрипція + позначення спікерів за $0.002/хв (з безкоштовною діаризацією)
https://ift.tt/IRuQW6q
LeanVox почався як API тексту до мови. Сьогодні він обробляє обидві сторони аудіо.
Познайомтеся з Audio Intelligence — транскрипція, діаризація спікерів та резюмування за один виклик API. Та самий ключ API. Та сама панель управління. Жодного нового облікового запису.
Одне кінцеве точка. Три виходи.
from leanvox import Leanvox
client = Leanvox(api_key=”lv_live_…”)
result = client.audio.transcribe(
file=”meeting.mp3″,
features=[“transcribe”, “diarize”, “summarize”]
)
print(result.formatted_transcript)
# SPEAKER_0: Welcome to the show.
# SPEAKER_1: Thanks for having me.
print(result.summary)
# “Team discussed Q1 roadmap priorities…”
Або з Node.js:
const result = await client.audio.transcribe({
file: “meeting.mp3”,
features: [“transcribe”, “diarize”, “summarize”]
})
console.log(result.formatted_transcript)
console.log(result.summary)
Ціни, що дійсно мають сенс
Ми тестували Whisper Large V3 + Pyannote 3.1 на виділеному GPU-обладнанні:
Характеристика LeanVox AssemblyAI Deepgram
Транскрипція $0.002/хв $0.0025/хв $0.0043/хв
Діаризація спікерів Free +$0.007/хв +$0.014/хв
Загалом (транскрипція + спікери) $0.002/хв $0.0095/хв $0.018/хв
4.75× дешевше за AssemblyAI. 9× дешевше за Deepgram. Мітки спікерів включені безкоштовно.
Ваш кредит на реєстрацію в $1.00 покриває 500 хв транскрипції. 1 година зустрічі коштує $0.12.
Чому діаризація безкоштовна
Більшість провайдерів стягують додатково за виявлення спікера. Ми ні — наша інфраструктура забезпечує майже нуль маржинальних витрат (менше 0.5 с до обробки). Краще зібрати все в пакет і дати вам кращий продукт.
Працює з MCP-сервером теж
Без коду з Claude:
{“mcpServers”: {“leanvox”: {“command”: “npx”, “args”: [“leanvox-mcp”], “env”: {“LEANVOX_API_KEY”: “lv_live_…”}}}
Скажіть Claude: “Розпиши цей аудіофайл і дай мені підсумок із позначенням спікерів.” Жодного коду.
Що підтримується
– Формати: mp3, wav, ogg, flac, m4a, webm (до 500MB)
– Мови: 99 (авто-визначення або зазначте)
– Обробка: синхронно для файлів ≤5 хв, асинхронно з вебхуками для довших файлів
– SDK: Python та Node.js (версія v0.3.0)
Початок роботи
# Встановити
pip install leanvox # або npm install leanvox
# Транскрипція
curl -X POST https://ift.tt/xrN4MAT \
-H “Authorization: Bearer lv_your_key_here” \
-F “file=@audio.mp3”
→ Quickstart guide · API reference · Get your API key
HI-FI News
via DEV Community https://dev.to
4 березня 2026 р., 11:08 AM
Примітка: наданий переклад містить лише текст, що було перекладено.
March 4, 2026 at 11:08AM

Залишити відповідь