Google tests voice cloning ahead of Gemini 3 Flash Native Audio release

Google тестує клонування голосу напередодні випуску Gemini 3 Flash Native Audio

https://ift.tt/yuE0mYb

Google готує можливості клонування голосу для AI Studio, що підтверджується прихованою опцією «Створи свій голос», яка з’являється під час вибору моделі попереднього перегляду нативного аудіо Flash, наразі прив’язаної до Gemini 2.5 Flash. Вибір цієї опції відкриває спливаюче вікно для запису та завантаження аудіо, але функція залишається неактивною. Наявність цієї можливості свідчить, що Google, ймовірно, працює над впровадженням більш продвинутої нативної аудіо-моделі, можливо Gemini 3 Flash, з увімкненим клонуванням голосу. Якщо це буде випущено, це дозволить розробникам генерувати синтетичні голоси на основі наданих користувачем зразків, додавши новий рівень персоналізації для аудіо-відповідей, згенерованих штучним інтелектом.

Ця розробка орієнтована на користувачів AI Studio, які потребують настроюваного аудіоконтенту, таких як розробники застосунків, які створюють помічників або інструменти доступності. Хоча клонування голосу доступне в інших місцях, пряма інтеграція з моделями Gemini спростила б робочий процес для тих, хто занурений в екосистему Google. Реальний графік випуску не оголошено, але підготовчі кроки видно у інтерфейсі користувача.

Також виявлено додаткові майбутні функції. У розділі Build з’явилася нова опція прикріплення — Імпорт з GitHub, що вказує на те, що користувачі зможуть імпортувати цілі репозиторії в AI Studio, перетворюючи кодові бази на робочі проєкти у рамках платформи. Це може спростити адаптацію для розробників, які переміщують проєкти в середовище Google, хоча деталі інтеграції, зокрема стосовно підтримуваних фреймворків, все ще неясні. Широкі бекенд-можливості, такі як інтеграція з базами даних та Firebase, залишаються у плані.

Головна сторінка також оновлюється: підсумки активності та статистика використання розмежовуються, при цьому повертаються раніше анонсовані панелі коментарів. Ці зміни відображають постійні зусилля Google у позиціонуванні AI Studio як всебічної платформи, орієнтованої на розробників, на тлі розвитку базових моделей Gemini. Темпи оновлень свідчать про те, що деякі з цих функцій можуть стати доступними у найближчому майбутньому, залежно від внутрішнього тестування та стабільності.

У міру того, як Google продовжує розширювати рамки AI Studio, клонування голосу, інтеграція з GitHub та покращена навігація можуть привернути як нових, так і існуючих розробників, які прагнуть експериментувати з робочими процесами на базі Gemini. Напрямок відповідає нещодавнім зусиллям Google надати гнучкі повноцінні інструменти для створювачів AI-застосунків.

HI-FI News

via TestingCatalog https://ift.tt/zZGHaRm

28 січня 2026 р. о 14:59

January 28, 2026 at 02:59PM

Google tests voice cloning ahead of Gemini 3 Flash Native Audio release

Коментарі

Залишити відповідь Скасувати коментар