
Сомніум Аудіо Щоденник Снів
Цей пост є моєю заявкою для маршруту освіти DEV: Створення додатків з Google AI Studio.
Що я побудував
Я створив Somnium, містичний, орієнтований на голос щоденник снів, який виступає в ролі моста до вашої підсвідомості. Замість того, щоб описувати сни серед ночі, користувачі просто записують свій голос. Додаток використовує API Google Gemini для транскрипції аудіо, аналізу сну за допомогою юнгіанської психології, виявлення емоційних тем та навіть генерації сюрреалістичного зображення, що представляє сновидний пейзаж.
Ключові запити та особливості:
Я використав мультимодальні можливості моделі gemini-3-flash-preview для обробки сирих аудіо-блобів безпосередньо.
Запит на аналіз: “Ви експерт з юнгіанської аналітики снів… Транскрибувати аудіо… Аналізувати на приховані значення… Визначати архетипи… Оцінити інтенсивність основних емоцій.”
Генерація візуалізації: Я використав вихідний аналіз, щоб створити динамічний запит для gemini-2.5-flash-image, запитуючи “Абстрактний експресіонізм, змішаний з Dreamcore” на основі специфічних емоцій та тем, знайдених у сні.
У додатку є реальний аудіо-візуалізатор, графік радари емоцій (Recharts) і система автоматичного тегування, де ШІ пропонує відповідні ключові слова для щоденника.
Демонстрація
Мій досвід
Розробка з Google GenAI SDK була несподівано інтуїтивною, особливо щодо структурованого виходу.
Мультимодальна легкість: Я був вражений, що мені не знадобилася окрема бібліотека для перетворення мови в текст. Передача аудіо-блоба безпосередньо до Gemini з запитом “транскрибувати та аналізувати” виконувала обидві задачі за один запит, значно зменшуючи затримки та складність коду.
JSON-схема: Використання конфігурації responseSchema стало справжнім проривом. Це забезпечувало, щоб Gemini завжди повертала дані (як-от оцінки емоцій та списки архетипів) у ідеальному JSON-форматі, який мої компоненти React могли відображати відразу без помилок парсингу.
Можливість з’єднати вихід текстового аналізу в запит на генерацію зображення дозволила створити дійсно цілісний користувацький досвід, де візуали дійсно відповідали “атмосфері” інтерпретації сну.
HI-FI Новини
через DEV Community
January 7, 2026 at 04:06AM

Залишити відповідь