🚀 Обзор приложения

Gemini Live — реал-тайм общение с ИИ-ассистентом Google Gemini через голос, видео и текст.

🎤

Голосовой ввод

Говорите напрямую в микрофон, ассистент расшифрует вашу речь

🎥

Видео-трансляция

Поделитесь тем, что видит ваша камера, с ассистентом

💬

Текстовый ввод

Введите текст в поле для отправки сообщения

🔊

Голосовой ответ

Слушайте ответы ассистента с красивым голосом

Быстрый старт

  1. Откройте приложение и войдите с логином и паролем
  2. Разрешите доступ к микрофону при первом использовании
  3. Нажмите кнопку микрофона и начните говорить
  4. Ассистент ответит голосом и текстом в чате

🎮 Управление интерфейсом

Основные кнопки управления и их горячие клавиши.

🎤 Микрофон
Включает/выключает запись голоса. Нажмите ещё раз — остановится.
M
🎥 Камера
Включает/выключает трансляцию с веб-камеры. На мобильных с несколькими камерами появляется кнопка переключения.
V
💬 Поле ввода текста
Введите текстовое сообщение и нажмите Enter для отправки.
Enter — отправить
⏹️ Стоп / новая сессия
Прерывает текущий разговор. Для нового чата нажмите «+» в сайдбаре.
Escape

Индикаторы состояния

СтатусЗначение
🟢 OnlineСоединение установлено, можно говорить
🟡 Подключение…Установка WebSocket-соединения
🔴 OfflineСоединение разорвано, автоматическое переподключение

✨ Возможности и функции

Полный список того, что умеет приложение.

🎙️ Голосовое взаимодействие

  • Локальное распознавание речи через Vosk (ваш голос не отправляется в облако)
  • Синтез речи с ирландским акцентом (голос Puck)
  • Отображение транскрипции пользователя и ассистента
  • Мгновенные ответы без задержек

📹 Видео-функции

  • Трансляция с фронтальной или задней камеры
  • Кнопка переключения камер (если устройство поддерживает)
  • Прямой анализ видео ассистентом в реальном времени

💭 Память и контекст

  • Персональная память пользователя (обновляется ИИ автоматически)
  • История сессий с авто-саммаризацией при отключении
  • 3 слоя контекста: профиль → саммари → последние 10 сообщений
  • Сайдбар с историей разговоров — переключайтесь между темами

🔧 Технические возможности

  • WebSocket для минимальной задержки
  • Автоматический реконнект при потере соединения
  • JWT-авторизация — пароль передаётся только при входе

❓ Часто задаваемые вопросы

Почему я не слышу ответы?
Проверьте: громкость в браузере, разрешение автовоспроизведения звука, не заглушены ли вкладки.
Как разрешить доступ к микрофону?
Нажмите на иконку замка 🔒 в адресной строке → «Разрешения» → Микрофон → «Разрешить». Перезагрузите страницу.
Может ли ассистент видеть мою камеру?
Да — когда камера включена, видеопоток передаётся ассистенту в реальном времени для анализа.
Камера не переключается на мобильном Chrome
Это ограничение Chrome Android. При ошибке переключения появится кнопка с адресом сайта для перехода в другой браузер (Firefox, Safari).
Безопасны ли мои данные?
Данные передаются по зашифрованному соединению (HTTPS + WSS). JWT-токен не содержит пароль. Пароль передаётся только один раз при входе.
Сессия истекла — просит войти заново
JWT-токен действует 7 дней. Введите логин и пароль повторно.

🔧 Решение проблем

Ошибка подключения / Offline Проверьте что сервер запущен. Перезагрузите страницу (Ctrl+Shift+R). Проверьте консоль браузера (F12 → Console).
Ассистент не отвечает — API ошибка Возможно исчерпана квота Google API. Подождите несколько минут. Приложение переподключится автоматически.
Плохое качество распознавания речи Говорите чётко, близко к микрофону. Снизьте фоновый шум. Проверьте уровень громкости микрофона в системе.
Нет звука в Safari (iPhone / Mac) Apple Safari аппаратно блокирует звук, если устройство в беззвучном режиме (Silent Mode), или направляет его в разговорный динамик. Рекомендуем использовать Google Chrome.
Видео не отправляется Проверьте разрешения браузера. Убедитесь что камера не занята другим приложением. Попробуйте другой браузер.
Диагностика WebSocket F12 → Network → фильтр WS → найдите соединение /ws — смотрите сообщения в реальном времени.

⌨️ Горячие клавиши

КлавишаДействие
MВключить/выключить микрофон
VВключить/выключить камеру
EnterОтправить текстовое сообщение
EscapeОстановить разговор
Ctrl+Shift+RЖёсткая перезагрузка страницы
F12Открыть DevTools (диагностика)
Совет Горячие клавиши работают только когда фокус не в поле ввода текста.