Gemini 3.5 Live Translate

Gemini 3.5 Live Translate

Gemini 3.5 Live Translate — это аудиомодель Google для перевода речи в речь с низкой задержкой и потоковой передачей, которая автоматически определяет более 70 языков и производит плавную, естественно звучащую переведенную речь, сохраняя интонацию, темп и высоту голоса говорящего.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate?ref=producthunt&utm_source=aipure
Gemini 3.5 Live Translate

Информация о продукте

Обновлено:12/06/2026

Тенденции ежемесячного трафика Gemini 3.5 Live Translate

Gemini 3.5 Live Translate получил 8.5m посещений за прошлый месяц, демонстрируя Небольшое снижение на уровне -12.1%. Согласно нашему анализу, эта тенденция соответствует типичной рыночной динамике в секторе инструментов искусственного интеллекта.
Посмотреть историю трафика

Что такое Gemini 3.5 Live Translate

Gemini 3.5 Live Translate — это специализированная аудиомодель семейства Gemini 3.5, созданная для плавного, почти в реальном времени голосового перевода во время живых разговоров. Вместо того чтобы быть типичным инструментом «говори, жди, затем переводи», она разработана для поддержания естественного диалога и предоставления реалистичного переведенного аудио на более чем 70 языках. Google разворачивает ее на нескольких платформах: публичная предварительная версия для разработчиков через Gemini Live API и Google AI Studio, частная предварительная версия для избранных корпоративных клиентов в Google Meet и глобальная доступность для конечных пользователей через приложение Google Translate на Android и iOS.

Ключевые особенности Gemini 3.5 Live Translate

Gemini 3.5 Live Translate — это аудиомодель Google для перевода речи в речь с низкой задержкой, которая обеспечивает перевод в режиме, близком к реальному времени, на более чем 70 языков. Она непрерывно переводит потоковое аудио (вместо поочередного перевода), автоматически определяет и переключает языки без ручной настройки, а также стремится сохранить интонацию, темп и высоту голоса говорящего, отставая всего на несколько секунд. Она разработана для работы в шумных, реальных условиях и внедряется через Gemini Live API/Google AI Studio для разработчиков, Google Meet (закрытое предварительное тестирование для предприятий) и приложение Google Translate на Android и iOS, с применением водяных знаков SynthID к сгенерированному аудио для обеспечения возможности обнаружения.
Перевод речи в речь в режиме, близком к реальному времени: Переводит разговорную речь непосредственно в разговорный вывод с низкой задержкой, отставая от говорящего всего на несколько секунд.
Непрерывная потоковая передача (не поочередная): Генерирует переведенную речь непрерывно, пока говорит говорящий, уменьшая неловкие паузы и делая разговоры более естественными.
Автоматическое определение более 70 языков: Автоматически распознает и переключается между более чем 70 языками, избегая ручной настройки входного языка в многоязычных беседах.
Сохраняет манеру и выразительность речи: Разработан для сохранения аспектов манеры речи говорящего — интонации, темпа и высоты голоса — чтобы переводы звучали более реалистично и соответствовали оригинальному тону.
Устойчивость к шуму для реальных условий: Создан для работы в громких и непредсказуемых условиях (например, разговоры на ходу, мероприятия, оживленные улицы), а не только в тихих комнатах.
Аудиовыход с водяными знаками SynthID: Все сгенерированное аудио включает незаметный водяной знак SynthID, встроенный в форму волны, чтобы помочь обнаружить речь, сгенерированную ИИ, и уменьшить злоупотребления.

Варианты использования Gemini 3.5 Live Translate

Многоязычные видеовстречи (для предприятий): В Google Meet обеспечивает синхронный перевод речи на более чем 70 языков и более 2000 языковых комбинаций, способствуя более инклюзивному глобальному сотрудничеству.
Путешествия и личные беседы: В приложении Google Translate поддерживает синхронный перевод через наушники (и «режим прослушивания» Android через динамик) для более беспрепятственного общения в реальном мире.
Поддержка клиентов и контакт-центры: Позволяет агентам и клиентам естественно общаться на разных языках, получая непрерывный переведенный аудиопоток, что повышает скорость и уменьшает недопонимания.
Вызов такси и координация мобильности: Обеспечивает связь между водителем и пассажиром в режиме, близком к реальному времени, при посадке и во время поездок (например, партнеры, такие как Grab, тестируют для многоязычных звонков).
Образование и обучение: Поддерживает синхронный перевод для уроков, репетиторства и семинаров, помогая преподавателям обучать многоязычную аудиторию без остановок для поочередного перевода.
Трансляции, мероприятия и приложения для синхронного перевода: Через Gemini Live API и партнерские потоковые платформы (например, LiveKit/Agora) разработчики могут создавать возможности дублирования и многоязычного перевода в реальном времени.

Преимущества

Более естественные разговоры благодаря непрерывному потоковому переводу с меньшим количеством пауз
Широкий охват с автоматическим обнаружением более 70 языков и обработкой многоязычного ввода
Разработан для практических условий с устойчивостью к шуму
Водяные знаки SynthID повышают прозрачность и помогают предотвратить неправомерное использование сгенерированного аудио

Недостатки

Перевод все еще может отставать от говорящего на несколько секунд из-за компромисса между качеством и синхронизацией
Доступность для предприятий в Google Meet изначально ограничена (закрытое предварительное тестирование перед более широким внедрением)
Цены/дополнительные расходы не были четко раскрыты при запуске в предоставленных источниках

Как использовать Gemini 3.5 Live Translate

1) Выберите, где вы хотите использовать Gemini 3.5 Live Translate: Выберите платформу, которая соответствует вашим потребностям: (a) приложение Google Translate (Android/iOS) для личного использования, (b) Google Meet (корпоративная/частная предварительная версия) для встреч или (c) Gemini Live API / Google AI Studio (разработчик/публичная предварительная версия) для встраивания перевода в реальном времени в ваше собственное приложение.
2) Используйте его в приложении Google Translate (Android/iOS): Установите/обновите Google Translate на Android или iOS. Откройте приложение и выберите режим живого перевода / перевода в режиме разговора. Подключите наушники для наиболее бесшовного опыта; модель транслирует переведенную речь почти в реальном времени на более чем 70 языках и стремится сохранить тон, темп и высоту голоса.
3) (Android) Попробуйте новый режим прослушивания для приватного воспроизведения: На поддерживаемых развертываниях Android включите новый режим прослушивания с 3.5 Live Translate. Поднесите телефон к уху, как при обычном звонке, чтобы услышать переведенный звук через динамик — это полезно, когда у вас нет наушников и вы хотите, чтобы другие не слышали перевод.
4) Используйте его в Google Meet (корпоративная/частная предварительная версия): Если вы являетесь избранным бизнес-клиентом Google Workspace в частной предварительной версии, откройте Google Meet и начните/присоединитесь к встрече. Используйте обновленный интерфейс Meet для доступа к переводу речи. Meet будет поддерживать более 70 языков и более 2000 языковых комбинаций в рамках одной встречи (не ограничиваясь английским в качестве опорного).
5) Попробуйте без кодирования в Google AI Studio (разработчик/публичная предварительная версия): Перейдите в Live-интерфейс Google AI Studio и выберите модель "gemini-3.5-live-translate-preview". Настройте сеанс для вывода AUDIO и включите перевод, установив код целевого языка. Начните потоковую передачу звука с микрофона; вы должны получать непрерывный переведенный звук и (опционально) входные/выходные транскрипции.
6) Создавайте с помощью Gemini Live API (разработчик/публичная предварительная версия) — настройте предварительные условия: Получите доступ к Gemini Live API и ключу API. Выберите свой стек потоковой передачи (WebSocket или SDK). Если вы не хотите самостоятельно создавать инфраструктуру для медиа в реальном времени, рассмотрите партнерские платформы, упомянутые в источниках (Agora, Fishjam, LiveKit, Pipecat, Vision Agents), которые обрабатывают инфраструктуру потоковой передачи в реальном времени.
7) Создайте Live-сессию и включите перевод в конфигурации: Подключитесь к Live API, используя модель "gemini-3.5-live-translate-preview", и установите LiveConnectConfig / generationConfig со следующими параметрами: responseModalities=["AUDIO"], inputAudioTranscription включена (опционально), outputAudioTranscription включена (опционально), и translationConfig с targetLanguageCode (например, "pl") и echoTargetLanguage (опционально).
8) Потоковая передача аудио и воспроизведение переведенного аудио (непрерывный перевод): Отправляйте аудиокадры/фрагменты с микрофона по мере их захвата. Модель обрабатывает речь по мере ее потоковой передачи и непрерывно возвращает переведенное аудио (отставая от говорящего на несколько секунд). Воспроизводите возвращаемый аудиопоток слушателю в реальном времени; при желании отображайте входные/выходные транскрипции, если они включены.
9) Обработка многоязычного и шумного реального ввода: Полагайтесь на автоматическое определение языка моделью для многоязычных вводов (ручное переключение языка не требуется). Разработайте свой пользовательский интерфейс для реальных условий: может возникать фоновый шум, прерывания и наложение речи; поддерживайте стабильный захват звука и предоставляйте четкие индикаторы того, кто говорит и на каком языке выводится речь.
10) Проверка вывода и информирование о водяных знаках: Имейте в виду, что весь звук, сгенерированный Gemini 3.5 Live Translate, помечен водяным знаком SynthID (незаметный водяной знак, встроенный в аудио). Если вы создаете продукт, документируйте, что переведенный звук сгенерирован ИИ и содержит водяные знаки для обнаружения.
11) Используйте официальные демонстрации и примеры кода для ускорения разработки: Просмотрите демонстрацию Google Gemini Live API и репозитории примеров (например, демонстрацию живого перевода на основе LiveKit и другие примеры Gemini Live API), чтобы скопировать работающий потоковый конвейер, а затем адаптировать его к пользовательскому интерфейсу вашего приложения и среде развертывания.

Часто задаваемые вопросы о Gemini 3.5 Live Translate

Gemini 3.5 Live Translate – это новейшая аудиомодель Google для почти "живого" перевода речи в речь.

Аналитика веб-сайта Gemini 3.5 Live Translate

Трафик и рейтинги Gemini 3.5 Live Translate
8.5M
Ежемесячные посещения
#8357
Глобальный рейтинг
#353
Рейтинг категории
Тенденции трафика: Nov 2024-Jun 2025
Анализ пользователей Gemini 3.5 Live Translate
00:00:53
Средняя продолжительность посещения
1.93
Страниц за посещение
55.03%
Показатель отказов
Основные регионы Gemini 3.5 Live Translate
  1. US: 26.94%

  2. IN: 8.76%

  3. GB: 5.14%

  4. JP: 4.24%

  5. DE: 3.01%

  6. Others: 51.91%

Последние ИИ-инструменты, похожие на Gemini 3.5 Live Translate

InDesign Translator
InDesign Translator
InDesign Translator — это онлайн-сервис перевода, который позволяет пользователям переводить файлы InDesign, сохраняя форматирование и стили, и предлагает перевод с поддержкой ИИ и удобные функции совместной работы без необходимости установки InDesign у переводчиков.
Blanc AI
Blanc AI
Contact for PricingTranslateAI Video Editing
Blanc AI — это революционное решение на основе ИИ, которое позволяет переводить и дублировать видеоконтент на более чем 47 языков, сохраняя оригинальный голос, эмоции и синхронизацию губ.
MenuGuide
MenuGuide
MenuGuide is a cutting-edge AI-powered app that instantly translates restaurant menus from any language to your preferred language, providing dish details, allergen information, and nutritional facts for seamless global dining experiences.
Vocabulary AI
Vocabulary AI
Vocabulary AI - это продвинутая платформа для изучения языков на основе ИИ, которая сочетает перевод, создание словарного запаса и персонализированную практику через веб-сайт, мобильное приложение и расширение для браузера, чтобы помочь пользователям эффективно учить и запоминать новые слова.