
Gemini 3.5 Live Translate
Gemini 3.5 Live Translate — это аудиомодель Google для перевода речи в речь с низкой задержкой и потоковой передачей, которая автоматически определяет более 70 языков и производит плавную, естественно звучащую переведенную речь, сохраняя интонацию, темп и высоту голоса говорящего.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate?ref=producthunt&utm_source=aipure

Информация о продукте
Обновлено:12/06/2026
Тенденции ежемесячного трафика Gemini 3.5 Live Translate
Gemini 3.5 Live Translate получил 8.5m посещений за прошлый месяц, демонстрируя Небольшое снижение на уровне -12.1%. Согласно нашему анализу, эта тенденция соответствует типичной рыночной динамике в секторе инструментов искусственного интеллекта.
Посмотреть историю трафикаЧто такое Gemini 3.5 Live Translate
Gemini 3.5 Live Translate — это специализированная аудиомодель семейства Gemini 3.5, созданная для плавного, почти в реальном времени голосового перевода во время живых разговоров. Вместо того чтобы быть типичным инструментом «говори, жди, затем переводи», она разработана для поддержания естественного диалога и предоставления реалистичного переведенного аудио на более чем 70 языках. Google разворачивает ее на нескольких платформах: публичная предварительная версия для разработчиков через Gemini Live API и Google AI Studio, частная предварительная версия для избранных корпоративных клиентов в Google Meet и глобальная доступность для конечных пользователей через приложение Google Translate на Android и iOS.
Ключевые особенности Gemini 3.5 Live Translate
Gemini 3.5 Live Translate — это аудиомодель Google для перевода речи в речь с низкой задержкой, которая обеспечивает перевод в режиме, близком к реальному времени, на более чем 70 языков. Она непрерывно переводит потоковое аудио (вместо поочередного перевода), автоматически определяет и переключает языки без ручной настройки, а также стремится сохранить интонацию, темп и высоту голоса говорящего, отставая всего на несколько секунд. Она разработана для работы в шумных, реальных условиях и внедряется через Gemini Live API/Google AI Studio для разработчиков, Google Meet (закрытое предварительное тестирование для предприятий) и приложение Google Translate на Android и iOS, с применением водяных знаков SynthID к сгенерированному аудио для обеспечения возможности обнаружения.
Перевод речи в речь в режиме, близком к реальному времени: Переводит разговорную речь непосредственно в разговорный вывод с низкой задержкой, отставая от говорящего всего на несколько секунд.
Непрерывная потоковая передача (не поочередная): Генерирует переведенную речь непрерывно, пока говорит говорящий, уменьшая неловкие паузы и делая разговоры более естественными.
Автоматическое определение более 70 языков: Автоматически распознает и переключается между более чем 70 языками, избегая ручной настройки входного языка в многоязычных беседах.
Сохраняет манеру и выразительность речи: Разработан для сохранения аспектов манеры речи говорящего — интонации, темпа и высоты голоса — чтобы переводы звучали более реалистично и соответствовали оригинальному тону.
Устойчивость к шуму для реальных условий: Создан для работы в громких и непредсказуемых условиях (например, разговоры на ходу, мероприятия, оживленные улицы), а не только в тихих комнатах.
Аудиовыход с водяными знаками SynthID: Все сгенерированное аудио включает незаметный водяной знак SynthID, встроенный в форму волны, чтобы помочь обнаружить речь, сгенерированную ИИ, и уменьшить злоупотребления.
Варианты использования Gemini 3.5 Live Translate
Многоязычные видеовстречи (для предприятий): В Google Meet обеспечивает синхронный перевод речи на более чем 70 языков и более 2000 языковых комбинаций, способствуя более инклюзивному глобальному сотрудничеству.
Путешествия и личные беседы: В приложении Google Translate поддерживает синхронный перевод через наушники (и «режим прослушивания» Android через динамик) для более беспрепятственного общения в реальном мире.
Поддержка клиентов и контакт-центры: Позволяет агентам и клиентам естественно общаться на разных языках, получая непрерывный переведенный аудиопоток, что повышает скорость и уменьшает недопонимания.
Вызов такси и координация мобильности: Обеспечивает связь между водителем и пассажиром в режиме, близком к реальному времени, при посадке и во время поездок (например, партнеры, такие как Grab, тестируют для многоязычных звонков).
Образование и обучение: Поддерживает синхронный перевод для уроков, репетиторства и семинаров, помогая преподавателям обучать многоязычную аудиторию без остановок для поочередного перевода.
Трансляции, мероприятия и приложения для синхронного перевода: Через Gemini Live API и партнерские потоковые платформы (например, LiveKit/Agora) разработчики могут создавать возможности дублирования и многоязычного перевода в реальном времени.
Преимущества
Более естественные разговоры благодаря непрерывному потоковому переводу с меньшим количеством пауз
Широкий охват с автоматическим обнаружением более 70 языков и обработкой многоязычного ввода
Разработан для практических условий с устойчивостью к шуму
Водяные знаки SynthID повышают прозрачность и помогают предотвратить неправомерное использование сгенерированного аудио
Недостатки
Перевод все еще может отставать от говорящего на несколько секунд из-за компромисса между качеством и синхронизацией
Доступность для предприятий в Google Meet изначально ограничена (закрытое предварительное тестирование перед более широким внедрением)
Цены/дополнительные расходы не были четко раскрыты при запуске в предоставленных источниках
Как использовать Gemini 3.5 Live Translate
1) Выберите, где вы хотите использовать Gemini 3.5 Live Translate: Выберите платформу, которая соответствует вашим потребностям: (a) приложение Google Translate (Android/iOS) для личного использования, (b) Google Meet (корпоративная/частная предварительная версия) для встреч или (c) Gemini Live API / Google AI Studio (разработчик/публичная предварительная версия) для встраивания перевода в реальном времени в ваше собственное приложение.
2) Используйте его в приложении Google Translate (Android/iOS): Установите/обновите Google Translate на Android или iOS. Откройте приложение и выберите режим живого перевода / перевода в режиме разговора. Подключите наушники для наиболее бесшовного опыта; модель транслирует переведенную речь почти в реальном времени на более чем 70 языках и стремится сохранить тон, темп и высоту голоса.
3) (Android) Попробуйте новый режим прослушивания для приватного воспроизведения: На поддерживаемых развертываниях Android включите новый режим прослушивания с 3.5 Live Translate. Поднесите телефон к уху, как при обычном звонке, чтобы услышать переведенный звук через динамик — это полезно, когда у вас нет наушников и вы хотите, чтобы другие не слышали перевод.
4) Используйте его в Google Meet (корпоративная/частная предварительная версия): Если вы являетесь избранным бизнес-клиентом Google Workspace в частной предварительной версии, откройте Google Meet и начните/присоединитесь к встрече. Используйте обновленный интерфейс Meet для доступа к переводу речи. Meet будет поддерживать более 70 языков и более 2000 языковых комбинаций в рамках одной встречи (не ограничиваясь английским в качестве опорного).
5) Попробуйте без кодирования в Google AI Studio (разработчик/публичная предварительная версия): Перейдите в Live-интерфейс Google AI Studio и выберите модель "gemini-3.5-live-translate-preview". Настройте сеанс для вывода AUDIO и включите перевод, установив код целевого языка. Начните потоковую передачу звука с микрофона; вы должны получать непрерывный переведенный звук и (опционально) входные/выходные транскрипции.
6) Создавайте с помощью Gemini Live API (разработчик/публичная предварительная версия) — настройте предварительные условия: Получите доступ к Gemini Live API и ключу API. Выберите свой стек потоковой передачи (WebSocket или SDK). Если вы не хотите самостоятельно создавать инфраструктуру для медиа в реальном времени, рассмотрите партнерские платформы, упомянутые в источниках (Agora, Fishjam, LiveKit, Pipecat, Vision Agents), которые обрабатывают инфраструктуру потоковой передачи в реальном времени.
7) Создайте Live-сессию и включите перевод в конфигурации: Подключитесь к Live API, используя модель "gemini-3.5-live-translate-preview", и установите LiveConnectConfig / generationConfig со следующими параметрами: responseModalities=["AUDIO"], inputAudioTranscription включена (опционально), outputAudioTranscription включена (опционально), и translationConfig с targetLanguageCode (например, "pl") и echoTargetLanguage (опционально).
8) Потоковая передача аудио и воспроизведение переведенного аудио (непрерывный перевод): Отправляйте аудиокадры/фрагменты с микрофона по мере их захвата. Модель обрабатывает речь по мере ее потоковой передачи и непрерывно возвращает переведенное аудио (отставая от говорящего на несколько секунд). Воспроизводите возвращаемый аудиопоток слушателю в реальном времени; при желании отображайте входные/выходные транскрипции, если они включены.
9) Обработка многоязычного и шумного реального ввода: Полагайтесь на автоматическое определение языка моделью для многоязычных вводов (ручное переключение языка не требуется). Разработайте свой пользовательский интерфейс для реальных условий: может возникать фоновый шум, прерывания и наложение речи; поддерживайте стабильный захват звука и предоставляйте четкие индикаторы того, кто говорит и на каком языке выводится речь.
10) Проверка вывода и информирование о водяных знаках: Имейте в виду, что весь звук, сгенерированный Gemini 3.5 Live Translate, помечен водяным знаком SynthID (незаметный водяной знак, встроенный в аудио). Если вы создаете продукт, документируйте, что переведенный звук сгенерирован ИИ и содержит водяные знаки для обнаружения.
11) Используйте официальные демонстрации и примеры кода для ускорения разработки: Просмотрите демонстрацию Google Gemini Live API и репозитории примеров (например, демонстрацию живого перевода на основе LiveKit и другие примеры Gemini Live API), чтобы скопировать работающий потоковый конвейер, а затем адаптировать его к пользовательскому интерфейсу вашего приложения и среде развертывания.
Часто задаваемые вопросы о Gemini 3.5 Live Translate
Gemini 3.5 Live Translate – это новейшая аудиомодель Google для почти "живого" перевода речи в речь.
Видео Gemini 3.5 Live Translate
Популярные статьи

Atoms: Мультиагентная ИИ-платформа, которая превращает идеи в готовые к запуску продукты
May 22, 2026

Nano Banana SBTI: Что это такое, как это работает и как это использовать в 2026 году
Apr 15, 2026

Обзор Atoms — AI Product Builder, переопределяющий цифровое творчество в 2026 году
Apr 10, 2026

Kilo Claw: Как развернуть и использовать настоящего AI-агента "Сделай-Это-За-Вас" (Обновление 2026)
Apr 3, 2026
Аналитика веб-сайта Gemini 3.5 Live Translate
Трафик и рейтинги Gemini 3.5 Live Translate
8.5M
Ежемесячные посещения
#8357
Глобальный рейтинг
#353
Рейтинг категории
Тенденции трафика: Nov 2024-Jun 2025
Анализ пользователей Gemini 3.5 Live Translate
00:00:53
Средняя продолжительность посещения
1.93
Страниц за посещение
55.03%
Показатель отказов
Основные регионы Gemini 3.5 Live Translate
US: 26.94%
IN: 8.76%
GB: 5.14%
JP: 4.24%
DE: 3.01%
Others: 51.91%







