¿Cuántos idiomas soporta Gemini 3.5 Live Translate?

Detecta y traduce automáticamente en más de 70 idiomas.

¿Traduce solo después de que alguien termina de hablar (turno por turno)?

No. Genera voz traducida continuamente mientras el hablante está hablando, con el objetivo de quedarse solo unos segundos atrás, equilibrando la latencia y la calidad de la traducción.

¿Conserva las características de voz del hablante?

Genera voz traducida con un sonido natural que conserva la entonación, el ritmo y el tono del hablante.

¿Dónde está disponible Gemini 3.5 Live Translate?

Se está implementando a través de la API de Gemini Live y Google AI Studio para desarrolladores (vista previa pública), en Google Meet para empresas (vista previa privada a partir de este mes) y en la aplicación Google Translate en Android e iOS para todos.

¿Pueden los desarrolladores crear aplicaciones de traducción en tiempo real con él, y qué herramientas están disponibles?

Sí. Los desarrolladores pueden usarlo a través de la API de Gemini Live, y Google proporciona demostraciones y código de ejemplo (por ejemplo, en el repositorio gemini-live-api-examples, incluida una demostración de traducción en vivo basada en LiveKit).

¿Requiere configuración manual de idioma?

No. El modelo maneja entradas multilingües y detecta idiomas automáticamente sin necesidad de configuración manual.

¿Cómo aborda Google la seguridad y la detectabilidad del audio generado?

El audio generado por el modelo tiene una marca de agua con SynthID, una marca de agua imperceptible incrustada en el audio para ayudar a que el contenido generado por IA sea detectable.

Gemini 3.5 Live Translate

WebsiteAppFree TrialTranslate AI Voice Chat Generator

Gemini 3.5 Live Translate es el modelo de audio de traducción de voz a voz en tiempo real y de baja latencia de Google que detecta automáticamente más de 70 idiomas y produce un habla traducida fluida y de sonido natural, preservando la entonación, el ritmo y el tono del hablante.

Visitar Sitio Web

Anunciar Esta Herramienta

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate?ref=producthunt&utm_source=aipure

Resumen
Análisis
Video
Alternativas

Información del Producto

Actualizado:15/06/2026

Tendencias de Tráfico Mensual de Gemini 3.5 Live Translate

Gemini 3.5 Live Translate recibió 8.5m visitas el mes pasado, demostrando un Ligero Descenso de -12.1%. Según nuestro análisis, esta tendencia se alinea con la dinámica típica del mercado en el sector de herramientas de IA.

Ver historial de tráfico

¿Qué es Gemini 3.5 Live Translate?

Gemini 3.5 Live Translate es un modelo de audio especializado de la familia Gemini 3.5 creado para una traducción de voz fluida y casi en tiempo real durante conversaciones en vivo. En lugar de sentirse como una herramienta típica de "hablar, esperar y luego traducir", está diseñado para seguir el diálogo natural y ofrecer audio traducido realista en más de 70 idiomas. Google lo está implementando en múltiples superficies: una vista previa pública para desarrolladores a través de la API de Gemini Live y Google AI Studio, una vista previa privada para clientes empresariales seleccionados en Google Meet y disponibilidad global para usuarios finales a través de la aplicación Google Translate en Android e iOS.

Características Principales de Gemini 3.5 Live Translate

Gemini 3.5 Live Translate es el modelo de audio de traducción de voz a voz de baja latencia de Google que ofrece traducción casi en tiempo real en más de 70 idiomas. Traduce continuamente audio en streaming (en lugar de turno por turno), detecta y cambia automáticamente de idioma sin configuración manual, y tiene como objetivo preservar la entonación, el ritmo y el tono del hablante, manteniéndose solo unos segundos por detrás. Está diseñado para funcionar en entornos ruidosos y del mundo real y se está implementando en la API de Gemini Live/Google AI Studio para desarrolladores, Google Meet (vista previa privada para empresas) y la aplicación Google Translate en Android e iOS, con la marca de agua SynthID aplicada al audio generado para su detectabilidad.

Traducción de voz a voz casi en tiempo real: Traduce el lenguaje hablado directamente a una salida hablada con baja latencia, manteniendo la traducción solo unos segundos por detrás del hablante.

Transmisión continua (no por turnos): Genera voz traducida continuamente mientras el hablante está hablando, lo que reduce las pausas incómodas y hace que las conversaciones se sientan más naturales.

Detección automática de más de 70 idiomas: Reconoce y cambia entre más de 70 idiomas automáticamente, evitando la configuración manual del idioma de entrada en conversaciones multilingües.

Preserva la entrega y la expresividad: Diseñado para retener aspectos de la entrega del hablante (entonación, ritmo y tono) para que las traducciones suenen más realistas y alineadas con el tono original.

Robusto al ruido para entornos del mundo real: Construido para funcionar en entornos ruidosos e impredecibles (por ejemplo, conversaciones en movimiento, eventos, calles concurridas) en lugar de solo en habitaciones tranquilas.

Salida de audio con marca de agua SynthID: Todo el audio generado incluye una marca de agua SynthID imperceptible incrustada en la forma de onda para ayudar a detectar el habla generada por IA y reducir el uso indebido.

Casos de Uso de Gemini 3.5 Live Translate

Videollamadas multilingües (empresariales): En Google Meet, permite la traducción de voz en vivo en más de 70 idiomas y más de 2000 combinaciones de idiomas, lo que fomenta una colaboración global más inclusiva.

Viajes y conversaciones en persona: En la aplicación Google Translate, admite la traducción en vivo a través de auriculares (y el 'modo de escucha' de Android a través del auricular) para una comunicación más fluida en el mundo real.

Atención al cliente y centros de contacto: Permite que los agentes y los clientes hablen de forma natural en diferentes idiomas mientras reciben audio traducido continuamente, lo que mejora la velocidad y reduce los malentendidos.

Coordinación de viajes compartidos y movilidad: Permite la comunicación casi en tiempo real entre el conductor y el pasajero en las recogidas y durante los viajes (por ejemplo, socios como Grab que prueban para llamadas multilingües).

Educación y formación: Admite la interpretación en vivo para lecciones, tutorías y talleres, ayudando a los instructores a enseñar a audiencias multilingües sin detenerse para la traducción por turnos.

Aplicaciones de transmisión, eventos e interpretación en vivo: A través de la API de Gemini Live y las plataformas de transmisión asociadas (por ejemplo, LiveKit/Agora), los desarrolladores pueden crear experiencias de doblaje en tiempo real y traducción a varios idiomas.

Ventajas

Conversaciones más naturales gracias a la traducción continua en streaming con menos pausas

Amplia cobertura con detección automática de más de 70 idiomas y manejo de entrada multilingüe

Diseñado para entornos prácticos con robustez al ruido

La marca de agua SynthID mejora la transparencia y ayuda a disuadir el uso indebido del audio generado

Desventajas

La traducción aún puede retrasarse unos segundos con respecto al hablante debido al equilibrio entre calidad y sincronización

La disponibilidad empresarial en Google Meet está inicialmente limitada (vista previa privada antes de una implementación más amplia)

Los precios/costos adicionales no se revelaron claramente en el lanzamiento en las fuentes proporcionadas

Cómo Usar Gemini 3.5 Live Translate

1) Elija dónde desea usar Gemini 3.5 Live Translate: Elija la superficie que se adapte a sus necesidades: (a) aplicación Google Translate (Android/iOS) para uso personal, (b) Google Meet (vista previa empresarial/privada) para reuniones, o (c) API de Gemini Live / Google AI Studio (vista previa para desarrolladores/pública) para integrar la traducción en tiempo real en su propia aplicación.

2) Úselo en la aplicación Google Translate (Android/iOS): Instale/actualice Google Translate en Android o iOS. Abra la aplicación y seleccione la experiencia de traducción en vivo / conversación. Conecte auriculares para una experiencia más fluida; el modelo transmite voz traducida casi en tiempo real en más de 70 idiomas y tiene como objetivo preservar el tono, el ritmo y la entonación.

3) (Android) Pruebe el nuevo Modo de escucha para reproducción privada: En las implementaciones de Android compatibles, habilite el nuevo Modo de escucha con 3.5 Live Translate. Sostenga su teléfono en su oído como una llamada normal para escuchar el audio traducido a través del auricular, útil cuando no tiene auriculares y no quiere que otros escuchen la traducción.

4) Úselo en Google Meet (vista previa empresarial/privada): Si es un cliente empresarial selecto de Google Workspace en la vista previa privada, abra Google Meet e inicie/únase a una reunión. Utilice la interfaz actualizada de Meet para acceder a la traducción de voz. Meet admitirá más de 70 idiomas y más de 2000 combinaciones de idiomas dentro de una sola reunión (no limitado al inglés como pivote).

5) Pruébelo sin codificar en Google AI Studio (vista previa para desarrolladores/pública): Vaya a la experiencia Live de Google AI Studio y seleccione el modelo "gemini-3.5-live-translate-preview". Configure la sesión para salida de AUDIO y habilite la traducción estableciendo un código de idioma de destino. Comience a transmitir audio del micrófono; debería recibir audio traducido continuo y (opcionalmente) transcripciones de entrada/salida.

6) Desarrolle con la API de Gemini Live (vista previa para desarrolladores/pública) — configure los requisitos previos: Obtenga acceso a la API de Gemini Live y una clave de API. Decida su pila de transmisión (WebSocket o SDK). Si no desea construir usted mismo la infraestructura de medios en tiempo real, considere las plataformas asociadas mencionadas en las fuentes (Agora, Fishjam, LiveKit, Pipecat, Vision Agents) que manejan la infraestructura de transmisión en tiempo real.

7) Cree una sesión Live y habilite la traducción en la configuración: Conéctese a la API de Live usando el modelo "gemini-3.5-live-translate-preview" y configure un LiveConnectConfig / generationConfig con: responseModalities=["AUDIO"], inputAudioTranscription habilitado (opcional), outputAudioTranscription habilitado (opcional), y translationConfig con targetLanguageCode (por ejemplo, "pl") y echoTargetLanguage (opcional).

8) Transmita audio y reproduzca audio traducido (traducción continua): Envíe fotogramas/fragmentos de audio del micrófono a medida que se capturan. El modelo procesa el habla a medida que se transmite y devuelve audio traducido continuamente (manteniéndose unos segundos detrás del hablante). Reproduzca la transmisión de audio devuelta al oyente en tiempo real; opcionalmente, muestre las transcripciones de entrada/salida si están habilitadas.

9) Maneje entradas multilingües y ruidosas del mundo real: Confíe en la detección automática de idioma del modelo para entradas multilingües (no se requiere cambio manual de idioma). Diseñe su UX para entornos reales: pueden ocurrir ruido de fondo, interrupciones y habla superpuesta; mantenga la captura de audio estable y proporcione indicadores claros de quién está hablando y qué idioma se está emitiendo.

10) Valide la salida y comunique la marca de agua: Tenga en cuenta que todo el audio generado por Gemini 3.5 Live Translate tiene una marca de agua con SynthID (marca de agua imperceptible incrustada en el audio). Si está creando un producto, documente que el audio traducido es generado por IA e incluye una marca de agua para su detectabilidad.

11) Utilice demostraciones oficiales y código de ejemplo para acelerar el desarrollo: Revise la demostración de la API de Gemini Live de Google y los repositorios de ejemplos (por ejemplo, la demostración de traducción en vivo basada en LiveKit y otros ejemplos de la API de Gemini Live) para copiar una canalización de transmisión que funcione, luego adáptela a la interfaz de usuario y al entorno de implementación de su aplicación.

Preguntas Frecuentes de Gemini 3.5 Live Translate

Gemini 3.5 Live Translate es el último modelo de audio de Google para traducción de voz a voz casi en tiempo real.

Video de Gemini 3.5 Live Translate

Artículos Populares

Atoms: Una Plataforma de IA Multiagente Que Transforma Ideas en Productos Listos para Lanzar

May 22, 2026

Nano Banana SBTI: Qué es, cómo funciona y cómo usarlo en 2026

Apr 15, 2026

Reseña de Atoms: El Constructor de Productos de IA que Redefine la Creación Digital en 2026

Apr 10, 2026

Kilo Claw: Cómo implementar y usar un verdadero agente de IA "Hágalo por usted" (Actualización 2026)

Apr 3, 2026

Análisis del Sitio Web de Gemini 3.5 Live Translate

Tráfico y Clasificaciones de Gemini 3.5 Live Translate

8.5M

Visitas Mensuales

#8357

Clasificación Global

#353

Clasificación por Categoría

Tendencias de Tráfico: Nov 2024-Jun 2025

Información de Usuarios de Gemini 3.5 Live Translate

00:00:53

Duración Promedio de Visita

1.93

Páginas por Visita

55.03%

Tasa de Rebote de Usuarios

Principales Regiones de Gemini 3.5 Live Translate

US: 26.94%

IN: 8.76%

GB: 5.14%

JP: 4.24%

DE: 3.01%

Others: 51.91%

Últimas herramientas de IA similares a Gemini 3.5 Live Translate

InDesign Translator

Free TrialTranslate AI Documents Assistant

InDesign Translator es un servicio de traducción en línea que permite a los usuarios traducir archivos de InDesign mientras mantiene el formato y los estilos, ofreciendo traducción asistida por IA y características de colaboración fáciles sin requerir que los traductores tengan InDesign instalado.

Blanc AI

Contact for PricingTranslate AI Video Editing

Blanc AI es una solución de IA revolucionaria que permite la traducción y el doblaje de contenido de video a más de 47 idiomas mientras preserva la voz original, las emociones y la sincronización de labios.

MenuGuide

FreemiumTranslate AI Cooking Assistant

MenuGuide es una aplicación de vanguardia impulsada por IA que traduce instantáneamente menús de restaurantes de cualquier idioma a tu idioma preferido, proporcionando detalles de los platos, información sobre alérgenos y datos nutricionales para experiencias gastronómicas globales sin problemas.

Vocabulary AI

Free TrialTranslate AI Education Assistant

Vocabulary AI es una plataforma avanzada de aprendizaje de idiomas impulsada por IA que combina traducción, construcción de vocabulario y práctica personalizada a través del sitio web, la aplicación móvil y la extensión del navegador para ayudar a los usuarios a aprender y retener nuevas palabras de manera efectiva.

Herramientas de IA populares como Gemini 3.5 Live Translate

ChatGPT Translate

FreeTranslate

ChatGPT Translate es el servicio de traducción dedicado de OpenAI que admite más de 50 idiomas con funciones de personalización impulsadas por IA para producir traducciones naturales y conscientes del contexto en diferentes tonos y estilos.

RSTGameTranslation

FreeTranslate AI Speech Recognition

RSTGameTranslation es una herramienta de traducción de juegos en tiempo real de código abierto que combina tecnologías de OCR y traducción de IA para traducir automáticamente el texto del juego en varios idiomas, al tiempo que admite modos tanto fuera de línea como en línea.

DeepL

FreemiumTranslate

DeepL es un servicio de traducción impulsado por IA que proporciona traducciones rápidas, precisas y matizadas en 33 idiomas utilizando tecnología avanzada de redes neuronales.

Duory

Free TrialTranslate AI Notes Assistant

Duory es una aplicación dinámica de acompañamiento para el aprendizaje de idiomas que ayuda a los usuarios de Duolingo a reforzar sus lecciones a través de la toma de notas interactivas, funciones de traducción y capacidades de grabación de voz.

Clasificación

Enviar y PromoverNew

Gemini 3.5 Live Translate

Información del Producto

Tendencias de Tráfico Mensual de Gemini 3.5 Live Translate

¿Qué es Gemini 3.5 Live Translate?

Características Principales de Gemini 3.5 Live Translate

Casos de Uso de Gemini 3.5 Live Translate

Ventajas

Desventajas

Cómo Usar Gemini 3.5 Live Translate

Preguntas Frecuentes de Gemini 3.5 Live Translate

1. ¿Qué es Gemini 3.5 Live Translate?

2. ¿Cuántos idiomas soporta Gemini 3.5 Live Translate?

3. ¿Traduce solo después de que alguien termina de hablar (turno por turno)?

4. ¿Conserva las características de voz del hablante?

5. ¿Dónde está disponible Gemini 3.5 Live Translate?

6. ¿Pueden los desarrolladores crear aplicaciones de traducción en tiempo real con él, y qué herramientas están disponibles?

7. ¿Requiere configuración manual de idioma?

8. ¿Cómo aborda Google la seguridad y la detectabilidad del audio generado?

Video de Gemini 3.5 Live Translate

Artículos Populares

Análisis del Sitio Web de Gemini 3.5 Live Translate

Últimas herramientas de IA similares a Gemini 3.5 Live Translate

Herramientas de IA populares como Gemini 3.5 Live Translate