Gemini 3.5 Live Translate

Gemini 3.5 Live Translate

O Gemini 3.5 Live Translate é o modelo de áudio de tradução de fala para fala de baixa latência e streaming do Google que detecta automaticamente mais de 70 idiomas e produz fala traduzida suave e com som natural, preservando a entonação, o ritmo e o tom do orador.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate?ref=producthunt&utm_source=aipure
Gemini 3.5 Live Translate

Informações do Produto

Atualizado:Jun 12, 2026

Tendências de Tráfego Mensal do Gemini 3.5 Live Translate

Gemini 3.5 Live Translate recebeu 8.5m visitas no mês passado, demonstrando um Leve Declínio de -12.1%. Com base em nossa análise, essa tendência está alinhada com a dinâmica típica do mercado no setor de ferramentas de IA.
Ver histórico de tráfego

O que é Gemini 3.5 Live Translate

O Gemini 3.5 Live Translate é um modelo de áudio especializado da família Gemini 3.5, desenvolvido para tradução de voz fluida e quase em tempo real durante conversas ao vivo. Em vez de parecer uma ferramenta típica de "falar, esperar e depois traduzir", ele foi projetado para acompanhar o diálogo natural e fornecer áudio traduzido realista em mais de 70 idiomas. O Google está lançando-o em várias plataformas: uma prévia pública para desenvolvedores via API Gemini Live e Google AI Studio, uma prévia privada para clientes empresariais selecionados no Google Meet e disponibilidade global para usuários finais por meio do aplicativo Google Tradutor no Android e iOS.

Principais Recursos do Gemini 3.5 Live Translate

O Gemini 3.5 Live Translate é o modelo de áudio de tradução de fala para fala de baixa latência do Google que oferece tradução quase em tempo real em mais de 70 idiomas. Ele traduz continuamente áudio de streaming (em vez de turno a turno), detecta e alterna automaticamente os idiomas sem configuração manual e visa preservar a entonação, o ritmo e o tom do falante, mantendo-se apenas alguns segundos atrasado. Ele foi projetado para funcionar em ambientes ruidosos e do mundo real e está sendo lançado na API Gemini Live/Google AI Studio para desenvolvedores, Google Meet (prévia privada para empresas) e no aplicativo Google Tradutor para Android e iOS, com marca d'água SynthID aplicada ao áudio gerado para detecção.
Tradução de fala para fala quase em tempo real: Traduz a linguagem falada diretamente para a saída falada com baixa latência, mantendo a tradução apenas alguns segundos atrás do falante.
Streaming contínuo (não turno a turno): Gera fala traduzida continuamente enquanto o falante está falando, reduzindo pausas incômodas e tornando as conversas mais naturais.
Detecção automática de mais de 70 idiomas: Reconhece e alterna entre mais de 70 idiomas automaticamente, evitando a configuração manual do idioma de entrada em conversas multilíngues.
Preserva a entrega e a expressividade: Projetado para reter aspectos da entrega do falante – entonação, ritmo e tom – para que as traduções soem mais realistas e alinhadas com o tom original.
Robusto a ruídos para ambientes do mundo real: Construído para funcionar em ambientes barulhentos e imprevisíveis (por exemplo, conversas em movimento, eventos, ruas movimentadas) em vez de apenas salas silenciosas.
Saída de áudio com marca d'água SynthID: Todo o áudio gerado inclui uma marca d'água SynthID imperceptível incorporada na forma de onda para ajudar a detectar fala gerada por IA e reduzir o uso indevido.

Casos de Uso do Gemini 3.5 Live Translate

Reuniões de vídeo multilíngues (empresarial): No Google Meet, permite a tradução de fala ao vivo em mais de 70 idiomas e mais de 2000 combinações de idiomas, apoiando uma colaboração global mais inclusiva.
Viagens e conversas presenciais: No aplicativo Google Tradutor, suporta tradução ao vivo via fones de ouvido (e 'modo de escuta' do Android via fone de ouvido) para uma comunicação mais fluida no mundo real.
Suporte ao cliente e centrais de contato: Permite que agentes e clientes falem naturalmente em diferentes idiomas enquanto recebem áudio traduzido continuamente, melhorando a velocidade e reduzindo mal-entendidos.
Chamadas de carros e coordenação de mobilidade: Permite a comunicação quase em tempo real entre motorista e passageiro em embarques e durante viagens (por exemplo, parceiros como o Grab testando para chamadas multilíngues).
Educação e treinamento: Suporta interpretação ao vivo para aulas, tutoria e workshops, ajudando instrutores a ensinar públicos multilíngues sem parar para tradução baseada em turnos.
Transmissão, eventos e aplicativos de interpretação ao vivo: Através da API Gemini Live e plataformas de streaming parceiras (por exemplo, LiveKit/Agora), os desenvolvedores podem criar experiências de dublagem em tempo real e tradução multilíngue.

Vantagens

Conversas mais naturais devido à tradução contínua por streaming com menos pausas
Ampla cobertura com detecção automática de mais de 70 idiomas e tratamento de entrada multilíngue
Projetado para ambientes práticos com robustez a ruídos
A marca d'água SynthID melhora a transparência e ajuda a dissuadir o uso indevido de áudio gerado

Desvantagens

A tradução ainda pode atrasar alguns segundos em relação ao falante devido ao trade-off entre qualidade e sincronização
A disponibilidade empresarial no Google Meet é inicialmente limitada (prévia privada antes do lançamento mais amplo)
Preços/custos adicionais não foram claramente divulgados no lançamento nas fontes fornecidas

Como Usar o Gemini 3.5 Live Translate

1) Escolha onde você deseja usar o Gemini 3.5 Live Translate: Escolha a plataforma que melhor se adapta às suas necessidades: (a) aplicativo Google Tradutor (Android/iOS) para uso pessoal, (b) Google Meet (empresa/prévia privada) para reuniões, ou (c) API Gemini Live / Google AI Studio (desenvolvedor/prévia pública) para integrar a tradução em tempo real ao seu próprio aplicativo.
2) Use-o no aplicativo Google Tradutor (Android/iOS): Instale/atualize o Google Tradutor no Android ou iOS. Abra o aplicativo e selecione a experiência de tradução ao vivo / conversação. Conecte fones de ouvido para a experiência mais fluida; o modelo transmite a fala traduzida em tempo quase real em mais de 70 idiomas e visa preservar o tom, o ritmo e a entonação.
3) (Android) Experimente o novo Modo de Escuta para reprodução privada: Em lançamentos Android compatíveis, ative o novo Modo de Escuta com o 3.5 Live Translate. Segure o telefone no ouvido como uma chamada normal para ouvir o áudio traduzido pelo fone de ouvido – útil quando você não tem fones de ouvido e não quer que outras pessoas ouçam a tradução.
4) Use-o no Google Meet (empresa/prévia privada): Se você é um cliente empresarial selecionado do Google Workspace na prévia privada, abra o Google Meet e inicie/participe de uma reunião. Use a interface atualizada do Meet para acessar a tradução de fala. O Meet suportará mais de 70 idiomas e mais de 2000 combinações de idiomas em uma única reunião (não limitado ao inglês como pivô).
5) Experimente sem codificar no Google AI Studio (desenvolvedor/prévia pública): Vá para a experiência Live do Google AI Studio e selecione o modelo "gemini-3.5-live-translate-preview". Configure a sessão para saída de ÁUDIO e ative a tradução definindo um código de idioma de destino. Comece a transmitir áudio do microfone; você deverá receber áudio traduzido contínuo e (opcionalmente) transcrições de entrada/saída.
6) Desenvolva com a API Gemini Live (desenvolvedor/prévia pública) — configure os pré-requisitos: Obtenha acesso à API Gemini Live e uma chave de API. Decida sua pilha de streaming (WebSocket ou SDK). Se você não quiser construir a infraestrutura de mídia em tempo real, considere as plataformas parceiras mencionadas nas fontes (Agora, Fishjam, LiveKit, Pipecat, Vision Agents) que lidam com a infraestrutura de streaming em tempo real.
7) Crie uma sessão Live e ative a tradução na configuração: Conecte-se à API Live usando o modelo "gemini-3.5-live-translate-preview" e defina um LiveConnectConfig / generationConfig com: responseModalities=["AUDIO"], inputAudioTranscription ativado (opcional), outputAudioTranscription ativado (opcional) e translationConfig com targetLanguageCode (por exemplo, "pl") e echoTargetLanguage (opcional).
8) Transmita áudio e reproduza áudio traduzido (tradução contínua): Envie quadros/blocos de áudio do microfone à medida que são capturados. O modelo processa a fala à medida que é transmitida e retorna áudio traduzido continuamente (ficando alguns segundos atrás do orador). Reproduza o fluxo de áudio retornado para o ouvinte em tempo real; opcionalmente, exiba transcrições de entrada/saída se ativadas.
9) Lide com entrada multilíngue e ruidosa do mundo real: Conte com a detecção automática de idioma do modelo para entradas multilíngues (não é necessária troca manual de idioma). Projete sua UX para ambientes reais: ruído de fundo, interrupções e fala sobreposta podem ocorrer; mantenha a captura de áudio estável e forneça indicadores claros de quem está falando e qual idioma está sendo emitido.
10) Valide a saída e comunique a marca d'água: Esteja ciente de que todo o áudio gerado pelo Gemini 3.5 Live Translate é marcado com SynthID (marca d'água imperceptível incorporada ao áudio). Se você estiver desenvolvendo um produto, documente que o áudio traduzido é gerado por IA e inclui marca d'água para detectabilidade.
11) Use demonstrações oficiais e código de exemplo para acelerar o desenvolvimento: Revise a demonstração da API Gemini Live do Google e os repositórios de exemplo (por exemplo, a demonstração de tradução ao vivo baseada em LiveKit e outros exemplos da API Gemini Live) para copiar um pipeline de streaming funcional e, em seguida, adaptá-lo à interface do usuário e ao ambiente de implantação do seu aplicativo.

Perguntas Frequentes do Gemini 3.5 Live Translate

O Gemini 3.5 Live Translate é o modelo de áudio mais recente do Google para tradução de fala para fala quase em tempo real.

Análises do Site Gemini 3.5 Live Translate

Tráfego e Classificações do Gemini 3.5 Live Translate
8.5M
Visitas Mensais
#8357
Classificação Global
#353
Classificação por Categoria
Tendências de Tráfego: Nov 2024-Jun 2025
Insights dos Usuários do Gemini 3.5 Live Translate
00:00:53
Duração Média da Visita
1.93
Páginas por Visita
55.03%
Taxa de Rejeição dos Usuários
Principais Regiões do Gemini 3.5 Live Translate
  1. US: 26.94%

  2. IN: 8.76%

  3. GB: 5.14%

  4. JP: 4.24%

  5. DE: 3.01%

  6. Others: 51.91%

Ferramentas de IA Mais Recentes Semelhantes a Gemini 3.5 Live Translate

InDesign Translator
InDesign Translator
O InDesign Translator é um serviço de tradução online que permite aos usuários traduzir arquivos do InDesign enquanto mantém a formatação e os estilos, oferecendo tradução assistida por IA e recursos de colaboração fáceis sem exigir que os tradutores tenham o InDesign instalado.
Blanc AI
Blanc AI
Contact for PricingTranslateAI Video Editing
Blanc AI é uma solução de IA revolucionária que permite a tradução e dublagem de conteúdo em vídeo em mais de 47 idiomas, preservando a voz original, emoções e sincronização labial.
MenuGuide
MenuGuide
MenuGuide é um aplicativo de ponta alimentado por IA que traduz instantaneamente menus de restaurantes de qualquer idioma para o seu idioma preferido, fornecendo detalhes dos pratos, informações sobre alérgenos e fatos nutricionais para experiências gastronômicas globais sem costura.
Vocabulary AI
Vocabulary AI
Vocabulary AI é uma plataforma avançada de aprendizagem de idiomas impulsionada por IA que combina tradução, construção de vocabulário e prática personalizada através de site, aplicativo móvel e extensão do navegador para ajudar os usuários a aprender e reter novas palavras de forma eficaz.