Gemini 3.5 Live Translate

Gemini 3.5 Live Translate

Gemini 3.5 Live Translate est le modèle audio de traduction vocale en temps réel et à faible latence de Google qui détecte automatiquement plus de 70 langues et produit une parole traduite fluide et naturelle tout en préservant l'intonation, le rythme et la hauteur de l'orateur.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate?ref=producthunt&utm_source=aipure
Gemini 3.5 Live Translate

Informations sur le produit

Mis à jour:Jun 12, 2026

Tendances du trafic mensuel de Gemini 3.5 Live Translate

Gemini 3.5 Live Translate a reçu 8.5m visites le mois dernier, démontrant une Légère baisse de -12.1%. Selon notre analyse, cette tendance s'aligne avec la dynamique typique du marché dans le secteur des outils d'IA.
Voir l'historique du trafic

Qu'est-ce que Gemini 3.5 Live Translate

Gemini 3.5 Live Translate est un modèle audio spécialisé de la famille Gemini 3.5 conçu pour une traduction vocale fluide et quasi en temps réel lors de conversations en direct. Au lieu de ressembler à un outil typique "parler, attendre, puis traduire", il est conçu pour suivre un dialogue naturel et fournir un son traduit réaliste dans plus de 70 langues. Google le déploie sur plusieurs surfaces : une préversion publique pour les développeurs via l'API Gemini Live et Google AI Studio, une préversion privée pour certains clients d'entreprise dans Google Meet, et une disponibilité mondiale pour les utilisateurs finaux via l'application Google Traduction sur Android et iOS.

Caractéristiques principales de Gemini 3.5 Live Translate

Gemini 3.5 Live Translate est le modèle audio de traduction parole-à-parole à faible latence de Google qui offre une traduction quasi en temps réel dans plus de 70 langues. Il traduit en continu l'audio en streaming (au lieu de tour par tour), détecte et change automatiquement de langue sans configuration manuelle, et vise à préserver l'intonation, le rythme et la hauteur de la voix de l'orateur tout en ne restant que quelques secondes derrière. Il est conçu pour fonctionner dans des environnements bruyants et réels et est déployé via l'API Gemini Live/Google AI Studio pour les développeurs, Google Meet (aperçu privé pour les entreprises) et l'application Google Traduction sur Android et iOS, avec un filigrane SynthID appliqué à l'audio généré pour la détectabilité.
Traduction parole-à-parole quasi en temps réel: Traduit la langue parlée directement en sortie vocale avec une faible latence, maintenant la traduction à seulement quelques secondes de l'orateur.
Streaming continu (pas tour par tour): Génère la parole traduite en continu pendant que l'orateur parle, réduisant les pauses gênantes et rendant les conversations plus naturelles.
Détection automatique de plus de 70 langues: Reconnaît et bascule automatiquement entre plus de 70 langues, évitant la configuration manuelle de la langue d'entrée dans les conversations multilingues.
Préserve la prestation et l'expressivité: Conçu pour conserver les aspects de la prestation de l'orateur – intonation, rythme et hauteur – afin que les traductions sonnent plus réalistes et correspondent au ton original.
Robuste au bruit pour les environnements réels: Conçu pour fonctionner dans des environnements bruyants et imprévisibles (par exemple, conversations en déplacement, événements, rues animées) plutôt que dans des pièces calmes uniquement.
Sortie audio filigranée SynthID: Tout l'audio généré inclut un filigrane SynthID imperceptible intégré dans la forme d'onde pour aider à détecter la parole générée par l'IA et réduire les abus.

Cas d'utilisation de Gemini 3.5 Live Translate

Réunions vidéo multilingues (entreprise): Dans Google Meet, permet la traduction vocale en direct dans plus de 70 langues et plus de 2000 combinaisons linguistiques, favorisant une collaboration mondiale plus inclusive.
Voyages et conversations en personne: Dans l'application Google Traduction, prend en charge la traduction en direct via des écouteurs (et le 'mode écoute' Android via l'oreillette) pour une communication plus fluide dans le monde réel.
Support client et centres de contact: Permet aux agents et aux clients de parler naturellement dans différentes langues tout en recevant un audio traduit en continu, améliorant la rapidité et réduisant les malentendus.
Covoiturage et coordination de la mobilité: Permet une communication quasi en temps réel entre le conducteur et le passager lors des prises en charge et pendant les trajets (par exemple, des partenaires comme Grab testent les appels multilingues).
Éducation et formation: Prend en charge l'interprétation en direct pour les leçons, le tutorat et les ateliers, aidant les instructeurs à enseigner à des publics multilingues sans s'arrêter pour une traduction tour par tour.
Diffusion, événements et applications d'interprétation en direct: Via l'API Gemini Live et les plateformes de streaming partenaires (par exemple, LiveKit/Agora), les développeurs peuvent créer des expériences de doublage en temps réel et de traduction multilingue.

Avantages

Conversations plus naturelles grâce à la traduction en streaming continue avec moins de pauses
Large couverture avec détection automatique de plus de 70 langues et gestion des entrées multilingues
Conçu pour les environnements pratiques avec une robustesse au bruit
Le filigrane SynthID améliore la transparence et aide à dissuader l'utilisation abusive de l'audio généré

Inconvénients

La traduction peut encore accuser un retard de quelques secondes par rapport à l'orateur en raison du compromis entre qualité et synchronisation
La disponibilité en entreprise dans Google Meet est initialement limitée (aperçu privé avant un déploiement plus large)
Les prix/coûts supplémentaires n'ont pas été clairement divulgués lors du lancement dans les sources fournies

Comment utiliser Gemini 3.5 Live Translate

1) Choisissez où vous souhaitez utiliser Gemini 3.5 Live Translate: Choisissez la surface qui correspond à vos besoins : (a) l'application Google Traduction (Android/iOS) pour un usage personnel, (b) Google Meet (entreprise/préversion privée) pour les réunions, ou (c) l'API Gemini Live / Google AI Studio (développeur/préversion publique) pour intégrer la traduction en temps réel dans votre propre application.
2) Utilisez-le dans l'application Google Traduction (Android/iOS): Installez/mettez à jour Google Traduction sur Android ou iOS. Ouvrez l'application et sélectionnez l'expérience de traduction en direct / de conversation. Connectez des écouteurs pour une expérience plus fluide ; le modèle diffuse la parole traduite en quasi temps réel dans plus de 70 langues et vise à préserver le ton, le rythme et la hauteur.
3) (Android) Essayez le nouveau mode d'écoute pour une lecture privée: Sur les déploiements Android pris en charge, activez le nouveau mode d'écoute avec 3.5 Live Translate. Tenez votre téléphone à votre oreille comme un appel normal pour entendre l'audio traduit via l'écouteur, utile lorsque vous n'avez pas d'écouteurs et que vous ne voulez pas que d'autres entendent la traduction.
4) Utilisez-le dans Google Meet (entreprise/préversion privée): Si vous êtes un client d'entreprise Google Workspace sélectionné dans la préversion privée, ouvrez Google Meet et démarrez/rejoignez une réunion. Utilisez l'interface Meet mise à jour pour accéder à la traduction vocale. Meet prendra en charge plus de 70 langues et plus de 2000 combinaisons de langues au sein d'une seule réunion (non limité à l'anglais comme pivot).
5) Essayez-le sans coder dans Google AI Studio (développeur/préversion publique): Accédez à l'expérience Live de Google AI Studio et sélectionnez le modèle "gemini-3.5-live-translate-preview". Configurez la session pour une sortie AUDIO et activez la traduction en définissant un code de langue cible. Commencez à diffuser l'audio du microphone ; vous devriez recevoir un audio traduit en continu et (facultativement) des transcriptions d'entrée/sortie.
6) Développez avec l'API Gemini Live (développeur/préversion publique) — configurez les prérequis: Obtenez l'accès à l'API Gemini Live et à une clé API. Décidez de votre pile de streaming (WebSocket ou SDK). Si vous ne voulez pas construire vous-même l'infrastructure multimédia en temps réel, envisagez les plateformes partenaires mentionnées dans les sources (Agora, Fishjam, LiveKit, Pipecat, Vision Agents) qui gèrent l'infrastructure de streaming en temps réel.
7) Créez une session Live et activez la traduction dans la configuration: Connectez-vous à l'API Live en utilisant le modèle "gemini-3.5-live-translate-preview" et définissez un LiveConnectConfig / generationConfig avec : responseModalities=["AUDIO"], inputAudioTranscription activé (facultatif), outputAudioTranscription activé (facultatif), et translationConfig avec targetLanguageCode (par exemple, "pl") et echoTargetLanguage (facultatif).
8) Diffusez l'audio et lisez l'audio traduit (traduction continue): Envoyez les trames/morceaux audio du microphone au fur et à mesure qu'ils sont capturés. Le modèle traite la parole au fur et à mesure qu'elle est diffusée et renvoie l'audio traduit en continu (restant quelques secondes derrière l'orateur). Lisez le flux audio renvoyé à l'auditeur en temps réel ; affichez facultativement les transcriptions d'entrée/sortie si activées.
9) Gérez les entrées multilingues et bruyantes du monde réel: Fiez-vous à la détection automatique de la langue du modèle pour les entrées multilingues (aucun changement manuel de langue requis). Concevez votre UX pour des environnements réels : le bruit de fond, les interruptions et les chevauchements de parole peuvent se produire ; maintenez la capture audio stable et fournissez des indicateurs clairs de qui parle et de la langue de sortie.
10) Validez la sortie et communiquez le filigrane: Sachez que tout l'audio généré par Gemini 3.5 Live Translate est filigrané avec SynthID (filigrane imperceptible intégré à l'audio). Si vous développez un produit, documentez que l'audio traduit est généré par l'IA et inclut un filigrane pour la détectabilité.
11) Utilisez les démos officielles et le code d'exemple pour accélérer le développement: Examinez la démo de l'API Gemini Live de Google et les dépôts d'exemples (par exemple, la démo de traduction en direct basée sur LiveKit et d'autres exemples de l'API Gemini Live) pour copier un pipeline de streaming fonctionnel, puis adaptez-le à l'interface utilisateur et à l'environnement de déploiement de votre application.

FAQ de Gemini 3.5 Live Translate

Gemini 3.5 Live Translate est le dernier modèle audio de Google pour la traduction de la parole en parole en temps quasi réel.

Analyses du site web de Gemini 3.5 Live Translate

Trafic et classements de Gemini 3.5 Live Translate
8.5M
Visites mensuelles
#8357
Classement mondial
#353
Classement par catégorie
Tendances du trafic : Nov 2024-Jun 2025
Aperçu des utilisateurs de Gemini 3.5 Live Translate
00:00:53
Durée moyenne de visite
1.93
Pages par visite
55.03%
Taux de rebond des utilisateurs
Principales régions de Gemini 3.5 Live Translate
  1. US: 26.94%

  2. IN: 8.76%

  3. GB: 5.14%

  4. JP: 4.24%

  5. DE: 3.01%

  6. Others: 51.91%

Derniers outils d'IA similaires à Gemini 3.5 Live Translate

InDesign Translator
InDesign Translator
InDesign Translator est un service de traduction en ligne qui permet aux utilisateurs de traduire des fichiers InDesign tout en maintenant le formatage et les styles, offrant une traduction assistée par IA et des fonctionnalités de collaboration faciles sans nécessiter que les traducteurs aient InDesign installé.
Blanc AI
Blanc AI
Contact for PricingTranslateAI Video Editing
Blanc AI est une solution IA révolutionnaire qui permet la traduction et le doublage de contenu vidéo en plus de 47 langues tout en préservant la voix originale, les émotions et la synchronisation labiale.
MenuGuide
MenuGuide
MenuGuide est une application de pointe alimentée par l'IA qui traduit instantanément les menus de restaurant de n'importe quelle langue vers votre langue préférée, fournissant des détails sur les plats, des informations sur les allergènes et des faits nutritionnels pour des expériences culinaires mondiales sans faille.
Vocabulary AI
Vocabulary AI
Vocabulary AI est une plateforme avancée d'apprentissage des langues alimentée par l'IA qui combine traduction, construction de vocabulaire et pratique personnalisée via le site Web, l'application mobile et l'extension de navigateur pour aider les utilisateurs à apprendre et à retenir efficacement de nouveaux mots.