Wie viele Sprachen unterstützt Gemini 3.5 Live Translate?

Es erkennt und übersetzt automatisch über 70 Sprachen.

Übersetzt es erst, nachdem jemand zu Ende gesprochen hat (turn-by-turn)?

Nein. Es generiert kontinuierlich übersetzte Sprache, während der Sprecher spricht, und versucht, nur wenige Sekunden zurückzuliegen, während es Latenz und Übersetzungsqualität ausbalanciert.

Behält es die Stimmcharakteristiken des Sprechers bei?

Es erzeugt natürlich klingende übersetzte Sprache, die die Intonation, das Tempo und die Tonhöhe des Sprechers beibehält.

Wo ist Gemini 3.5 Live Translate verfügbar?

Es wird über die Gemini Live API und Google AI Studio für Entwickler (öffentliche Vorschau), in Google Meet für Unternehmen (private Vorschau ab diesem Monat) und in der Google Translate App auf Android und iOS für alle eingeführt.

Können Entwickler damit Echtzeit-Übersetzungs-Apps erstellen und welche Tools stehen zur Verfügung?

Ja. Entwickler können es über die Gemini Live API nutzen, und Google stellt Demos und Beispielcode zur Verfügung (z. B. im Repository gemini-live-api-examples, einschließlich einer LiveKit-basierten Live-Translate-Demo).

Erfordert es eine manuelle Sprachkonfiguration?

Nein. Das Modell verarbeitet mehrsprachige Eingaben und erkennt Sprachen automatisch, ohne dass eine manuelle Konfiguration erforderlich ist.

Wie geht Google mit der Sicherheit und Erkennbarkeit von generierten Audiodaten um?

Von dem Modell generierte Audiodaten werden mit SynthID, einem unmerklichen Wasserzeichen, das in die Audiodaten eingebettet ist, versehen, um die Erkennbarkeit von KI-generierten Inhalten zu gewährleisten.

Gemini 3.5 Live Translate

WebsiteAppFree TrialTranslate AI Voice Chat Generator

Gemini 3.5 Live Translate ist Googles Audio-Modell für die Sprach-zu-Sprach-Übersetzung mit geringer Latenz und Streaming, das über 70 Sprachen automatisch erkennt und eine flüssige, natürlich klingende übersetzte Sprache erzeugt, während die Intonation, das Tempo und die Tonhöhe des Sprechers erhalten bleiben.

Website besuchen

Dieses Tool bewerben

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate?ref=producthunt&utm_source=aipure

Überblick
Analyse
Video
Alternativen

Produktinformationen

Aktualisiert:Jun 15, 2026

Gemini 3.5 Live Translate Monatliche Traffic-Trends

Gemini 3.5 Live Translate erhielt im letzten Monat 8.5m Besuche, was ein Leichter Rückgang von -12.1% zeigt. Basierend auf unserer Analyse entspricht dieser Trend der typischen Marktdynamik im Bereich der KI-Tools.

Verlaufsdaten anzeigen

Was ist Gemini 3.5 Live Translate

Gemini 3.5 Live Translate ist ein spezialisiertes Gemini 3.5-Familien-Audiomodell, das für flüssige, nahezu echtzeitnahe Sprachübersetzung während Live-Gesprächen entwickelt wurde. Anstatt sich wie ein typisches „Sprechen, warten, dann übersetzen“-Tool anzufühlen, ist es darauf ausgelegt, mit natürlichem Dialog Schritt zu halten und lebensechte übersetzte Audios in über 70 Sprachen zu liefern. Google führt es auf mehreren Oberflächen ein: eine öffentliche Vorschau für Entwickler über die Gemini Live API und Google AI Studio, eine private Vorschau für ausgewählte Unternehmenskunden in Google Meet und globale Verfügbarkeit für Endbenutzer über die Google Translate App auf Android und iOS.

Hauptfunktionen von Gemini 3.5 Live Translate

Gemini 3.5 Live Translate ist Googles Audio-Modell für latenzarme Sprach-zu-Sprach-Übersetzung, das eine nahezu Echtzeit-Übersetzung in über 70 Sprachen liefert. Es übersetzt kontinuierlich Streaming-Audio (anstatt abwechselnd), erkennt und wechselt Sprachen automatisch ohne manuelle Konfiguration und zielt darauf ab, die Intonation, das Tempo und die Tonhöhe des Sprechers beizubehalten, während es nur wenige Sekunden hinterherhinkt. Es wurde entwickelt, um in lauten, realen Umgebungen zu funktionieren und wird über die Gemini Live API/Google AI Studio für Entwickler, Google Meet (private Vorschau für Unternehmen) und die Google Translate App auf Android und iOS eingeführt, wobei SynthID-Wasserzeichen auf generiertes Audio zur Erkennbarkeit angewendet werden.

Nahezu Echtzeit-Sprach-zu-Sprach-Übersetzung: Übersetzt gesprochene Sprache direkt in gesprochene Ausgabe mit geringer Latenz, wobei die Übersetzung nur wenige Sekunden hinter dem Sprecher bleibt.

Kontinuierliches Streaming (nicht abwechselnd): Erzeugt kontinuierlich übersetzte Sprache, während der Sprecher spricht, wodurch unangenehme Pausen reduziert und Gespräche natürlicher wirken.

Automatische Erkennung von über 70 Sprachen: Erkennt und wechselt automatisch zwischen mehr als 70 Sprachen, wodurch eine manuelle Eingabesprachenkonfiguration in mehrsprachigen Gesprächen vermieden wird.

Bewahrt Vortrag und Ausdruckskraft: Entwickelt, um Aspekte des Vortrags des Sprechers – Intonation, Tempo und Tonhöhe – beizubehalten, damit Übersetzungen lebensechter und dem Originalton entsprechend klingen.

Geräuschrobust für reale Umgebungen: Gebaut, um in lauten und unvorhersehbaren Umgebungen (z. B. unterwegs, bei Veranstaltungen, auf belebten Straßen) zu funktionieren und nicht nur in ruhigen Räumen.

SynthID-wasserzeichengeschützte Audioausgabe: Alle generierten Audios enthalten ein unmerkliches SynthID-Wasserzeichen, das in die Wellenform eingebettet ist, um KI-generierte Sprache zu erkennen und Missbrauch zu reduzieren.

Anwendungsfälle von Gemini 3.5 Live Translate

Mehrsprachige Videokonferenzen (Unternehmen): In Google Meet ermöglicht es die Live-Sprachübersetzung in über 70 Sprachen und mehr als 2000 Sprachkombinationen und unterstützt eine inklusivere globale Zusammenarbeit.

Reisen und persönliche Gespräche: In der Google Translate App unterstützt es die Live-Übersetzung über Kopfhörer (und den Android-„Hör-Modus“ über den Ohrhörer) für eine nahtlosere Kommunikation in der realen Welt.

Kundensupport und Contact Center: Ermöglicht Agenten und Kunden, natürlich in verschiedenen Sprachen zu sprechen, während sie kontinuierlich übersetztes Audio erhalten, was die Geschwindigkeit verbessert und Missverständnisse reduziert.

Fahrdienste und Mobilitätskoordination: Ermöglicht nahezu Echtzeit-Kommunikation zwischen Fahrer und Passagier bei Abholungen und während der Fahrt (z. B. Partner wie Grab testen dies für mehrsprachige Anrufe).

Bildung und Training: Unterstützt die Live-Interpretation für Unterricht, Nachhilfe und Workshops und hilft Lehrern, mehrsprachige Zielgruppen zu unterrichten, ohne für die abwechselnde Übersetzung anhalten zu müssen.

Rundfunk, Veranstaltungen und Live-Dolmetscher-Apps: Über die Gemini Live API und Partner-Streaming-Plattformen (z. B. LiveKit/Agora) können Entwickler Echtzeit-Synchronisation und mehrsprachige Übersetzungserlebnisse erstellen.

Vorteile

Natürlichere Gespräche durch kontinuierliche Streaming-Übersetzung mit weniger Pausen

Breite Abdeckung mit automatischer Erkennung von über 70 Sprachen und mehrsprachiger Eingabeverarbeitung

Entwickelt für praktische Umgebungen mit Geräuschrobustheit

SynthID-Wasserzeichen verbessert die Transparenz und hilft, den Missbrauch von generiertem Audio zu verhindern

Nachteile

Die Übersetzung kann aufgrund des Kompromisses zwischen Qualität und Synchronisation immer noch einige Sekunden hinter dem Sprecher zurückbleiben

Die Verfügbarkeit für Unternehmen in Google Meet ist zunächst begrenzt (private Vorschau vor breiterer Einführung)

Preise/zusätzliche Kosten wurden zum Start in den bereitgestellten Quellen nicht klar offengelegt

Wie verwendet man Gemini 3.5 Live Translate

1) Wählen Sie, wo Sie Gemini 3.5 Live Translate verwenden möchten: Wählen Sie die Oberfläche, die Ihren Anforderungen entspricht: (a) Google Translate App (Android/iOS) für den persönlichen Gebrauch, (b) Google Meet (Unternehmen/private Vorschau) für Besprechungen oder (c) Gemini Live API / Google AI Studio (Entwickler/öffentliche Vorschau), um Echtzeit-Übersetzung in Ihre eigene App zu integrieren.

2) Verwenden Sie es in der Google Translate App (Android/iOS): Installieren/aktualisieren Sie Google Translate auf Android oder iOS. Öffnen Sie die App und wählen Sie die Live-Übersetzungs- / Konversations-Live-Übersetzungserfahrung. Schließen Sie Kopfhörer an, um das nahtloseste Erlebnis zu erzielen; das Modell streamt übersetzte Sprache nahezu in Echtzeit in über 70 Sprachen und zielt darauf ab, Ton, Tempo und Tonhöhe zu bewahren.

3) (Android) Probieren Sie den neuen Hörmodus für die private Wiedergabe aus: Aktivieren Sie bei unterstützten Android-Rollouts den neuen Hörmodus mit 3.5 Live Translate. Halten Sie Ihr Telefon wie bei einem normalen Anruf an Ihr Ohr, um das übersetzte Audio über den Ohrhörer zu hören – nützlich, wenn Sie keine Kopfhörer haben und andere die Übersetzung nicht hören sollen.

4) Verwenden Sie es in Google Meet (Unternehmen/private Vorschau): Wenn Sie ein ausgewählter Google Workspace-Geschäftskunde in der privaten Vorschau sind, öffnen Sie Google Meet und starten/treten Sie einer Besprechung bei. Verwenden Sie die aktualisierte Meet-Oberfläche, um auf die Sprachübersetzung zuzugreifen. Meet unterstützt über 70 Sprachen und über 2000 Sprachkombinationen innerhalb einer einzigen Besprechung (nicht auf Englisch als Pivot beschränkt).

5) Probieren Sie es ohne Codierung in Google AI Studio aus (Entwickler/öffentliche Vorschau): Gehen Sie zur Live-Erfahrung von Google AI Studio und wählen Sie das Modell „gemini-3.5-live-translate-preview“. Konfigurieren Sie die Sitzung für AUDIO-Ausgabe und aktivieren Sie die Übersetzung, indem Sie einen Zielsprachcode festlegen. Beginnen Sie mit dem Streamen von Mikrofon-Audio; Sie sollten kontinuierlich übersetztes Audio und (optional) Eingabe-/Ausgabe-Transkriptionen erhalten.

6) Entwickeln Sie mit der Gemini Live API (Entwickler/öffentliche Vorschau) – richten Sie die Voraussetzungen ein: Erhalten Sie Zugriff auf die Gemini Live API und einen API-Schlüssel. Entscheiden Sie sich für Ihren Streaming-Stack (WebSocket oder SDK). Wenn Sie die Echtzeit-Medieninfrastruktur nicht selbst aufbauen möchten, ziehen Sie Partnerplattformen in Betracht, die in den Quellen erwähnt werden (Agora, Fishjam, LiveKit, Pipecat, Vision Agents), die die Echtzeit-Streaming-Infrastruktur verwalten.

7) Erstellen Sie eine Live-Sitzung und aktivieren Sie die Übersetzung in der Konfiguration: Verbinden Sie sich mit der Live API mit dem Modell „gemini-3.5-live-translate-preview“ und legen Sie eine LiveConnectConfig / generationConfig fest mit: responseModalities=["AUDIO"], inputAudioTranscription aktiviert (optional), outputAudioTranscription aktiviert (optional) und translationConfig mit targetLanguageCode (z. B. „pl“) und echoTargetLanguage (optional).

8) Audio einstreamen und übersetztes Audio ausgeben (kontinuierliche Übersetzung): Senden Sie Mikrofon-Audioframes/-chunks, sobald sie erfasst werden. Das Modell verarbeitet Sprache, während sie gestreamt wird, und gibt kontinuierlich übersetztes Audio zurück (bleibt einige Sekunden hinter dem Sprecher zurück). Spielen Sie den zurückgegebenen Audiostream in Echtzeit an den Zuhörer ab; zeigen Sie optional Eingabe-/Ausgabe-Transkriptionen an, falls aktiviert.

9) Umgang mit mehrsprachigen und lauten realen Eingaben: Verlassen Sie sich auf die automatische Spracherkennung des Modells für mehrsprachige Eingaben (keine manuelle Sprachumschaltung erforderlich). Gestalten Sie Ihre UX für reale Umgebungen: Hintergrundgeräusche, Unterbrechungen und überlappende Sprache können auftreten; halten Sie die Audioaufnahme stabil und geben Sie klare Hinweise darauf, wer spricht und welche Sprache ausgegeben wird.

10) Ausgabe validieren und Wasserzeichen kommunizieren: Beachten Sie, dass alle von Gemini 3.5 Live Translate generierten Audios mit SynthID (einem unmerklichen Wasserzeichen, das in das Audio eingebettet ist) versehen sind. Wenn Sie ein Produkt entwickeln, dokumentieren Sie, dass übersetztes Audio KI-generiert ist und Wasserzeichen zur Erkennbarkeit enthält.

11) Verwenden Sie offizielle Demos und Beispielcode, um die Entwicklung zu beschleunigen: Überprüfen Sie die Gemini Live API-Demo und die Beispiel-Repositories von Google (z. B. die LiveKit-basierte Live-Übersetzungs-Demo und andere Gemini Live API-Beispiele), um eine funktionierende Streaming-Pipeline zu kopieren und sie dann an die Benutzeroberfläche und die Bereitstellungsumgebung Ihrer App anzupassen.

Gemini 3.5 Live Translate FAQs

Gemini 3.5 Live Translate ist Googles neuestes Audiomodell für nahezu echtzeitnahe Sprach-zu-Sprach-Übersetzung.

Gemini 3.5 Live Translate Video

Beliebte Artikel

Atoms: Eine Multi-Agenten-KI-Plattform, die Ideen in startbereite Produkte verwandelt

May 22, 2026

Nano Banana SBTI: Was es ist, wie es funktioniert und wie man es im Jahr 2026 einsetzt

Apr 15, 2026

Atoms Review – Der KI-Produkt-Builder, der die digitale Erstellung im Jahr 2026 neu definiert

Apr 10, 2026

Kilo Claw: Wie man einen echten "Do-It-For-You" KI-Agenten bereitstellt und verwendet (2026 Update)

Apr 3, 2026

Analyse der Gemini 3.5 Live Translate Website

Gemini 3.5 Live Translate Traffic & Rankings

8.5M

Monatliche Besuche

#8357

Globaler Rang

#353

Kategorie-Rang

Traffic-Trends: Nov 2024-Jun 2025

Gemini 3.5 Live Translate Nutzereinblicke

00:00:53

Durchschn. Besuchsdauer

1.93

Seiten pro Besuch

55.03%

Nutzer-Absprungrate

Top-Regionen von Gemini 3.5 Live Translate

US: 26.94%

IN: 8.76%

GB: 5.14%

JP: 4.24%

DE: 3.01%

Others: 51.91%

Neueste KI-Tools ähnlich wie Gemini 3.5 Live Translate

InDesign Translator

Free TrialTranslate AI Documents Assistant

InDesign Translator ist ein Online-Übersetzungsdienst, der es Benutzern ermöglicht, InDesign-Dateien zu übersetzen, während Formatierungen und Stile beibehalten werden. Er bietet KI-unterstützte Übersetzungen und einfache Funktionen zur Zusammenarbeit, ohne dass Übersetzer InDesign installiert haben müssen.

Blanc AI

Contact for PricingTranslate AI Video Editing

Blanc AI ist eine revolutionäre KI-Lösung, die die Übersetzung und Synchronisation von Videoinhalten in über 47 Sprachen ermöglicht und dabei die ursprüngliche Stimme, Emotionen und Lippen-Synchronisation bewahrt.

MenuGuide

FreemiumTranslate AI Cooking Assistant

MenuGuide ist eine hochmoderne, KI-gestützte App, die Restaurantmenüs sofort aus jeder Sprache in Ihre bevorzugte Sprache übersetzt und Gerätedetails, Allergeninformationen und Nährwertangaben für nahtlose globale Esserlebnisse bereitstellt.

Vocabulary AI

Free TrialTranslate AI Education Assistant

Vocabulary AI ist eine fortschrittliche KI-gestützte Sprachlernplattform, die Übersetzung, Vokabelaufbau und personalisiertes Üben durch Website, mobile App und Browsererweiterung kombiniert, um den Nutzern zu helfen, neue Wörter effektiv zu lernen und zu behalten.

Beliebte KI-Tools wie Gemini 3.5 Live Translate

ChatGPT Translate

FreeTranslate

ChatGPT Translate ist der dedizierte Übersetzungsdienst von OpenAI, der über 50 Sprachen mit KI-gestützten Anpassungsfunktionen unterstützt, um natürliche, kontextbezogene Übersetzungen in verschiedenen Tönen und Stilen zu erstellen.

RSTGameTranslation

FreeTranslate AI Speech Recognition

RSTGameTranslation ist ein Open-Source-Echtzeit-Spielübersetzungstool, das OCR- und KI-Übersetzungstechnologien kombiniert, um Spieltext automatisch in mehrere Sprachen zu übersetzen und gleichzeitig sowohl Offline- als auch Online-Modi zu unterstützen.

DeepL

FreemiumTranslate

DeepL ist ein KI-gestützter Übersetzungsdienst, der schnelle, genaue und nuancierte Übersetzungen in 33 Sprachen mithilfe fortschrittlicher neuronaler Netzwerktechnologie bereitstellt.

Duory

Free TrialTranslate AI Notes Assistant

Duory ist eine dynamische Sprachlern-App, die Duolingo-Benutzern hilft, ihre Lektionen durch interaktive Notizen, Übersetzungsfunktionen und Sprachaufzeichnungsfunktionen zu verstärken.

Rangliste

Einreichen & BewerbenNew

Gemini 3.5 Live Translate

Produktinformationen

Gemini 3.5 Live Translate Monatliche Traffic-Trends

Was ist Gemini 3.5 Live Translate

Hauptfunktionen von Gemini 3.5 Live Translate

Anwendungsfälle von Gemini 3.5 Live Translate

Vorteile

Nachteile

Wie verwendet man Gemini 3.5 Live Translate

Gemini 3.5 Live Translate FAQs

1. Was ist Gemini 3.5 Live Translate?

2. Wie viele Sprachen unterstützt Gemini 3.5 Live Translate?

3. Übersetzt es erst, nachdem jemand zu Ende gesprochen hat (turn-by-turn)?

4. Behält es die Stimmcharakteristiken des Sprechers bei?

5. Wo ist Gemini 3.5 Live Translate verfügbar?

6. Können Entwickler damit Echtzeit-Übersetzungs-Apps erstellen und welche Tools stehen zur Verfügung?

7. Erfordert es eine manuelle Sprachkonfiguration?

8. Wie geht Google mit der Sicherheit und Erkennbarkeit von generierten Audiodaten um?

Gemini 3.5 Live Translate Video

Beliebte Artikel

Analyse der Gemini 3.5 Live Translate Website

Neueste KI-Tools ähnlich wie Gemini 3.5 Live Translate

Beliebte KI-Tools wie Gemini 3.5 Live Translate