
Gemini 3.5 Live Translate
Gemini 3.5 即時翻譯是 Google 的低延遲、串流語音到語音翻譯音訊模型,可自動檢測 70 多種語言,並在保留說話者語調、語速和音高的同時,產生流暢、自然的翻譯語音。
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate?ref=producthunt&utm_source=aipure

產品資訊
更新時間:2026年06月12日
Gemini 3.5 Live Translate 每月流量趨勢
Gemini 3.5 Live Translate 在上個月收到了 8.5m 次訪問,呈現出 -12.1% 的輕微下降。根據我們的分析,這個趨勢與人工智能工具領域的典型市場動態相符。
查看歷史流量什麼是 Gemini 3.5 Live Translate
Gemini 3.5 即時翻譯是一個專門的 Gemini 3.5 系列音訊模型,專為在即時對話期間流暢、近乎即時的語音翻譯而建置。它不像典型的「說話、等待、然後翻譯」工具,而是旨在跟上自然對話,並以超過 70 種語言提供逼真的翻譯音訊。Google 正在多個介面推出它:透過 Gemini Live API 和 Google AI Studio 向開發人員提供公開預覽版,向 Google Meet 中的特定企業客戶提供私人預覽版,以及透過 Android 和 iOS 上的 Google 翻譯應用程式向終端使用者提供全球可用性。
Gemini 3.5 Live Translate 的主要功能
Gemini 3.5 即時翻譯是 Google 的低延遲語音轉語音翻譯音訊模型,可提供 70 多種語言的近乎即時翻譯。它能持續翻譯串流音訊(而非輪流翻譯),自動偵測並切換語言而無需手動設定,並旨在保留說話者的語調、語速和音高,同時僅落後幾秒鐘。它設計用於嘈雜的真實環境中,並將透過 Gemini Live API/Google AI Studio 提供給開發人員、Google Meet(企業私人預覽版)以及 Android 和 iOS 上的 Google 翻譯應用程式,並將 SynthID 浮水印應用於生成的音訊以供偵測。
近乎即時的語音轉語音翻譯: 以低延遲將口語直接翻譯成口語輸出,使翻譯僅落後說話者幾秒鐘。
連續串流(非輪流): 在說話者說話時連續生成翻譯語音,減少尷尬的停頓,使對話感覺更自然。
自動偵測 70 多種語言: 自動識別並切換 70 多種語言,避免在多語言對話中手動配置輸入語言。
保留表達方式和表現力: 旨在保留說話者表達方式的各個方面——語調、語速和音高——使翻譯聽起來更逼真並與原始語氣保持一致。
針對真實環境的抗噪能力: 專為在嘈雜和不可預測的環境中(例如,移動中的對話、活動、繁忙的街道)而非僅在安靜的房間中執行而設計。
帶有 SynthID 浮水印的音訊輸出: 所有生成的音訊都包含嵌入在波形中的不可察覺的 SynthID 浮水印,以幫助偵測 AI 生成的語音並減少濫用。
Gemini 3.5 Live Translate 的使用案例
多語言視訊會議(企業): 在 Google Meet 中,支援 70 多種語言和 2000 多種語言組合的即時語音翻譯,促進更具包容性的全球協作。
旅行和面對面交流: 在 Google 翻譯應用程式中,透過耳機(以及 Android 上的「聽力模式」透過聽筒)支援即時翻譯,實現更流暢的真實世界交流。
客戶支援和聯絡中心: 允許客服人員和客戶以不同語言自然對話,同時接收連續翻譯的音訊,提高速度並減少誤解。
叫車和行動協調: 在接送和行程中實現近乎即時的司機與乘客溝通(例如,Grab 等合作夥伴正在測試多語言通話)。
教育和培訓: 支援課程、輔導和研討會的即時口譯,幫助講師在不中斷輪流翻譯的情況下教授多語言受眾。
廣播、活動和即時口譯應用程式: 透過 Gemini Live API 和合作夥伴串流平台(例如 LiveKit/Agora),開發人員可以建立即時配音和多語言翻譯體驗。
優點
由於連續串流翻譯且停頓較少,對話更自然
廣泛覆蓋,自動偵測 70 多種語言並處理多語言輸入
專為具有抗噪能力的實用環境而設計
SynthID 浮水印提高了透明度並有助於阻止濫用生成的音訊
缺點
由於品質與同步之間的權衡,翻譯仍可能落後說話者幾秒鐘
Google Meet 中的企業可用性最初受到限制(在更廣泛推出之前的私人預覽版)
在發布時提供的來源中未明確披露定價/額外費用
如何使用 Gemini 3.5 Live Translate
1) 選擇您想使用 Gemini 3.5 即時翻譯的位置: 選擇符合您需求的介面:(a) Google 翻譯應用程式 (Android/iOS) 用於個人使用,(b) Google Meet (企業/私人預覽版) 用於會議,或 (c) Gemini Live API / Google AI Studio (開發人員/公開預覽版) 將即時翻譯建置到您自己的應用程式中。
2) 在 Google 翻譯應用程式 (Android/iOS) 中使用它: 在 Android 或 iOS 上安裝/更新 Google 翻譯。開啟應用程式並選擇即時翻譯/對話式即時翻譯體驗。連接耳機以獲得最流暢的體驗;該模型以近乎即時的方式串流翻譯語音,支援 70 多種語言,並旨在保留語氣、語速和音高。
3) (Android) 試用新的聆聽模式以進行私人播放: 在支援的 Android 版本上,啟用帶有 3.5 即時翻譯的新聆聽模式。像普通通話一樣將手機貼在耳朵上,透過聽筒聽到翻譯後的音訊——這在您沒有耳機且不希望其他人聽到翻譯時很有用。
4) 在 Google Meet (企業/私人預覽版) 中使用它: 如果您是私人預覽版中選定的 Google Workspace 企業客戶,請開啟 Google Meet 並開始/加入會議。使用更新後的 Meet 介面存取語音翻譯。Meet 將在單次會議中支援 70 多種語言和 2000 多種語言組合(不限於英語作為樞紐語言)。
5) 在 Google AI Studio (開發人員/公開預覽版) 中無需編碼即可試用: 前往 Google AI Studio 的即時體驗並選擇模型 "gemini-3.5-live-translate-preview"。將會話配置為 AUDIO 輸出,並透過設定目標語言代碼來啟用翻譯。開始串流麥克風音訊;您應該會收到連續的翻譯音訊和(可選)輸入/輸出轉錄。
6) 使用 Gemini Live API (開發人員/公開預覽版) 進行建置 — 設定先決條件: 取得 Gemini Live API 和 API 金鑰的存取權。決定您的串流堆疊 (WebSocket 或 SDK)。如果您不想自己建置即時媒體管道,請考慮來源中提到的合作夥伴平台 (Agora、Fishjam、LiveKit、Pipecat、Vision Agents),它們處理即時串流基礎設施。
7) 建立即時會話並在配置中啟用翻譯: 使用模型 "gemini-3.5-live-translate-preview" 連接到 Live API,並使用以下內容設定 LiveConnectConfig / generationConfig:responseModalities=["AUDIO"],啟用 inputAudioTranscription (可選),啟用 outputAudioTranscription (可選),以及帶有 targetLanguageCode (例如 "pl") 和 echoTargetLanguage (可選) 的 translationConfig。
8) 串流音訊輸入並播放翻譯音訊輸出 (連續翻譯): 在麥克風捕捉到音訊幀/塊時發送它們。模型在串流時處理語音並連續返回翻譯音訊(比說話者慢幾秒)。將返回的音訊串流即時播放給聽眾;如果啟用,可選地顯示輸入/輸出轉錄。
9) 處理多語言和嘈雜的真實世界輸入: 依賴模型的自動語言檢測來處理多語言輸入(無需手動語言切換)。為真實環境設計您的使用者體驗:可能會出現背景噪音、中斷和語音重疊;保持音訊捕捉穩定,並提供清晰的指示,說明誰在說話以及正在輸出哪種語言。
10) 驗證輸出並傳達浮水印: 請注意,Gemini 3.5 即時翻譯生成的所有音訊都帶有 SynthID 浮水印(嵌入在音訊中的不可察覺浮水印)。如果您正在建置產品,請記錄翻譯後的音訊是 AI 生成的,並包含用於檢測的浮水印。
11) 使用官方演示和範例程式碼加速開發: 查看 Google 的 Gemini Live API 演示和範例儲存庫(例如,基於 LiveKit 的即時翻譯演示和其他 Gemini Live API 範例),以複製一個可運行的串流管道,然後將其調整到您的應用程式的 UI 和部署環境。
Gemini 3.5 Live Translate 常見問題
Gemini 3.5 即時翻譯是 Google 最新的音訊模型,用於近乎即時的語音對語音翻譯。
Gemini 3.5 Live Translate 網站分析
Gemini 3.5 Live Translate 流量和排名
8.5M
每月訪問量
#8357
全球排名
#353
類別排名
流量趨勢:Nov 2024-Jun 2025
Gemini 3.5 Live Translate 用戶洞察
00:00:53
平均訪問時長
1.93
每次訪問的頁面數
55.03%
用戶跳出率
Gemini 3.5 Live Translate 的主要地區
US: 26.94%
IN: 8.76%
GB: 5.14%
JP: 4.24%
DE: 3.01%
Others: 51.91%











