Gemini 3.5 Live Translate

Gemini 3.5 Live Translate

Gemini 3.5 Live Translate adalah model audio terjemahan ucapan-ke-ucapan streaming latensi rendah dari Google yang secara otomatis mendeteksi lebih dari 70 bahasa dan menghasilkan ucapan terjemahan yang lancar dan terdengar alami sambil mempertahankan intonasi, kecepatan, dan tinggi nada pembicara.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate?ref=producthunt&utm_source=aipure
Gemini 3.5 Live Translate

Informasi Produk

Diperbarui:Jun 12, 2026

Tren Traffic Bulanan Gemini 3.5 Live Translate

Gemini 3.5 Live Translate menerima 8.5m kunjungan bulan lalu, menunjukkan Penurunan Sedikit sebesar -12.1%. Berdasarkan analisis kami, tren ini sejalan dengan dinamika pasar yang umum di sektor alat AI.
Lihat riwayat traffic

Apa itu Gemini 3.5 Live Translate

Gemini 3.5 Live Translate adalah model audio khusus keluarga Gemini 3.5 yang dibangun untuk terjemahan suara yang lancar dan mendekati real-time selama percakapan langsung. Alih-alih terasa seperti alat 'bicara, tunggu, lalu terjemahkan' yang khas, ini dirancang untuk mengikuti dialog alami dan menghasilkan audio terjemahan yang hidup di lebih dari 70 bahasa. Google meluncurkannya di berbagai platform: pratinjau publik untuk developer melalui Gemini Live API dan Google AI Studio, pratinjau pribadi untuk pelanggan perusahaan tertentu di Google Meet, dan ketersediaan global untuk pengguna akhir melalui aplikasi Google Terjemahan di Android dan iOS.

Fitur Utama Gemini 3.5 Live Translate

Gemini 3.5 Live Translate adalah model audio terjemahan ucapan-ke-ucapan latensi rendah dari Google yang menghadirkan terjemahan mendekati waktu nyata di lebih dari 70 bahasa. Model ini terus-menerus menerjemahkan audio streaming (bukan secara bergantian), secara otomatis mendeteksi dan beralih bahasa tanpa konfigurasi manual, dan bertujuan untuk mempertahankan intonasi, kecepatan, dan nada bicara pembicara sambil hanya tertinggal beberapa detik. Model ini dirancang untuk bekerja di lingkungan dunia nyata yang bising dan diluncurkan di Gemini Live API/Google AI Studio untuk pengembang, Google Meet (pratinjau pribadi untuk perusahaan), dan aplikasi Google Translate di Android dan iOS, dengan penandaan air SynthID diterapkan pada audio yang dihasilkan untuk deteksi.
Terjemahan ucapan-ke-ucapan mendekati waktu nyata: Menerjemahkan bahasa lisan langsung ke keluaran lisan dengan latensi rendah, menjaga terjemahan hanya beberapa detik di belakang pembicara.
Streaming berkelanjutan (bukan bergantian): Menghasilkan ucapan terjemahan secara berkelanjutan saat pembicara berbicara, mengurangi jeda yang canggung dan membuat percakapan terasa lebih alami.
Deteksi otomatis 70+ bahasa: Mengenali dan beralih antara lebih dari 70 bahasa secara otomatis, menghindari konfigurasi bahasa masukan manual dalam percakapan multibahasa.
Mempertahankan penyampaian dan ekspresivitas: Dirancang untuk mempertahankan aspek penyampaian pembicara—intonasi, kecepatan, dan nada—sehingga terjemahan terdengar lebih hidup dan selaras dengan nada asli.
Tahan bising untuk pengaturan dunia nyata: Dibangun untuk bekerja di lingkungan yang bising dan tidak terduga (misalnya, percakapan saat bepergian, acara, jalanan yang ramai) daripada hanya di ruangan yang tenang.
Keluaran audio ber-watermark SynthID: Semua audio yang dihasilkan menyertakan watermark SynthID yang tidak terlihat yang tertanam dalam bentuk gelombang untuk membantu mendeteksi ucapan yang dihasilkan AI dan mengurangi penyalahgunaan.

Kasus Penggunaan Gemini 3.5 Live Translate

Rapat video multibahasa (perusahaan): Di Google Meet, memungkinkan terjemahan ucapan langsung di lebih dari 70 bahasa dan 2000+ kombinasi bahasa, mendukung kolaborasi global yang lebih inklusif.
Perjalanan dan percakapan tatap muka: Di aplikasi Google Translate, mendukung terjemahan langsung melalui headphone (dan 'mode mendengarkan' Android melalui earpiece) untuk komunikasi dunia nyata yang lebih lancar.
Dukungan pelanggan dan pusat kontak: Memungkinkan agen dan pelanggan untuk berbicara secara alami dalam berbagai bahasa sambil menerima audio terjemahan berkelanjutan, meningkatkan kecepatan dan mengurangi kesalahpahaman.
Penyedia layanan transportasi dan koordinasi mobilitas: Memungkinkan komunikasi pengemudi-penumpang mendekati waktu nyata saat penjemputan dan selama perjalanan (misalnya, mitra seperti Grab menguji untuk panggilan multibahasa).
Pendidikan dan pelatihan: Mendukung interpretasi langsung untuk pelajaran, bimbingan belajar, dan lokakarya, membantu instruktur mengajar audiens multibahasa tanpa berhenti untuk terjemahan berbasis giliran.
Aplikasi siaran, acara, dan interpretasi langsung: Melalui Gemini Live API dan platform streaming mitra (misalnya, LiveKit/Agora), pengembang dapat membangun pengalaman dubbing waktu nyata dan terjemahan multibahasa.

Kelebihan

Percakapan yang lebih alami karena terjemahan streaming berkelanjutan dengan lebih sedikit jeda
Cakupan luas dengan deteksi otomatis 70+ bahasa dan penanganan masukan multibahasa
Dirancang untuk lingkungan praktis dengan ketahanan terhadap kebisingan
Penandaan air SynthID meningkatkan transparansi dan membantu mencegah penyalahgunaan audio yang dihasilkan

Kekurangan

Terjemahan masih dapat tertinggal beberapa detik di belakang pembicara karena pertukaran kualitas vs. sinkronisasi
Ketersediaan perusahaan di Google Meet awalnya terbatas (pratinjau pribadi sebelum peluncuran yang lebih luas)
Harga/biaya tambahan tidak diungkapkan dengan jelas pada saat peluncuran di sumber yang disediakan

Cara Menggunakan Gemini 3.5 Live Translate

1) Pilih tempat Anda ingin menggunakan Gemini 3.5 Live Translate: Pilih platform yang sesuai dengan kebutuhan Anda: (a) aplikasi Google Terjemahan (Android/iOS) untuk penggunaan pribadi, (b) Google Meet (pratinjau perusahaan/pribadi) untuk rapat, atau (c) Gemini Live API / Google AI Studio (pratinjau developer/publik) untuk membangun terjemahan real-time ke dalam aplikasi Anda sendiri.
2) Gunakan di aplikasi Google Terjemahan (Android/iOS): Instal/perbarui Google Terjemahan di Android atau iOS. Buka aplikasi dan pilih pengalaman terjemahan langsung / terjemahan langsung gaya percakapan. Sambungkan headphone untuk pengalaman yang paling mulus; model ini mengalirkan ucapan terjemahan dalam waktu mendekati real-time di lebih dari 70 bahasa dan bertujuan untuk mempertahankan nada, kecepatan, dan tinggi nada.
3) (Android) Coba Mode Mendengarkan baru untuk pemutaran pribadi: Pada peluncuran Android yang didukung, aktifkan Mode Mendengarkan baru dengan 3.5 Live Translate. Dekatkan ponsel ke telinga Anda seperti panggilan biasa untuk mendengar audio terjemahan melalui lubang suara—berguna saat Anda tidak memiliki headphone dan tidak ingin orang lain mendengar terjemahan.
4) Gunakan di Google Meet (pratinjau perusahaan/pribadi): Jika Anda adalah pelanggan bisnis Google Workspace tertentu dalam pratinjau pribadi, buka Google Meet dan mulai/bergabung dalam rapat. Gunakan antarmuka Meet yang diperbarui untuk mengakses terjemahan Ucapan. Meet akan mendukung lebih dari 70 bahasa dan lebih dari 2000 kombinasi bahasa dalam satu rapat (tidak terbatas pada bahasa Inggris sebagai pivot).
5) Cobalah tanpa pengkodean di Google AI Studio (pratinjau developer/publik): Buka pengalaman Langsung Google AI Studio dan pilih model "gemini-3.5-live-translate-preview". Konfigurasikan sesi untuk output AUDIO dan aktifkan terjemahan dengan mengatur kode bahasa target. Mulai streaming audio mikrofon; Anda akan menerima audio terjemahan berkelanjutan dan (opsional) transkripsi input/output.
6) Bangun dengan Gemini Live API (pratinjau developer/publik) — siapkan prasyarat: Dapatkan akses ke Gemini Live API dan kunci API. Tentukan tumpukan streaming Anda (WebSocket atau SDK). Jika Anda tidak ingin membangun pipa media real-time sendiri, pertimbangkan platform mitra yang disebutkan dalam sumber (Agora, Fishjam, LiveKit, Pipecat, Vision Agents) yang menangani infrastruktur streaming real-time.
7) Buat sesi Langsung dan aktifkan terjemahan dalam konfigurasi: Sambungkan ke Live API menggunakan model "gemini-3.5-live-translate-preview" dan atur LiveConnectConfig / generationConfig dengan: responseModalities=["AUDIO"], inputAudioTranscription diaktifkan (opsional), outputAudioTranscription diaktifkan (opsional), dan translationConfig dengan targetLanguageCode (misalnya, "pl") dan echoTargetLanguage (opsional).
8) Streaming audio masuk dan putar audio terjemahan keluar (terjemahan berkelanjutan): Kirim bingkai/potongan audio mikrofon saat ditangkap. Model memproses ucapan saat dialirkan dan mengembalikan audio terjemahan secara berkelanjutan (tetap beberapa detik di belakang pembicara). Putar aliran audio yang dikembalikan ke pendengar secara real time; secara opsional tampilkan transkripsi input/output jika diaktifkan.
9) Tangani input multibahasa dan berisik di dunia nyata: Andalkan deteksi bahasa otomatis model untuk input multibahasa (tidak diperlukan pergantian bahasa manual). Rancang UX Anda untuk lingkungan nyata: kebisingan latar belakang, gangguan, dan ucapan yang tumpang tindih dapat terjadi; jaga agar pengambilan audio stabil dan berikan indikator yang jelas tentang siapa yang berbicara dan bahasa apa yang dikeluarkan.
10) Validasi output dan komunikasikan watermarking: Perlu diketahui bahwa semua audio yang dihasilkan oleh Gemini 3.5 Live Translate diberi watermark dengan SynthID (watermark tak terlihat yang tertanam dalam audio). Jika Anda membangun produk, dokumentasikan bahwa audio terjemahan dihasilkan oleh AI dan menyertakan watermark untuk deteksi.
11) Gunakan demo resmi dan contoh kode untuk mempercepat pengembangan: Tinjau demo Gemini Live API Google dan repositori contoh (misalnya, demo terjemahan langsung berbasis LiveKit dan contoh Gemini Live API lainnya) untuk menyalin pipeline streaming yang berfungsi, lalu sesuaikan dengan UI aplikasi dan lingkungan deployment Anda.

FAQ Gemini 3.5 Live Translate

Gemini 3.5 Live Translate adalah model audio terbaru Google untuk terjemahan ucapan-ke-ucapan mendekati waktu nyata.

Analitik Situs Web Gemini 3.5 Live Translate

Lalu Lintas & Peringkat Gemini 3.5 Live Translate
8.5M
Kunjungan Bulanan
#8357
Peringkat Global
#353
Peringkat Kategori
Tren Lalu Lintas: Nov 2024-Jun 2025
Wawasan Pengguna Gemini 3.5 Live Translate
00:00:53
Rata-rata Durasi Kunjungan
1.93
Halaman Per Kunjungan
55.03%
Tingkat Pentalan Pengguna
Wilayah Teratas Gemini 3.5 Live Translate
  1. US: 26.94%

  2. IN: 8.76%

  3. GB: 5.14%

  4. JP: 4.24%

  5. DE: 3.01%

  6. Others: 51.91%

Alat AI Terbaru Serupa dengan Gemini 3.5 Live Translate

InDesign Translator
InDesign Translator
InDesign Translator adalah layanan terjemahan online yang memungkinkan pengguna menerjemahkan file InDesign sambil mempertahankan format dan gaya, menawarkan terjemahan yang dibantu AI dan fitur kolaborasi yang mudah tanpa memerlukan penerjemah untuk menginstal InDesign.
Blanc AI
Blanc AI
Contact for PricingTranslateAI Video Editing
Blanc AI adalah solusi AI revolusioner yang memungkinkan terjemahan dan pengalihan suara konten video ke dalam lebih dari 47 bahasa sambil mempertahankan suara asli, emosi, dan sinkronisasi bibir.
MenuGuide
MenuGuide
MenuGuide adalah aplikasi canggih bertenaga AI yang secara instan menerjemahkan menu restoran dari bahasa mana pun ke bahasa yang Anda pilih, menyediakan detail hidangan, informasi alergen, dan fakta nutrisi untuk pengalaman makan global yang mulus.
Vocabulary AI
Vocabulary AI
Vocabulary AI adalah platform pembelajaran bahasa canggih yang didukung AI yang menggabungkan terjemahan, pembangunan kosakata, dan praktik yang dipersonalisasi melalui situs web, aplikasi seluler, dan ekstensi browser untuk membantu pengguna belajar dan mempertahankan kata-kata baru secara efektif.