
Grok's Text to Speech API
API Text to Speech Grok adalah layanan pengembang yang mengubah teks menjadi ucapan alami dan ekspresif dengan dukungan untuk 5 suara berbeda, 20+ bahasa, dan tag ucapan inline untuk kontrol terperinci atas penyampaian dan nada.
https://x.ai/api/voice?ref=producthunt&utm_source=aipure#text-to-speech

Informasi Produk
Diperbarui:Mar 20, 2026
Tren Traffic Bulanan Grok's Text to Speech API
Grok's Text to Speech API menerima 22.4m kunjungan bulan lalu, menunjukkan Pertumbuhan Moderat sebesar 47%. Berdasarkan analisis kami, tren ini sejalan dengan dinamika pasar yang umum di sektor alat AI.
Lihat riwayat trafficApa itu Grok's Text to Speech API
Dirilis oleh xAI, API Text to Speech Grok adalah solusi text-to-voice canggih yang memungkinkan pengembang untuk menghasilkan ucapan berkualitas tinggi dan terdengar alami dari input teks. API ini dirancang untuk memenuhi kebutuhan akan pembuatan audio ekspresif di seluruh pembuatan konten, aksesibilitas, dan aplikasi pengembang. Ia menawarkan proses integrasi sederhana melalui satu permintaan POST ke titik akhir API, yang hanya memerlukan input teks, pemilihan suara, dan parameter bahasa untuk menghasilkan output audio.
Fitur Utama Grok's Text to Speech API
API Text to Speech Grok adalah layanan canggih yang mengubah teks menjadi ucapan yang terdengar alami dengan 5 pilihan suara berbeda (Eve, Ara, Leo, Rex, Sal) dan mendukung lebih dari 20 bahasa dengan deteksi otomatis. API ini menawarkan kontrol terperinci melalui tag ucapan inline untuk jeda, tawa, bisikan, dan penekanan, sambil menyediakan beberapa format output dan sample rate. Dengan harga $4,20 per 1 juta karakter, ia menawarkan harga yang kompetitif untuk pengembang yang membangun aplikasi suara.
Pilihan Suara Ekspresif: Lima kepribadian suara berbeda dengan karakteristik unik - Ara (hangat, ramah), Eve (enerjik, ceria), Rex (percaya diri, jelas), Sal (halus, seimbang), dan Leo (berwibawa, kuat)
Kontrol Ucapan Inline: Kontrol lanjutan atas penyampaian ucapan menggunakan tag inline untuk jeda, tawa, bisikan, penekanan, dan elemen ekspresif lainnya
Dukungan Multibahasa: Mendukung 20+ bahasa dengan deteksi bahasa otomatis dan kemahiran tingkat asli dalam pengucapan dan dialek
Format Audio Fleksibel: Beberapa format output dan sample rate dari 8000 Hz hingga 48000 Hz, cocok untuk telefoni, pengenalan ucapan, dan aplikasi audio profesional
Kasus Penggunaan Grok's Text to Speech API
Pembuatan Konten: Hasilkan sulih suara alami untuk video, podcast, dan konten digital lainnya dengan penyampaian ekspresif dan beberapa pilihan suara
Dukungan Pelanggan: Bangun sistem respons suara interaktif dan agen layanan pelanggan otomatis dengan respons yang terdengar alami
Solusi Aksesibilitas: Buat versi audio dari konten tertulis untuk pengguna tunanetra atau mereka yang lebih menyukai konsumsi audio
Permainan dan Hiburan: Hasilkan konten suara dinamis untuk karakter game dan aplikasi hiburan interaktif
Kelebihan
Harga kompetitif $4,20 per 1 juta karakter
Kontrol yang kaya atas ekspresi ucapan melalui tag inline
Terintegrasi dengan ekosistem Tesla dan potensi untuk aplikasi yang lebih luas
Kekurangan
Terbatas hingga 100 permintaan bersamaan per tim
Tidak ada fitur khusus untuk kontrol terperinci parameter prosodi ucapan
Layanan yang relatif baru dengan fitur dan kemampuan yang terus berkembang
Cara Menggunakan Grok's Text to Speech API
Dapatkan Kunci API: Siapkan XAI_API_KEY di variabel lingkungan atau file .env Anda dengan mendapatkan kunci API dari xAI
Instal Dependensi: Instal pustaka yang diperlukan seperti 'requests' untuk Python atau gunakan fetch untuk JavaScript
Buat Permintaan API: Kirim permintaan POST ke https://api.x.ai/v1/tts dengan kunci API Anda di header Otorisasi dan Content-Type sebagai application/json
Konfigurasi Isi Permintaan: Sertakan parameter 'text' dalam isi JSON dengan teks yang ingin Anda konversi menjadi ucapan. Secara opsional, tentukan suara dari opsi yang tersedia: eve, ara, rex, sal, leo
Tangani Respons: Proses respons audio yang akan dikembalikan dalam format yang Anda tentukan (wav adalah default). Simpan atau streaming audio sesuai kebutuhan
Tambahkan Tag Ucapan (Opsional): Gunakan tag ucapan inline untuk mengontrol ekspresi seperti [ceria], [bisikan], atau tambahkan jeda untuk ucapan yang terdengar lebih alami
Pantau Penggunaan: Lacak penggunaan Anda karena harga adalah $4,20 per 1 juta karakter dengan batas laju 600 permintaan per menit atau 10 permintaan per detik
FAQ Grok's Text to Speech API
Grok TTS API adalah layanan pengembang dari xAI yang mengubah teks menjadi audio yang diucapkan melalui satu panggilan API. API ini mendukung 5 suara, 20 bahasa, tag ucapan ekspresif, dan beberapa codec audio termasuk MP3, WAV, PCM, dan format telefoni. Saat ini masih dalam versi Beta.
Artikel Populer

5 Agen AI Terbaik di Tahun 2026: Cara Memilih yang Tepat
Mar 18, 2026

Panduan Penerapan OpenClaw: Cara Melakukan Self-Hosting Agen AI Nyata (Pembaruan 2026)
Mar 10, 2026

Tutorial Atoms 2026: Bangun Dasbor SaaS Lengkap dalam 20 Menit (Praktik Langsung AIPURE)
Mar 2, 2026

Kode Kupon OpenArt AI Gratis di Tahun 2026 dan Cara Menukarkannya
Feb 25, 2026
Analitik Situs Web Grok's Text to Speech API
Lalu Lintas & Peringkat Grok's Text to Speech API
22.4M
Kunjungan Bulanan
#2580
Peringkat Global
#13
Peringkat Kategori
Tren Lalu Lintas: Nov 2024-Oct 2025
Wawasan Pengguna Grok's Text to Speech API
00:02:55
Rata-rata Durasi Kunjungan
2.97
Halaman Per Kunjungan
27.98%
Tingkat Pentalan Pengguna
Wilayah Teratas Grok's Text to Speech API
US: 26.62%
KR: 9.73%
IN: 4.62%
JP: 3.15%
HK: 2.99%
Others: 52.89%







