
Grok's Text to Speech API
Grok的文字轉語音API是一項開發人員服務,可將文字轉換為自然、富有表現力的語音,支援5種不同的聲音、20多種語言以及用於精細控制傳遞和語氣的內聯語音標籤。
https://x.ai/api/voice?ref=producthunt&utm_source=aipure#text-to-speech

產品資訊
更新時間:2026年03月20日
Grok's Text to Speech API 每月流量趨勢
Grok's Text to Speech API 在上個月收到了 22.4m 次訪問,呈現出 47% 的適度增長。根據我們的分析,這個趨勢與人工智能工具領域的典型市場動態相符。
查看歷史流量什麼是 Grok's Text to Speech API
Grok文字轉語音API由xAI發布,是一種先進的文字轉語音解決方案,使開發人員能夠從文字輸入生成高品質、聽起來自然的語音。該API旨在滿足內容創建、輔助功能和開發人員應用中對表現力豐富的音訊生成的需求。它通過向API端點發送單個POST請求提供了一個簡單的整合過程,只需文字輸入、語音選擇和語言參數即可生成音訊輸出。
Grok's Text to Speech API 的主要功能
Grok 的文字轉語音 API 是一項強大的服務,可將文字轉換為自然發音的語音,提供 5 種獨特的聲音選項(Eve、Ara、Leo、Rex、Sal),並支援超過 20 種語言,且具備自動偵測功能。該 API 透過內嵌語音標籤提供精細的控制,可調整停頓、笑聲、耳語和強調,同時提供多種輸出格式和取樣率。每 100 萬個字元 4.20 美元的價格,為開發人員建構語音應用程式提供了具競爭力的定價。
富有表現力的聲音選項: 五種獨特的聲音個性,具有獨特的特徵 - Ara(溫暖、友善)、Eve(充滿活力、樂觀)、Rex(自信、清晰)、Sal(流暢、平衡)和 Leo(權威、強大)
內嵌語音控制: 使用內嵌標籤對語音傳達進行進階控制,以調整停頓、笑聲、耳語、強調和其他富有表現力的元素
多語言支援: 支援 20 多種語言,具有自動語言偵測功能,並在發音和方言方面具有母語水準的熟練度
彈性的音訊格式: 多種輸出格式和取樣率,從 8000 Hz 到 48000 Hz,適用於電話、語音辨識和專業音訊應用程式
Grok's Text to Speech API 的使用案例
內容創作: 為影片、Podcast 和其他數位內容產生自然的旁白,具有富有表現力的傳達和多種聲音選項
客戶支援: 建構互動式語音回應系統和自動化客戶服務專員,提供自然發音的回應
輔助工具解決方案: 為視障使用者或喜歡音訊消費的使用者建立書面內容的音訊版本
遊戲和娛樂: 為遊戲角色和互動式娛樂應用程式產生動態語音內容
優點
每 100 萬個字元 4.20 美元的具競爭力定價
透過內嵌標籤豐富地控制語音表達
與 Tesla 的生態系統整合,並具有更廣泛應用的潛力
缺點
每個團隊僅限 100 個並行請求
沒有用於精細控制語音韻律參數的專用功能
相對較新的服務,具有不斷發展的功能和能力
如何使用 Grok's Text to Speech API
獲取API金鑰: 通過從xAI獲取API金鑰,在您的環境變數或.env檔案中設置XAI_API_KEY
安裝依賴項: 安裝所需的庫,例如Python的'requests'或JavaScript的fetch
發出API請求: 向https://api.x.ai/v1/tts發送POST請求,並在Authorization標頭中包含您的API金鑰,以及將Content-Type設置為application/json
配置請求主體: 在JSON主體中包含'text'參數,其中包含您要轉換為語音的文字。可選地,從可用選項中指定語音:eve、ara、rex、sal、leo
處理響應: 處理音訊響應,該響應將以您指定的格式返回(預設為wav)。根據需要保存或流式傳輸音訊
添加語音標籤(可選): 使用內聯語音標籤來控制表達,例如[cheerful]、[whisper],或添加停頓以獲得更自然的語音
監控使用情況: 追蹤您的使用情況,因為定價為每100萬個字元4.20美元,速率限制為每分鐘600個請求或每秒10個請求
Grok's Text to Speech API 常見問題
Grok TTS API是xAI的開發者服務,透過單一API呼叫將文字轉換為口語音訊。它支援5種聲音、20種語言、富有表現力的語音標籤,以及多種音訊編碼解碼器,包括MP3、WAV、PCM和電話格式。目前處於Beta測試階段。
Grok's Text to Speech API 網站分析
Grok's Text to Speech API 流量和排名
22.4M
每月訪問量
#2580
全球排名
#13
類別排名
流量趨勢:Nov 2024-Oct 2025
Grok's Text to Speech API 用戶洞察
00:02:55
平均訪問時長
2.97
每次訪問的頁面數
27.98%
用戶跳出率
Grok's Text to Speech API 的主要地區
US: 26.62%
KR: 9.73%
IN: 4.62%
JP: 3.15%
HK: 2.99%
Others: 52.89%











