Grok's Text to Speech API

Grok's Text to Speech API

Grok的文字轉語音API是一項開發人員服務,可將文字轉換為自然、富有表現力的語音,支援5種不同的聲音、20多種語言以及用於精細控制傳遞和語氣的內聯語音標籤。
https://x.ai/api/voice?ref=producthunt&utm_source=aipure#text-to-speech
Grok's Text to Speech API

產品資訊

更新時間:2026年03月20日

Grok's Text to Speech API 每月流量趨勢

Grok's Text to Speech API 在上個月收到了 22.4m 次訪問,呈現出 47% 的適度增長。根據我們的分析,這個趨勢與人工智能工具領域的典型市場動態相符。
查看歷史流量

什麼是 Grok's Text to Speech API

Grok文字轉語音API由xAI發布,是一種先進的文字轉語音解決方案,使開發人員能夠從文字輸入生成高品質、聽起來自然的語音。該API旨在滿足內容創建、輔助功能和開發人員應用中對表現力豐富的音訊生成的需求。它通過向API端點發送單個POST請求提供了一個簡單的整合過程,只需文字輸入、語音選擇和語言參數即可生成音訊輸出。

Grok's Text to Speech API 的主要功能

Grok 的文字轉語音 API 是一項強大的服務,可將文字轉換為自然發音的語音,提供 5 種獨特的聲音選項(Eve、Ara、Leo、Rex、Sal),並支援超過 20 種語言,且具備自動偵測功能。該 API 透過內嵌語音標籤提供精細的控制,可調整停頓、笑聲、耳語和強調,同時提供多種輸出格式和取樣率。每 100 萬個字元 4.20 美元的價格,為開發人員建構語音應用程式提供了具競爭力的定價。
富有表現力的聲音選項: 五種獨特的聲音個性,具有獨特的特徵 - Ara(溫暖、友善)、Eve(充滿活力、樂觀)、Rex(自信、清晰)、Sal(流暢、平衡)和 Leo(權威、強大)
內嵌語音控制: 使用內嵌標籤對語音傳達進行進階控制,以調整停頓、笑聲、耳語、強調和其他富有表現力的元素
多語言支援: 支援 20 多種語言,具有自動語言偵測功能,並在發音和方言方面具有母語水準的熟練度
彈性的音訊格式: 多種輸出格式和取樣率,從 8000 Hz 到 48000 Hz,適用於電話、語音辨識和專業音訊應用程式

Grok's Text to Speech API 的使用案例

內容創作: 為影片、Podcast 和其他數位內容產生自然的旁白,具有富有表現力的傳達和多種聲音選項
客戶支援: 建構互動式語音回應系統和自動化客戶服務專員,提供自然發音的回應
輔助工具解決方案: 為視障使用者或喜歡音訊消費的使用者建立書面內容的音訊版本
遊戲和娛樂: 為遊戲角色和互動式娛樂應用程式產生動態語音內容

優點

每 100 萬個字元 4.20 美元的具競爭力定價
透過內嵌標籤豐富地控制語音表達
與 Tesla 的生態系統整合,並具有更廣泛應用的潛力

缺點

每個團隊僅限 100 個並行請求
沒有用於精細控制語音韻律參數的專用功能
相對較新的服務,具有不斷發展的功能和能力

如何使用 Grok's Text to Speech API

獲取API金鑰: 通過從xAI獲取API金鑰,在您的環境變數或.env檔案中設置XAI_API_KEY
安裝依賴項: 安裝所需的庫,例如Python的'requests'或JavaScript的fetch
發出API請求: 向https://api.x.ai/v1/tts發送POST請求,並在Authorization標頭中包含您的API金鑰,以及將Content-Type設置為application/json
配置請求主體: 在JSON主體中包含'text'參數,其中包含您要轉換為語音的文字。可選地,從可用選項中指定語音:eve、ara、rex、sal、leo
處理響應: 處理音訊響應,該響應將以您指定的格式返回(預設為wav)。根據需要保存或流式傳輸音訊
添加語音標籤(可選): 使用內聯語音標籤來控制表達,例如[cheerful]、[whisper],或添加停頓以獲得更自然的語音
監控使用情況: 追蹤您的使用情況,因為定價為每100萬個字元4.20美元,速率限制為每分鐘600個請求或每秒10個請求

Grok's Text to Speech API 常見問題

Grok TTS API是xAI的開發者服務,透過單一API呼叫將文字轉換為口語音訊。它支援5種聲音、20種語言、富有表現力的語音標籤,以及多種音訊編碼解碼器,包括MP3、WAV、PCM和電話格式。目前處於Beta測試階段。

Grok's Text to Speech API 網站分析

Grok's Text to Speech API 流量和排名
22.4M
每月訪問量
#2580
全球排名
#13
類別排名
流量趨勢:Nov 2024-Oct 2025
Grok's Text to Speech API 用戶洞察
00:02:55
平均訪問時長
2.97
每次訪問的頁面數
27.98%
用戶跳出率
Grok's Text to Speech API 的主要地區
  1. US: 26.62%

  2. KR: 9.73%

  3. IN: 4.62%

  4. JP: 3.15%

  5. HK: 2.99%

  6. Others: 52.89%

与 Grok's Text to Speech API 类似的最新 AI 工具

MicVoice.Ai
MicVoice.Ai
MicVoice.Ai 是一個全方位的 AI 語音生成平台,將書面文字轉換為高質量、自然的語音,支持 17+ 種語言,提供超過 5000 個逼真的 AI 語音。
Narrai
Narrai
Narrai是一款AI驅動的移動應用程序,通過自動生成相關劇本並提供多種敘述者角色,即時為短視頻創建語音旁白和背景音樂。
Vagent
Vagent
Vagent 是一個輕量級的語音界面,使用戶能夠通過語音命令與自定義 AI 代理進行交互,提供了一種自然且直觀的方式來控制自動化,支持 60 多種語言。
F5 TTS
F5 TTS
F5-TTS 是一個最先進的非自回歸文本轉語音系統,使用 Flow Matching 和 Diffusion Transformer 技術生成高度自然和表達豐富的語音,具有零樣本語音克隆功能。