OpenAI 為 ChatGPT 增強進階語音模式
在 2024 年 9 月 25 日(今天),OpenAI 推出了 ChatGPT 的進階語音模式(Advanced Voice Mode,AVM),這是讓 AI 互動更自然、更吸引人的重要一步。這項新功能最初僅向 Plus 和 Teams 層級的客戶開放,代表了對話式 AI 技術的重大進步。
(ChatGPT 進階語音模式發布推文:https://twitter.com/OpenAI/status/1838642444365369814)
ChatGPT 進階語音模式的主要特點
- 擴展語音選項
ChatGPT 現在為用戶提供五種新的語音選擇:Arbor、Maple、Sol、Spruce 和 Vale。這些靈感來自大自然的語音加入現有陣容,使總數達到九種不同的語音選項。這種擴展允許用戶自定義他們的 AI 互動體驗,使對話感覺更個人化,更符合個人偏好。
- 改進的對話流程
OpenAI 聲稱自初始 alpha 測試階段以來,已對 AVM 進行了重大改進。該系統現在擁有增強的口音識別能力,對話更流暢、更快速。這些升級旨在減少故障並創造更順暢的用戶與 AI 之間的互動。
- 視覺重新設計
進階語音模式採用了新的視覺表現形式,以藍色動畫球體取代了之前的黑點動畫。這種重新設計為界面提供了新鮮、現代的外觀,使其對用戶來說更具視覺吸引力和直觀性。
ChatGPT 進階語音模式的自定義指令和記憶功能
OpenAI 將基於文本的 ChatGPT 的兩個強大功能整合到了 AVM 中:
- 自定義指令:用戶可以個性化 ChatGPT 對他們的回應方式,創造更加量身定制的互動體驗。
- 記憶:這項功能允許 ChatGPT 記住並參考之前的對話,隨著時間的推移能夠提供更具上下文和相關性的回應。
這些添加顯著增強了 AI 在語音互動中提供個性化和上下文感知回應的能力。
ChatGPT 進階語音模式的推出和可用性
進階語音模式的推出分階段進行:
- 從 2024 年 9 月 24 日開始,最初向 ChatGPT Plus 和 Teams 層級客戶開放
- 企業和教育客戶將從下一週開始獲得訪問權限
- 目前尚未在歐盟、英國、瑞士、冰島、挪威和列支敦士登等多個地區開放
這種分階段的方法允許 OpenAI 在擴大功能可用性時監控性能並收集用戶反饋。
OpenAI 的未來發展
雖然當前的推出重點是語音互動,但 OpenAI 暗示了未來的增強功能。在他們的春季更新中,公司展示了 GPT-4o 的視頻和屏幕共享功能,允許同時處理視覺和聽覺信息。儘管這些功能未包含在此次發布中,但它們預示了未來更新的令人興奮的路線圖。
常見問題
★如何訪問進階語音模式?
進階語音模式目前正在向 ChatGPT Plus 和 Team 用戶推出。您可以通過查看 ChatGPT 應用程序屏幕右下角的語音圖標來檢查您是否有訪問權限。
★我可以在 GPTs 中使用進階語音模式嗎?
不可以,進階語音模式目前尚不支持與 GPTs 一起使用。如果您嘗試與 GPT 進行高級語音對話,您將被重定向到使用標準語音開始新的聊天。
★進階語音模式有使用限制嗎?
是的,對於 Plus 和 Team 用戶,進階語音模式(音頻輸入和輸出)的使用在每日基礎上是有限制的。具體限制可能會有所變化。
★進階語音模式在所有地區都可用嗎?
不是,截至 2024 年 9 月 25 日的推出,進階語音模式尚未在歐盟、英國、瑞士、冰島、挪威和列支敦士登開放。
進階語音模式的引入標誌著 AI 驅動的對話界面演進的重要里程碑。通過使 AI 互動更自然、更個性化和更易於使用,OpenAI 正在為 AI 技術在日常生活中的更廣泛採用和更多樣化的應用鋪平道路。
要了解最新的 AI 發展並探索尖端 AI 工具,請訪問 AIPURE(https://aipure.ai/)以獲取全面的信息和資源。