OpenAI 為 ChatGPT 增強進階語音模式
在 2024 年 9 月 25 日,OpenAI 推出了 ChatGPT 的進階語音模式(Advanced Voice Mode,簡稱 AVM),這是讓 AI 互動更自然、更吸引人的重要一步。這項新功能最初向 Plus 和 Teams 層級的客戶開放,代表了對話式 AI 技術的重大進步。
(ChatGPT 進階語音模式發布推特貼文:https://twitter.com/OpenAI/status/1838642444365369814)
ChatGPT 進階語音模式的主要特點
- 擴展語音選項
ChatGPT 現在為用戶提供了五種新的語音選擇:Arbor、Maple、Sol、Spruce 和 Vale。這些靈感來自大自然的語音加入了現有的陣容,使總數達到九種不同的語音選項。這種擴展允許用戶自定義他們的 AI 互動體驗,使對話感覺更個人化,更符合個人偏好。
- 改進的對話流程
OpenAI 聲稱自初始 alpha 測試階段以來,已對 AVM 進行了重大改進。該系統現在擁有增強的口音識別能力,對話更流暢、更快速。這些升級旨在減少故障,創造更順暢的用戶與 AI 之間的互動。
- 視覺重新設計
進階語音模式以藍色動畫球體的形式呈現新的視覺表現,取代了之前的黑點動畫。這種重新設計為界面提供了新鮮、現代的外觀,使其更具視覺吸引力,更直觀易用。
ChatGPT 進階語音模式的自定義指令和記憶功能
OpenAI 將基於文本的 ChatGPT 的兩個強大功能整合到了 AVM 中:
- 自定義指令:用戶可以個性化 ChatGPT 對他們的回應方式,創造更量身定制的互動體驗。
- 記憶:這項功能允許 ChatGPT 記住並引用之前的對話,隨著時間的推移提供更具上下文和相關性的回應。
這些添加顯著增強了 AI 在語音互動中提供個性化和上下文感知回應的能力。
ChatGPT 進階語音模式的推出和可用性
進階語音模式的推出分階段進行:
- 從 2024 年 9 月 24 日開始,最初向 ChatGPT Plus 和 Teams 層級客戶開放
- 企業和教育客戶將從下一週開始獲得訪問權限
- 尚未在幾個地區可用,包括歐盟、英國、瑞士、冰島、挪威和列支敦士登
這種分階段的方法允許 OpenAI 在擴展功能可用性時監控性能並收集用戶反饋。
OpenAI 的未來發展
雖然當前的推出專注於語音互動,但 OpenAI 暗示了未來的增強功能。在他們的春季更新中,公司展示了 GPT-4o 的視頻和屏幕共享功能,允許同時處理視覺和聽覺信息。儘管這些功能未包含在此次發布中,但它們預示了未來更新的令人興奮的路線圖。
常見問題
★如何訪問進階語音模式?
進階語音模式目前正在向 ChatGPT Plus 和 Team 用戶推出。您可以通過查看 ChatGPT 應用程序屏幕右下角的語音圖標來檢查是否有訪問權限。
★我可以在 GPTs 中使用進階語音模式嗎?
不可以,進階語音模式目前還不能用於 GPTs。如果您嘗試與 GPT 進行進階語音對話,您將被重定向到使用標準語音開始新的對話。
★進階語音模式有使用限制嗎?
是的,對於 Plus 和 Team 用戶,進階語音模式(音頻輸入和輸出)的使用在每日基礎上是有限制的。具體限制可能會有所變化。
★進階語音模式在所有地區都可用嗎?
不是,截至 2024 年 9 月 25 日的推出,進階語音模式在歐盟、英國、瑞士、冰島、挪威和列支敦士登尚未可用。
進階語音模式的引入標誌著 AI 驅動的對話界面演進的重要里程碑。通過使 AI 互動更自然、更個性化和更容易訪問,OpenAI 正在為 AI 技術在日常生活中更廣泛的採用和更多樣化的應用鋪平道路。
要了解最新的 AI 發展並探索尖端 AI 工具,請訪問 AIPURE(https://aipure.ai/)以獲取全面的信息和資源。