OpenAI WebSocket Mode for Responses API

OpenAI WebSocket Mode for Responses API

WebsiteContact for PricingAI DevOps AssistantAI API Design
OpenAI Responses API 的 WebSocket 模式是一種基於持久連線的解決方案,可實現低延遲、長時間運行的代理工作流程,具有增量輸入和高效的工具呼叫處理。
https://developers.openai.com/api/docs/guides/websocket-mode?ref=producthunt&utm_source=aipure
OpenAI WebSocket Mode for Responses API

產品資訊

更新時間:2026年03月02日

什麼是 OpenAI WebSocket Mode for Responses API

OpenAI WebSocket 模式是 Responses API 中的一種特殊傳輸模式,專為需要頻繁模型-工具互動的複雜 AI 工作流程而設計。它建立與 /v1/responses 端點的持久 WebSocket 連線,允許開發人員在他們的應用程式和 OpenAI 的模型之間保持持續的通訊。此模式與零資料保留 (ZDR) 和 store=false 選項完全相容,使其適用於有狀態和無狀態的實作,同時保持資料隱私要求。

OpenAI WebSocket Mode for Responses API 的主要功能

OpenAI WebSocket 模式適用於 Responses API,是一種專門的通訊協定,可為長時間運作、工具呼叫繁重的工作流程建立持續連線。它會為最近的回應維護一個連線本機的記憶體快取,讓客戶端只需傳送增量輸入和 previous_response_id,而無需每次都重新傳送完整的上下文。對於具有 20 個以上工具呼叫的工作流程,此模式可以將端到端執行速度提高多達 40%,同時仍與零資料保留 (ZDR) 和 store=false 選項相容。
持續連線: 維護單個 WebSocket 連線長達 60 分鐘,無需為每次互動建立新的 HTTP 連線
增量輸入處理: 允許僅傳送新的輸入項目加上 previous_response_id,而無需重新傳送整個對話上下文
連線本機快取: 在記憶體中維護最近的回應狀態,以便更快地存取,同時仍與零資料保留要求相容
可選的預熱請求: 支援 generate:false 請求以提前準備伺服器端狀態,從而減少後續回合的延遲

OpenAI WebSocket Mode for Responses API 的使用案例

AI 驅動的程式碼開發: 實現高效的程式碼輔助工作流程,其中 AI 代理會進行多個連續的工具呼叫,以讀取檔案、編寫程式碼和測試
複雜的自動化管道: 支援需要多次工具互動和協調步驟的長時間運作自動化任務,並減少延遲
多步驟推理系統: 促進複雜的問題解決方案,其中 AI 需要做出多個連續的決策和工具呼叫
即時代理工作流程: 為需要維護上下文的互動式 AI 代理提供支援,同時執行多個動作以回應使用者輸入

優點

顯著減少了工具繁重工作流程的延遲(速度提高了 40%)
僅傳送增量更新,從而減少了頻寬使用量
與現有的安全功能(如 ZDR 和 store=false)相容

缺點

限制為 60 分鐘的連線持續時間,需要重新連線
不支援在單個連線中進行並行回應處理
需要額外的錯誤處理來進行連線管理和恢復

如何使用 OpenAI WebSocket Mode for Responses API

安裝必要的依賴項: 使用以下命令為 Python 安裝 websocket-client 庫:pip install websocket-client
導入庫: 導入所需的庫:websocket、json 和 os,用於環境變數
建立 WebSocket 連線: 使用標頭中的 API 金鑰建立與 OpenAI 端點 'wss://api.openai.com/v1/responses' 的 WebSocket 連線
傳送初始回應建立事件: 傳送第一個 response.create 事件,其中包含模型、store 標誌、初始輸入訊息和工具陣列。不要包含 stream 或 background 欄位
可選:預熱請求狀態: 可選地傳送 generate:false 的 response.create,以準備伺服器狀態以進行即將到來的請求,而無需產生輸出
繼續對話: 傳送後續的 response.create 事件,其中包含 previous_response_id 和僅新的輸入項目(工具輸出、新訊息)
處理連線限制: 監控 60 分鐘的連線限制,並在需要時重新連線。一次只能有一個回應處於傳輸中
處理重新連線: 重新連線時:繼續使用 previous_response_id(如果 store=true),啟動新的回應,或使用來自 /responses/compact 的壓縮上下文
處理錯誤: 適當地處理 previous_response_not_found 和 websocket_connection_limit_reached 錯誤
關閉連線: 完成後關閉 WebSocket 連線,使用 ws.close()

OpenAI WebSocket Mode for Responses API 常見問題

WebSocket 模式是 OpenAI Responses API 的一項功能,可為長時間運作、工具呼叫繁重的工作流程建立持續連線。其主要優點包括減少每次輪詢的持續運作成本,並改善長鏈中的端對端延遲。對於具有 20 個以上工具呼叫的工作流程,它可以實現高達 40% 的端對端執行速度提升。

与 OpenAI WebSocket Mode for Responses API 类似的最新 AI 工具

Hapticlabs
Hapticlabs
Hapticlabs 是一個無代碼工具包,使設計師、開發者和研究人員能夠輕鬆設計、原型設計和部署跨設備的沉浸式觸覺交互,無需編碼。
Deployo.ai
Deployo.ai
Deployo.ai 是一個全面的 AI 部署平台,支持無縫模型部署、監控和擴展,內置道德 AI 框架和跨雲兼容性。
CloudSoul
CloudSoul
CloudSoul 是一款 AI 驅動的 SaaS 平台,通過自然語言對話使用戶能夠即時部署和管理雲端基礎設施,使 AWS 資源管理更加易用和高效。
Devozy.ai
Devozy.ai
Devozy.ai 是一個由 AI 驅動的開發者自助服務平台,將敏捷項目管理、DevSecOps、多雲基礎設施管理和 IT 服務管理結合為一個統一的解決方案,以加速軟件交付。