
OpenAI WebSocket Mode for Responses API
OpenAI Responses API 的 WebSocket 模式是一種基於持久連線的解決方案,可實現低延遲、長時間運行的代理工作流程,具有增量輸入和高效的工具呼叫處理。
https://developers.openai.com/api/docs/guides/websocket-mode?ref=producthunt&utm_source=aipure

產品資訊
更新時間:2026年03月02日
什麼是 OpenAI WebSocket Mode for Responses API
OpenAI WebSocket 模式是 Responses API 中的一種特殊傳輸模式,專為需要頻繁模型-工具互動的複雜 AI 工作流程而設計。它建立與 /v1/responses 端點的持久 WebSocket 連線,允許開發人員在他們的應用程式和 OpenAI 的模型之間保持持續的通訊。此模式與零資料保留 (ZDR) 和 store=false 選項完全相容,使其適用於有狀態和無狀態的實作,同時保持資料隱私要求。
OpenAI WebSocket Mode for Responses API 的主要功能
OpenAI WebSocket 模式適用於 Responses API,是一種專門的通訊協定,可為長時間運作、工具呼叫繁重的工作流程建立持續連線。它會為最近的回應維護一個連線本機的記憶體快取,讓客戶端只需傳送增量輸入和 previous_response_id,而無需每次都重新傳送完整的上下文。對於具有 20 個以上工具呼叫的工作流程,此模式可以將端到端執行速度提高多達 40%,同時仍與零資料保留 (ZDR) 和 store=false 選項相容。
持續連線: 維護單個 WebSocket 連線長達 60 分鐘,無需為每次互動建立新的 HTTP 連線
增量輸入處理: 允許僅傳送新的輸入項目加上 previous_response_id,而無需重新傳送整個對話上下文
連線本機快取: 在記憶體中維護最近的回應狀態,以便更快地存取,同時仍與零資料保留要求相容
可選的預熱請求: 支援 generate:false 請求以提前準備伺服器端狀態,從而減少後續回合的延遲
OpenAI WebSocket Mode for Responses API 的使用案例
AI 驅動的程式碼開發: 實現高效的程式碼輔助工作流程,其中 AI 代理會進行多個連續的工具呼叫,以讀取檔案、編寫程式碼和測試
複雜的自動化管道: 支援需要多次工具互動和協調步驟的長時間運作自動化任務,並減少延遲
多步驟推理系統: 促進複雜的問題解決方案,其中 AI 需要做出多個連續的決策和工具呼叫
即時代理工作流程: 為需要維護上下文的互動式 AI 代理提供支援,同時執行多個動作以回應使用者輸入
優點
顯著減少了工具繁重工作流程的延遲(速度提高了 40%)
僅傳送增量更新,從而減少了頻寬使用量
與現有的安全功能(如 ZDR 和 store=false)相容
缺點
限制為 60 分鐘的連線持續時間,需要重新連線
不支援在單個連線中進行並行回應處理
需要額外的錯誤處理來進行連線管理和恢復
如何使用 OpenAI WebSocket Mode for Responses API
安裝必要的依賴項: 使用以下命令為 Python 安裝 websocket-client 庫:pip install websocket-client
導入庫: 導入所需的庫:websocket、json 和 os,用於環境變數
建立 WebSocket 連線: 使用標頭中的 API 金鑰建立與 OpenAI 端點 'wss://api.openai.com/v1/responses' 的 WebSocket 連線
傳送初始回應建立事件: 傳送第一個 response.create 事件,其中包含模型、store 標誌、初始輸入訊息和工具陣列。不要包含 stream 或 background 欄位
可選:預熱請求狀態: 可選地傳送 generate:false 的 response.create,以準備伺服器狀態以進行即將到來的請求,而無需產生輸出
繼續對話: 傳送後續的 response.create 事件,其中包含 previous_response_id 和僅新的輸入項目(工具輸出、新訊息)
處理連線限制: 監控 60 分鐘的連線限制,並在需要時重新連線。一次只能有一個回應處於傳輸中
處理重新連線: 重新連線時:繼續使用 previous_response_id(如果 store=true),啟動新的回應,或使用來自 /responses/compact 的壓縮上下文
處理錯誤: 適當地處理 previous_response_not_found 和 websocket_connection_limit_reached 錯誤
關閉連線: 完成後關閉 WebSocket 連線,使用 ws.close()
OpenAI WebSocket Mode for Responses API 常見問題
WebSocket 模式是 OpenAI Responses API 的一項功能,可為長時間運作、工具呼叫繁重的工作流程建立持續連線。其主要優點包括減少每次輪詢的持續運作成本,並改善長鏈中的端對端延遲。對於具有 20 個以上工具呼叫的工作流程,它可以實現高達 40% 的端對端執行速度提升。











