WebSocket 連線可以保持開啟多久？

WebSocket 連線限制為 60 分鐘。達到此限制後，您需要重新連線並建立新的 WebSocket 連線才能繼續。

WebSocket 模式是否與零資料保留 (ZDR) 和 store=false 相容？

是的，WebSocket 模式與零資料保留 (ZDR) 和 store=false 設定相容，因為它僅將先前的回應狀態保存在記憶體中，而不寫入磁碟。

在 WebSocket 模式下，持續運作如何運作？

在 WebSocket 模式下，服務會在連線本機記憶體快取中保留一個先前的回應狀態（最近的回應）。若要繼續執行，您可以傳送另一個 response.create，並將 previous_response_id 設定為先前的回應 ID，以及僅包含新項目的輸入。

是否可以在一個 WebSocket 連線上同時執行多個回應？

否，單個 WebSocket 連線可以接收多個 response.create 訊息，但它會依序執行這些訊息（一次一個正在進行的回應）。對於並行執行，您需要使用多個連線。

如果 WebSocket 模式下的輪詢失敗會發生什麼情況？

如果某個輪詢失敗（4xx 或 5xx 錯誤），服務會從連線本機快取中清除引用的 previous_response_id。這可以防止為該失敗的持續運作重複使用過時的快取狀態。

OpenAI WebSocket Mode for Responses API

WebsiteContact for PricingAI DevOps Assistant AI API Design

OpenAI Responses API 的 WebSocket 模式是一種基於持久連線的解決方案，可實現低延遲、長時間運行的代理工作流程，具有增量輸入和高效的工具呼叫處理。

訪問網站

宣傳此工具

https://developers.openai.com/api/docs/guides/websocket-mode?ref=producthunt&utm_source=aipure

概覽
影片
替代方案

產品資訊

更新時間：2026年03月08日

什麼是 OpenAI WebSocket Mode for Responses API

OpenAI WebSocket 模式是 Responses API 中的一種特殊傳輸模式，專為需要頻繁模型-工具互動的複雜 AI 工作流程而設計。它建立與 /v1/responses 端點的持久 WebSocket 連線，允許開發人員在他們的應用程式和 OpenAI 的模型之間保持持續的通訊。此模式與零資料保留 (ZDR) 和 store=false 選項完全相容，使其適用於有狀態和無狀態的實作，同時保持資料隱私要求。

OpenAI WebSocket Mode for Responses API 的主要功能

OpenAI WebSocket 模式適用於 Responses API，是一種專門的通訊協定，可為長時間運作、工具呼叫繁重的工作流程建立持續連線。它會為最近的回應維護一個連線本機的記憶體快取，讓客戶端只需傳送增量輸入和 previous_response_id，而無需每次都重新傳送完整的上下文。對於具有 20 個以上工具呼叫的工作流程，此模式可以將端到端執行速度提高多達 40%，同時仍與零資料保留 (ZDR) 和 store=false 選項相容。

持續連線: 維護單個 WebSocket 連線長達 60 分鐘，無需為每次互動建立新的 HTTP 連線

增量輸入處理: 允許僅傳送新的輸入項目加上 previous_response_id，而無需重新傳送整個對話上下文

連線本機快取: 在記憶體中維護最近的回應狀態，以便更快地存取，同時仍與零資料保留要求相容

可選的預熱請求: 支援 generate:false 請求以提前準備伺服器端狀態，從而減少後續回合的延遲

OpenAI WebSocket Mode for Responses API 的使用案例

AI 驅動的程式碼開發: 實現高效的程式碼輔助工作流程，其中 AI 代理會進行多個連續的工具呼叫，以讀取檔案、編寫程式碼和測試

複雜的自動化管道: 支援需要多次工具互動和協調步驟的長時間運作自動化任務，並減少延遲

多步驟推理系統: 促進複雜的問題解決方案，其中 AI 需要做出多個連續的決策和工具呼叫

即時代理工作流程: 為需要維護上下文的互動式 AI 代理提供支援，同時執行多個動作以回應使用者輸入

優點

顯著減少了工具繁重工作流程的延遲（速度提高了 40%）

僅傳送增量更新，從而減少了頻寬使用量

與現有的安全功能（如 ZDR 和 store=false）相容

缺點

限制為 60 分鐘的連線持續時間，需要重新連線

不支援在單個連線中進行並行回應處理

需要額外的錯誤處理來進行連線管理和恢復

如何使用 OpenAI WebSocket Mode for Responses API

安裝必要的依賴項: 使用以下命令為 Python 安裝 websocket-client 庫：pip install websocket-client

導入庫: 導入所需的庫：websocket、json 和 os，用於環境變數

建立 WebSocket 連線: 使用標頭中的 API 金鑰建立與 OpenAI 端點 'wss://api.openai.com/v1/responses' 的 WebSocket 連線

傳送初始回應建立事件: 傳送第一個 response.create 事件，其中包含模型、store 標誌、初始輸入訊息和工具陣列。不要包含 stream 或 background 欄位

可選：預熱請求狀態: 可選地傳送 generate:false 的 response.create，以準備伺服器狀態以進行即將到來的請求，而無需產生輸出

繼續對話: 傳送後續的 response.create 事件，其中包含 previous_response_id 和僅新的輸入項目（工具輸出、新訊息）

處理連線限制: 監控 60 分鐘的連線限制，並在需要時重新連線。一次只能有一個回應處於傳輸中

處理重新連線: 重新連線時：繼續使用 previous_response_id（如果 store=true），啟動新的回應，或使用來自 /responses/compact 的壓縮上下文

處理錯誤: 適當地處理 previous_response_not_found 和 websocket_connection_limit_reached 錯誤

關閉連線: 完成後關閉 WebSocket 連線，使用 ws.close()

OpenAI WebSocket Mode for Responses API 常見問題

WebSocket 模式是 OpenAI Responses API 的一項功能，可為長時間運作、工具呼叫繁重的工作流程建立持續連線。其主要優點包括減少每次輪詢的持續運作成本，並改善長鏈中的端對端延遲。對於具有 20 個以上工具呼叫的工作流程，它可以實現高達 40% 的端對端執行速度提升。

OpenAI WebSocket Mode for Responses API 影片

与 OpenAI WebSocket Mode for Responses API 类似的最新 AI 工具

Hapticlabs

Free TrialAI DevOps Assistant No-Code & Low-Code

Hapticlabs 是一個無代碼工具包，使設計師、開發者和研究人員能夠輕鬆設計、原型設計和部署跨設備的沉浸式觸覺交互，無需編碼。

Deployo.ai

Free TrialAI DevOps Assistant AI Code Assistant

Deployo.ai 是一個全面的 AI 部署平台，支持無縫模型部署、監控和擴展，內置道德 AI 框架和跨雲兼容性。

CloudSoul

Free TrialAI DevOps Assistant AI Code Assistant No-Code & Low-Code

CloudSoul 是一款 AI 驅動的 SaaS 平台，通過自然語言對話使用戶能夠即時部署和管理雲端基礎設施，使 AWS 資源管理更加易用和高效。

Devozy.ai

Free TrialAI DevOps Assistant AI Developer Tools AI Project Management

Devozy.ai 是一個由 AI 驅動的開發者自助服務平台，將敏捷項目管理、DevSecOps、多雲基礎設施管理和 IT 服務管理結合為一個統一的解決方案，以加速軟件交付。

类似 OpenAI WebSocket Mode for Responses API 的热门 AI 工具

A2A Protocol

FreeAI DevOps Assistant AI API Design

A2A (Agent2Agent) Protocol is an open interoperability protocol developed by Google that enables seamless communication and collaboration between AI agents across different frameworks and vendors, regardless of their underlying architecture.