WebSocket连接可以保持打开多长时间？

WebSocket连接限制为60分钟。达到此限制后，您需要重新连接并创建新的WebSocket连接才能继续。

WebSocket模式是否与零数据保留（ZDR）和store=false兼容？

是的，WebSocket模式与零数据保留（ZDR）和store=false设置兼容，因为它仅将先前的响应状态保存在内存中，而不写入磁盘。

在WebSocket模式下，延续是如何工作的？

在WebSocket模式下，服务在连接本地的内存缓存中保留一个先前的响应状态（最近的响应）。要继续运行，您可以发送另一个response.create，并将previous_response_id设置为先前的响应ID，以及仅包含新项目的输入。

是否可以在一个WebSocket连接上同时运行多个响应？

不，单个WebSocket连接可以接收多个response.create消息，但它会按顺序运行它们（一次一个正在进行的响应）。对于并行运行，您需要使用多个连接。

如果在WebSocket模式下某个转换失败会发生什么？

如果某个转换失败（4xx或5xx错误），服务会从连接本地缓存中删除引用的previous_response_id。这可以防止为该失败的延续重用过时的缓存状态。

OpenAI WebSocket Mode for Responses API

WebsiteContact for PricingAI DevOps Assistant AI API Design

OpenAI Responses API的WebSocket模式是一种基于持久连接的解决方案，它支持低延迟、长时间运行的代理工作流程，具有增量输入和高效的工具调用处理。

访问网站

推广此工具

https://developers.openai.com/api/docs/guides/websocket-mode?ref=producthunt&utm_source=aipure

概述
视频
替代方案

产品信息

更新于：2026年03月08日

什么是 OpenAI WebSocket Mode for Responses API

OpenAI WebSocket模式是Responses API中的一种专用传输模式，专为需要频繁模型-工具交互的复杂AI工作流程而设计。它建立到/v1/responses端点的持久WebSocket连接，允许开发人员保持其应用程序与OpenAI模型之间的持续通信。此模式与零数据保留（ZDR）和store=false选项完全兼容，使其适用于有状态和无状态的实现，同时保持数据隐私要求。

OpenAI WebSocket Mode for Responses API 的主要功能

OpenAI WebSocket 模式用于 Responses API 是一种专门的通信协议，它为长时间运行、工具调用繁重的工作流程启用持久连接。它为最近的响应维护一个连接本地的内存缓存，允许客户端仅发送带有 previous_response_id 的增量输入，而不是每次都重新发送完整的上下文。对于具有 20 多个工具调用的工作流程，此模式可以将端到端执行速度提高高达 40%，同时保持与零数据保留 (ZDR) 和 store=false 选项的兼容性。

持久连接: 维护单个 WebSocket 连接长达 60 分钟，无需为每次交互建立新的 HTTP 连接

增量输入处理: 允许仅发送新的输入项加上 previous_response_id，而不是重新发送整个对话上下文

连接本地缓存: 在内存中维护最近的响应状态，以便更快地访问，同时保持与零数据保留要求的兼容性

可选的预热请求: 支持 generate:false 请求以提前准备服务器端状态，从而减少后续轮次的延迟