
OpenAI WebSocket Mode for Responses API
OpenAI Responses API的WebSocket模式是一种基于持久连接的解决方案,它支持低延迟、长时间运行的代理工作流程,具有增量输入和高效的工具调用处理。
https://developers.openai.com/api/docs/guides/websocket-mode?ref=producthunt&utm_source=aipure

产品信息
更新于:2026年03月02日
什么是 OpenAI WebSocket Mode for Responses API
OpenAI WebSocket模式是Responses API中的一种专用传输模式,专为需要频繁模型-工具交互的复杂AI工作流程而设计。它建立到/v1/responses端点的持久WebSocket连接,允许开发人员保持其应用程序与OpenAI模型之间的持续通信。此模式与零数据保留(ZDR)和store=false选项完全兼容,使其适用于有状态和无状态的实现,同时保持数据隐私要求。
OpenAI WebSocket Mode for Responses API 的主要功能
OpenAI WebSocket 模式用于 Responses API 是一种专门的通信协议,它为长时间运行、工具调用繁重的工作流程启用持久连接。它为最近的响应维护一个连接本地的内存缓存,允许客户端仅发送带有 previous_response_id 的增量输入,而不是每次都重新发送完整的上下文。对于具有 20 多个工具调用的工作流程,此模式可以将端到端执行速度提高高达 40%,同时保持与零数据保留 (ZDR) 和 store=false 选项的兼容性。
持久连接: 维护单个 WebSocket 连接长达 60 分钟,无需为每次交互建立新的 HTTP 连接
增量输入处理: 允许仅发送新的输入项加上 previous_response_id,而不是重新发送整个对话上下文
连接本地缓存: 在内存中维护最近的响应状态,以便更快地访问,同时保持与零数据保留要求的兼容性
可选的预热请求: 支持 generate:false 请求以提前准备服务器端状态,从而减少后续轮次的延迟
OpenAI WebSocket Mode for Responses API 的使用场景
AI 驱动的代码开发: 支持高效的编码辅助工作流程,其中 AI 代理进行多次顺序工具调用,以读取文件、编写代码和测试
复杂的自动化管道: 支持需要多次工具交互和编排步骤的长时间运行的自动化任务,并减少延迟
多步骤推理系统: 促进复杂的解决问题场景,其中 AI 需要做出多个顺序决策和工具调用
实时代理工作流程: 为交互式 AI 代理提供支持,这些代理需要保持上下文,同时执行多个操作以响应用户输入
优点
显着减少工具繁重的工作流程的延迟(速度提高高达 40%)
通过仅发送增量更新来减少带宽使用
与现有的安全功能(如 ZDR 和 store=false)兼容
缺点
限制为 60 分钟的连接持续时间,需要重新连接
不支持单个连接内的并行响应处理
需要额外的错误处理来管理和恢复连接
如何使用 OpenAI WebSocket Mode for Responses API
安装所需依赖: 使用以下命令为Python安装websocket-client库:pip install websocket-client
导入库: 导入所需的库:websocket、json和os,用于环境变量
创建WebSocket连接: 使用API密钥在标头中建立到OpenAI端点'wss://api.openai.com/v1/responses'的WebSocket连接
发送初始响应创建事件: 发送第一个response.create事件,其中包含模型、存储标志、初始输入消息和工具数组。不要包含stream或background字段
可选:预热请求状态: 可选地发送带有generate:false的response.create,以准备服务器状态,以便在不生成输出的情况下进行即将到来的请求
继续对话: 发送后续的response.create事件,其中包含previous_response_id和仅新的输入项(工具输出、新消息)
处理连接限制: 监控60分钟的连接限制,并在需要时重新连接。一次只能有一个响应在进行中
处理重新连接: 重新连接时:继续使用previous_response_id(如果store=true),启动新响应,或使用来自/responses/compact的压缩上下文
处理错误: 适当处理previous_response_not_found和websocket_connection_limit_reached错误
关闭连接: 完成使用后关闭WebSocket连接,使用ws.close()
OpenAI WebSocket Mode for Responses API 常见问题
WebSocket模式是OpenAI的Responses API的一项功能,它支持持久连接,适用于长时间运行、工具调用繁重的工作流程。它的主要优势包括减少每次转换的持续开销,并改善长链中的端到端延迟。对于具有20个以上工具调用的工作流程,它可以实现高达40%的端到端执行速度提升。











