OpenAI为ChatGPT增强高级语音模式
在2024年9月25日,OpenAI通过为ChatGPT推出高级语音模式(Advanced Voice Mode,AVM),在使AI交互更加自然和吸引人方面迈出了重要一步。这项新功能最初向Plus和Teams级别的客户提供,代表了对话式AI技术的重大进步。
(ChatGPT高级语音模式发布Twitter帖子:https://twitter.com/OpenAI/status/1838642444365369814)
ChatGPT高级语音模式的主要特点
- 扩展的语音选项
ChatGPT现在为用户提供了五种新的语音选择:Arbor、Maple、Sol、Spruce和Vale。这些受自然启发的语音加入了现有阵容,使总数达到九种不同的语音选项。这种扩展允许用户定制他们的AI交互体验,使对话感觉更加个性化和适合个人偏好。
- 改进的对话流程
OpenAI声称自初始alpha测试阶段以来,对AVM进行了重大改进。该系统现在拥有增强的口音识别能力和更流畅、更快速的对话。这些升级旨在减少故障并创造用户与AI之间更无缝的交互。
- 视觉重新设计
高级语音模式以蓝色动画球体的形式呈现新的视觉表现,取代了之前的黑点动画。这种重新设计为界面提供了新鲜、现代的外观,使其对用户来说更具视觉吸引力和直观性。
ChatGPT高级语音模式的自定义指令和记忆功能
OpenAI将基于文本的ChatGPT的两个强大功能集成到了AVM中:
- 自定义指令:用户可以个性化ChatGPT对他们的回应方式,创造更加定制化的交互体验。
- 记忆:这项功能允许ChatGPT记住并引用之前的对话,随着时间的推移能够提供更具上下文和相关性的回应。
这些添加显著增强了AI在语音交互中提供个性化和上下文感知回应的能力。
ChatGPT高级语音模式的推出和可用性
高级语音模式的推出分阶段进行:
- 从2024年9月24日开始,最初向ChatGPT Plus和Teams级别的客户提供
- 企业和教育客户将从下周开始获得访问权限
- 尚未在包括欧盟、英国、瑞士、冰岛、挪威和列支敦士登在内的几个地区提供
这种分阶段的方法允许OpenAI在扩大功能可用性的同时监控性能并收集用户反馈。
OpenAI的未来发展
虽然当前的推出重点是语音交互,但OpenAI暗示了未来的增强。在他们的春季更新中,公司展示了GPT-4o的视频和屏幕共享功能,允许同时处理视觉和可听信息。尽管这些功能没有包含在此次发布中,但它们预示着未来更新的令人兴奋的路线图。
常见问题
★如何访问高级语音模式?
高级语音模式目前正在向ChatGPT Plus和Team用户推出。您可以通过查看ChatGPT应用程序屏幕右下角的语音图标来检查是否有访问权限。
★我可以在GPTs中使用高级语音模式吗?
不,高级语音模式目前还不能用于GPTs。如果您尝试与GPT进行高级语音对话,您将被重定向到使用标准语音开始新的聊天。
★高级语音模式有使用限制吗?
是的,对于Plus和Team用户,高级语音模式(音频输入和输出)的使用在每日基础上是有限制的。具体限制可能会发生变化。
★高级语音模式在所有地区都可用吗?
不,截至2024年9月25日的推出,高级语音模式在欧盟、英国、瑞士、冰岛、挪威和列支敦士登尚未提供。
高级语音模式的引入标志着AI驱动的对话界面演进的重要里程碑。通过使AI交互更加自然、个性化和易于访问,OpenAI正在为AI技术在日常生活中更广泛的应用和更多样化的应用铺平道路。
要及时了解最新的AI发展并探索尖端AI工具,请访问AIPURE(https://aipure.ai/)获取全面的信息和资源。