OpenAI 于9月在 ChatGPT 的 iOS 和 Android 应用程序中推出了高级语音模式,现在这一功能也在网页上推出。
确实,OpenAI 的官方 Twitter 账号今天(2024年11月20日)宣布了一项新的高级语音更新。这一更新正在向所有付费用户推出,适用于 ChatGPT 桌面平台,网址为 http://chatgpt.com。
ChatGPT 高级语音模式:自然对话流程
ChatGPT 高级语音模式利用了 OpenAI 的 GPT-4o 模型,旨在促进流畅和动态的对话。用户可以不受传统文本输入的限制进行对话,使互动更加个性化和响应迅速。系统可以解释非语言线索,如语速和情感音调,从而相应地调整回应。这一功能通过使对话更加细腻和相关,增强了整体用户体验。
ChatGPT 高级语音模式:多种语音选项
用户可以在 ChatGPT 语音模式中选择九种不同的语音配置文件,每种都有自己独特的性格和音调。例如,“Arbor”提供了一种轻松的氛围,而“Ember”则传达了自信和乐观。这种多样性使用户可以根据偏好或上下文个性化互动,进一步丰富对话体验。
ChatGPT 高级语音模式:实时互动
ChatGPT 高级语音模式的一个突出特点是能够无缝处理中断。用户可以在 AI 说话中途打断,这是对之前版本需要点击屏幕进行互动的重大改进。这一功能模仿了自然的人类对话模式,使与 ChatGPT 的交流更加自然。
ChatGPT 高级语音模式:未来增强功能
OpenAI 计划通过集成情感检测和情境感知回应等功能,不断改进 ChatGPT 高级语音模式。这些增强功能旨在创造更加个性化的互动,使 AI 不仅基于文字,还能根据用户的情感状态作出回应。此外,还在不断努力改进各种语言的发音,使工具能够惠及更广泛的受众。
ChatGPT 高级语音模式:可访问性和可用性
目前,ChatGPT 高级语音模式仅向 ChatGPT 的 Plus(每月20美元)、Team(每月30美元)和 Enterprise 计划的付费订阅者开放。OpenAI 表示,将在未来几周内逐步向免费用户开放访问,使更多受众能够体验这一前沿功能。然而,某些地理限制适用;欧盟和英国等地区的用户可能由于监管考虑而无法立即访问。
结论
OpenAI 在网页上推出 ChatGPT 高级语音模式,标志着 AI 技术的重大进步,为用户提供了一种更加吸引人和类人的互动体验。随着语音通信在 AI 应用中的日益集成,这一功能为我们的机器互动方式设定了新的标准。对于那些对 AI 发展和类似工具感兴趣的用户,可以访问 AIPURE 以获取更多见解和资源。