Sesame

Sesame

Sesame 是一家 AI 初创公司,致力于开发突破性的对话语音技术,旨在通过其自然、具有情商的语音模型来跨越恐怖谷,该模型可以进行真正的对话。
https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice?ref=aipure&utm_source=aipure
Sesame

产品信息

更新于:2025年05月16日

Sesame 月度流量趋势

Sesame 经历了51.0%的流量下降,这可能是由于涉及未经授权登录活动的数据隐私事件,该事件可能导致用户信息泄露。这一事件可能削弱了用户信任,导致访问量大幅下降。

查看历史流量

什么是 Sesame

Sesame 由前 Oculus VR 首席执行官 Brendan Iribe 创立,并得到 Andreessen Horowitz 和 Spark Capital 等主要投资者的支持,正在通过其对话语音模型 (CSM) 彻底改变人机交互。该公司开发了名为 \'Maya\' 和 \'Miles\' 的 AI 语音助手,它们可以进行自然的对话,具有前所未有的情感表达能力和对话流畅性。他们的技术代表了在创建听起来和互动方式都感觉真正像人类的 AI 伙伴方面迈出的重要一步。

Sesame 的主要功能

Sesame 是一家开创性的人工智能语音技术公司,该公司开发了会话语音模型 (CSM),旨在创建更自然、更具情感智能的语音交互。他们的技术结合了情感智能、会话动态和上下文感知,以实现“语音呈现”——使口语交互感觉真实且有价值。该公司计划在 Apache 2.0 许可下开源他们的模型,目前提供了一个演示,其中包含两种人工智能声音(Maya 和 Miles),它们展示了非常类似人类的语音功能。
情感智能: 能够阅读和响应情感环境,并相应地调整语气和表达
实时会话动态: 语音中自然的 timing、停顿、中断和强调,模仿人类的会话模式
上下文感知: 能够根据情况和会话历史调整语气和风格
多说话人支持: 具有多种语音个性(Maya 和 Miles),具有一致且适当的呈现

Sesame 的使用场景

个人数字助理: 为日常任务和互动创建更具吸引力和自然感觉的人工智能助理
客户服务: 提供更像人类的自动化客户支持,并具有适当的情感反应
教育技术: 开发更具吸引力和响应性的虚拟导师和学习助手
医疗保健沟通: 为患者互动和支持提供具有同理心的虚拟健康助手

优点

高度自然且富有情感表现力的语音交互
计划在 Apache 2.0 许可下开源模型
低延迟和平滑的响应时间

缺点

目前主要限于英语
在中断和会话流程方面仍然存在问题
可能会产生对人工智能情感连接的不切实际的期望

如何使用 Sesame

访问演示页面: 转到 https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice#demo
允许麦克风访问: 出现提示时,授予麦克风权限以启用与 AI 的语音互动
选择一个 AI 伙伴: 选择 \'Maya\' 或 \'Miles\' 作为您的对话伙伴
开始说话: 开始与 AI 伙伴自然地交谈。系统将实时响应,并提供符合上下文的回复
注意浏览器要求: 为了获得最佳效果,请使用 Google Chrome 浏览器。在 iOS/Safari 17.5 中,音频质量可能会降低
了解录音政策: 请注意,通话会被录音以进行质量审查,但会在 30 天内删除,不会用于 ML 训练
查看条款: 使用演示版即表示您同意 Sesame 的使用条款和隐私政策

Sesame 常见问题

CSM是一个多模态文本和语音模型,旨在实现“语音呈现”——使口语互动感觉真实、被理解和被重视。它使用transformers通过理解上下文、情感和韵律来生成听起来自然的对话语音。

Sesame 网站分析

Sesame 流量和排名
5.1M
每月访问量
#13310
全球排名
#1
类别排名
流量趋势:Jan 2025-Apr 2025
Sesame 用户洞察
00:03:55
平均访问时长
2.78
每次访问页数
47.91%
用户跳出率
Sesame 的热门地区
  1. US: 25.42%

  2. VN: 7.71%

  3. IN: 5.25%

  4. GB: 3.83%

  5. CA: 3.57%

  6. Others: 54.22%

与 Sesame 类似的最新 AI 工具

Advanced Voice
Advanced Voice
Advanced Voice 是 ChatGPT 的前沿语音交互功能,支持实时、自然的语音对话,具有自定义指令、多种语音选项和改进的口音,实现无缝的人机通信。
Vagent
Vagent
Vagent是一个轻量级的语音接口,使用户可以通过语音命令与自定义AI代理互动,提供了一种自然和直观的方式来控制自动化,支持60多种语言。
Vapify
Vapify
Vapify 是一个白标平台,使代理机构能够在保持客户关系控制和最大化收入的同时,以自己的品牌提供 Vapi.ai 的语音 AI 解决方案。
Wedding Speech Genie
Wedding Speech Genie
婚礼演讲精灵是一款AI驱动的平台,通过生成3个基于你输入的定制版本,在几分钟内创建个性化的婚礼演讲,帮助演讲者为任何婚礼角色发表难忘的祝酒词。