
Sesame
Sesame es una startup de IA que desarrolla una innovadora tecnología de voz conversacional que tiene como objetivo cruzar el valle inquietante con su modelo de voz natural e inteligentemente emocional que puede participar en un diálogo genuino.
https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice?ref=aipure&utm_source=aipure

Información del Producto
Actualizado:09/06/2025
Tendencias de Tráfico Mensual de Sesame
Sesame experimentó una disminución del 40.5% en el tráfico, probablemente debido al vencimiento de su acuerdo de streaming con HBO Max en diciembre de 2024, lo que redujo significativamente su disponibilidad e ingresos. Los posteriores despidos de aproximadamente el 20% de su personal en marzo de 2025 pueden haber impactado aún más la producción de contenido y los esfuerzos de marketing.
¿Qué es Sesame?
Fundada por el ex CEO de Oculus VR, Brendan Iribe, y respaldada por importantes inversores como Andreessen Horowitz y Spark Capital, Sesame está revolucionando la interacción humano-IA a través de su Modelo de Voz Conversacional (CSM). La compañía ha desarrollado asistentes de voz de IA llamados 'Maya' y 'Miles' que pueden participar en conversaciones naturales con una expresividad emocional y fluidez conversacional sin precedentes. Su tecnología representa un importante paso adelante en la creación de compañeros de IA que suenan e interactúan de maneras que se sienten genuinamente humanas.
Características Principales de Sesame
Sesame es una empresa pionera en tecnología de voz con IA que ha desarrollado el Modelo de Voz Conversacional (CSM), cuyo objetivo es crear interacciones de voz más naturales y emocionalmente inteligentes. Su tecnología combina inteligencia emocional, dinámicas conversacionales y conciencia contextual para lograr la \'presencia de voz\', haciendo que las interacciones habladas se sientan reales y valiosas. La empresa planea ofrecer sus modelos de código abierto bajo la licencia Apache 2.0 y actualmente ofrece una demostración con dos voces de IA (Maya y Miles) que demuestran capacidades de habla notablemente similares a las humanas.
Inteligencia Emocional: Capacidad para leer y responder a contextos emocionales, ajustando el tono y la expresión en consecuencia
Dinámicas Conversacionales en Tiempo Real: Sincronización natural, pausas, interrupciones y énfasis en el habla que imitan los patrones de conversación humanos
Conciencia Contextual: Capacidad para ajustar el tono y el estilo según la situación y el historial de la conversación
Soporte Multi-interlocutor: Presenta múltiples personalidades de voz (Maya y Miles) con una presencia consistente y apropiada
Casos de Uso de Sesame
Asistentes Digitales Personales: Creación de asistentes de IA más atractivos y de sensación natural para tareas e interacciones diarias
Servicio al Cliente: Proporcionar soporte al cliente automatizado más humano con respuestas emocionales apropiadas
Tecnología Educativa: Desarrollo de tutores virtuales y asistentes de aprendizaje más atractivos y receptivos
Comunicación en el Ámbito de la Salud: Ofrecer asistentes virtuales de salud empáticos para la interacción y el apoyo al paciente
Ventajas
Interacciones de voz altamente naturales y emocionalmente expresivas
Planes para ofrecer modelos de código abierto bajo la licencia Apache 2.0
Baja latencia y tiempo de respuesta fluido
Desventajas
Actualmente limitado principalmente al idioma inglés
Todavía tiene problemas con las interrupciones y el flujo de la conversación
Puede crear expectativas poco realistas de conexión emocional con la IA
Cómo Usar Sesame
Visita la página de demostración: Ve a https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice#demo
Permite el acceso al micrófono: Cuando se te solicite, otorga permiso al micrófono para habilitar la interacción de voz con la IA
Elige un compañero de IA: Selecciona 'Maya' o 'Miles' como tu compañero de conversación
Comienza a hablar: Comienza a hablar naturalmente con el compañero de IA. El sistema responderá en tiempo real con respuestas contextualmente apropiadas
Ten en cuenta los requisitos del navegador: Para obtener los mejores resultados, utiliza el navegador Google Chrome. La calidad del audio puede verse degradada en iOS/Safari 17.5
Ten en cuenta la política de grabación: Ten en cuenta que las llamadas se graban para la revisión de la calidad, pero se eliminan en un plazo de 30 días y no se utilizan para el entrenamiento de ML
Revisa los términos: Al utilizar la demostración, aceptas los Términos de uso y la Política de privacidad de Sesame
Preguntas Frecuentes de Sesame
CSM es un modelo multimodal de texto y voz que tiene como objetivo lograr la \'presencia de voz\' - haciendo que las interacciones habladas se sientan reales, comprendidas y valoradas. Utiliza transformadores para generar un habla conversacional de sonido natural mediante la comprensión del contexto, la emoción y la prosodia.
Artículos Populares

Reseña de FLUX.1 Kontext 2025: La herramienta definitiva de edición de imágenes con IA que rivaliza con Photoshop
Jun 5, 2025

FLUX.1 Kontext vs Midjourney V7 vs GPT-4o Image vs Ideogram 3.0 en 2025: ¿Es FLUX.1 Kontext realmente la mejor IA para la generación de imágenes?
Jun 5, 2025

Cómo crear videos virales de podcasts de bebés parlantes con IA: Guía paso a paso (2025)
Jun 3, 2025

Google Veo 3: Primer Generador de Video con IA en Admitir Audio de Forma Nativa
May 28, 2025
Análisis del Sitio Web de Sesame
Tráfico y Clasificaciones de Sesame
3M
Visitas Mensuales
#20141
Clasificación Global
#1
Clasificación por Categoría
Tendencias de Tráfico: Jan 2025-May 2025
Información de Usuarios de Sesame
00:03:23
Duración Promedio de Visita
3.28
Páginas por Visita
43.83%
Tasa de Rebote de Usuarios
Principales Regiones de Sesame
US: 21.99%
VN: 15.84%
IN: 4.75%
BR: 3.75%
CA: 3.6%
Others: 50.08%