
Sesame
Sesame ist ein KI-Startup, das bahnbrechende Konversationssprachtechnologie entwickelt, die darauf abzielt, mit ihrem natürlichen, emotional intelligenten Sprachmodell, das in einen echten Dialog treten kann, das Uncanny Valley zu überwinden.
https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice?ref=aipure&utm_source=aipure

Produktinformationen
Aktualisiert:Jun 9, 2025
Sesame Monatliche Traffic-Trends
Sesame verzeichnete einen 40,5%igen Rückgang des Verkehrs, wahrscheinlich aufgrund des Auslaufens seines HBO Max-Streaming-Vertrags im Dezember 2024, was seine Verfügbarkeit und Einnahmen erheblich reduzierte. Die darauf folgenden Entlassungen von etwa 20% der Belegschaft im März 2025 könnten die Contentproduktion und Marketingaktivitäten weiter beeinträchtigt haben.
Was ist Sesame
Sesame wurde vom ehemaligen Oculus VR CEO Brendan Iribe gegründet und wird von großen Investoren wie Andreessen Horowitz und Spark Capital unterstützt. Das Unternehmen revolutioniert die Mensch-KI-Interaktion durch sein Conversational Speech Model (CSM). Das Unternehmen hat KI-Sprachassistenten namens \'Maya\' und \'Miles\' entwickelt, die sich mit beispielloser emotionaler Ausdruckskraft und Gesprächsflüssigkeit an natürlichen Gesprächen beteiligen können. Ihre Technologie stellt einen bedeutenden Schritt nach vorn bei der Entwicklung von KI-Begleitern dar, die so klingen und interagieren, dass sie sich wirklich menschenähnlich anfühlen.
Hauptfunktionen von Sesame
Sesame ist ein bahnbrechendes KI-Sprachtechnologieunternehmen, das das Conversational Speech Model (CSM) entwickelt hat, das darauf abzielt, natürlichere und emotional intelligentere Sprachinteraktionen zu schaffen. Ihre Technologie kombiniert emotionale Intelligenz, Konversationsdynamik und kontextuelles Bewusstsein, um eine \'Sprachpräsenz\' zu erreichen - wodurch sich gesprochene Interaktionen real und wertgeschätzt anfühlen. Das Unternehmen plant, seine Modelle unter der Apache 2.0-Lizenz als Open-Source zu veröffentlichen und bietet derzeit eine Demo mit zwei KI-Stimmen (Maya und Miles) an, die bemerkenswert menschenähnliche Sprachfähigkeiten demonstrieren.
Emotionale Intelligenz: Fähigkeit, emotionale Kontexte zu lesen und darauf zu reagieren, wobei Ton und Ausdruck entsprechend angepasst werden
Echtzeit-Konversationsdynamik: Natürliches Timing, Pausen, Unterbrechungen und Betonungen in der Sprache, die menschliche Gesprächsmuster nachahmen
Kontextuelles Bewusstsein: Fähigkeit, Ton und Stil basierend auf der Situation und dem Gesprächsverlauf anzupassen
Multi-Speaker-Unterstützung: Bietet mehrere Sprachpersönlichkeiten (Maya und Miles) mit konsistenter und angemessener Präsenz
Anwendungsfälle von Sesame
Persönliche digitale Assistenten: Erstellung ansprechenderer und natürlich wirkender KI-Assistenten für alltägliche Aufgaben und Interaktionen
Kundenservice: Bereitstellung eines menschenähnlicheren automatisierten Kundensupports mit angemessenen emotionalen Reaktionen
Bildungstechnologie: Entwicklung ansprechenderer und reaktionsfähigerer virtueller Tutoren und Lernassistenten
Gesundheitskommunikation: Anbieten von einfühlsamen virtuellen Gesundheitsassistenten für die Patienteninteraktion und -unterstützung
Vorteile
Sehr natürliche und emotional ausdrucksstarke Sprachinteraktionen
Plant, Modelle unter der Apache 2.0-Lizenz als Open-Source zu veröffentlichen
Geringe Latenz und reibungslose Reaktionszeit
Nachteile
Derzeit hauptsächlich auf die englische Sprache beschränkt
Hat immer noch Probleme mit Unterbrechungen und Gesprächsfluss
Kann unrealistische Erwartungen an eine emotionale Verbindung mit KI wecken
Wie verwendet man Sesame
Besuchen Sie die Demoseite: Gehen Sie zu https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice#demo
Mikrofonzugriff erlauben: Erteilen Sie bei Aufforderung die Mikrofonberechtigung, um die Sprachinteraktion mit der KI zu ermöglichen
Wählen Sie einen KI-Begleiter aus: Wählen Sie entweder \'Maya\' oder \'Miles\' als Gesprächspartner aus
Beginnen Sie zu sprechen: Beginnen Sie, auf natürliche Weise mit dem KI-Begleiter zu sprechen. Das System antwortet in Echtzeit mit kontextuell angemessenen Antworten
Beachten Sie die Browseranforderungen: Verwenden Sie für beste Ergebnisse den Google Chrome-Browser. Die Audioqualität kann in iOS/Safari 17.5 beeinträchtigt sein
Beachten Sie die Aufzeichnungsrichtlinien: Beachten Sie, dass Anrufe zur Qualitätsprüfung aufgezeichnet, aber innerhalb von 30 Tagen gelöscht und nicht für ML-Training verwendet werden
Überprüfen Sie die Bedingungen: Durch die Nutzung der Demo stimmen Sie den Nutzungsbedingungen und der Datenschutzrichtlinie von Sesame zu
Sesame FAQs
CSM ist ein multimodales Text- und Sprachmodell, das darauf abzielt, \'Sprachpräsenz\' zu erreichen - wodurch sich gesprochene Interaktionen real, verstanden und wertgeschätzt anfühlen. Es verwendet Transformer, um natürlich klingende Gesprächssprache zu erzeugen, indem es Kontext, Emotionen und Prosodie versteht.
Beliebte Artikel

FLUX.1 Kontext Testbericht 2025: Das ultimative KI-Bildbearbeitungswerkzeug, das mit Photoshop konkurriert
Jun 5, 2025

FLUX.1 Kontext vs. Midjourney V7 vs. GPT-4o Image vs. Ideogram 3.0 im Jahr 2025: Ist FLUX.1 Kontext wirklich die beste KI für Bilderzeugung?
Jun 5, 2025

Wie man virale "Talking Baby Podcast"-Videos mit KI erstellt: Schritt-für-Schritt-Anleitung (2025)
Jun 3, 2025

Google Veo 3: Erster KI-Videogenerator mit nativer Audio-Unterstützung
May 28, 2025
Analyse der Sesame Website
Sesame Traffic & Rankings
3M
Monatliche Besuche
#20141
Globaler Rang
#1
Kategorie-Rang
Traffic-Trends: Jan 2025-May 2025
Sesame Nutzereinblicke
00:03:23
Durchschn. Besuchsdauer
3.28
Seiten pro Besuch
43.83%
Nutzer-Absprungrate
Top-Regionen von Sesame
US: 21.99%
VN: 15.84%
IN: 4.75%
BR: 3.75%
CA: 3.6%
Others: 50.08%