OpenAI verbessert ChatGPT mit erweitertem Sprachmodus
Am 25. September 2024 machte OpenAI einen bedeutenden Schritt vorwärts, um KI-Interaktionen natürlicher und ansprechender zu gestalten, indem sie den erweiterten Sprachmodus (Advanced Voice Mode, AVM) für ChatGPT einführten. Diese neue Funktion, die zunächst für Plus- und Teams-Kunden verfügbar ist, stellt einen großen Fortschritt in der Technologie der Konversations-KI dar.
(ChatGPT Advanced Voice Mode Release Twitter-Beitrag: https://twitter.com/OpenAI/status/1838642444365369814)
Hauptmerkmale des ChatGPT Advanced Voice Mode
- Erweiterte Sprachoptionen
ChatGPT bietet Benutzern jetzt die Auswahl aus fünf neuen Stimmen: Arbor, Maple, Sol, Spruce und Vale. Diese von der Natur inspirierten Stimmen ergänzen die bestehende Auswahl und bringen die Gesamtzahl auf neun verschiedene Sprachoptionen. Diese Erweiterung ermöglicht es Benutzern, ihre KI-Interaktionserfahrung anzupassen und macht Gespräche persönlicher und auf individuelle Vorlieben zugeschnitten.
- Verbesserter Gesprächsfluss
OpenAI gibt an, seit der anfänglichen Alpha-Testphase erhebliche Verbesserungen am AVM vorgenommen zu haben. Das System verfügt nun über verbesserte Akzenterkennungsfähigkeiten und reibungslosere, schnellere Gespräche. Diese Verbesserungen zielen darauf ab, Störungen zu reduzieren und eine nahtlosere Interaktion zwischen Benutzern und der KI zu schaffen.
- Visuelles Redesign
Der erweiterte Sprachmodus verfügt über eine neue visuelle Darstellung in Form einer blauen animierten Kugel, die die vorherigen animierten schwarzen Punkte ersetzt. Dieses Redesign verleiht der Benutzeroberfläche ein frisches, modernes Aussehen und macht sie visuell ansprechender und intuitiver für die Benutzer.
Benutzerdefinierte Anweisungen und Speicher des ChatGPT Advanced Voice Mode
OpenAI hat zwei leistungsstarke Funktionen aus dem textbasierten ChatGPT in AVM integriert:
- Benutzerdefinierte Anweisungen: Benutzer können personalisieren, wie ChatGPT auf sie reagiert, und so eine maßgeschneidertere Interaktionserfahrung schaffen.
- Speicher: Diese Funktion ermöglicht es ChatGPT, sich an frühere Gespräche zu erinnern und darauf Bezug zu nehmen, was im Laufe der Zeit kontextbezogenere und relevantere Antworten ermöglicht.
Diese Ergänzungen verbessern die Fähigkeit der KI erheblich, personalisierte und kontextbezogene Antworten in Sprachinteraktionen zu geben.
Einführung und Verfügbarkeit des ChatGPT Advanced Voice Mode
Die Einführung des erweiterten Sprachmodus erfolgt in Phasen:
- Zunächst ab dem 24. September 2024 für ChatGPT Plus- und Teams-Kunden verfügbar
- Enterprise- und Edu-Kunden erhalten in der folgenden Woche Zugang
- Noch nicht in mehreren Regionen verfügbar, einschließlich EU, UK, Schweiz, Island, Norwegen und Liechtenstein
Dieser phasenweise Ansatz ermöglicht es OpenAI, die Leistung zu überwachen und Benutzerfeedback zu sammeln, während sie die Verfügbarkeit der Funktion erweitern.
Zukünftige Entwicklungen von OpenAI
Während sich die aktuelle Einführung auf Sprachinteraktionen konzentriert, hat OpenAI auf zukünftige Erweiterungen hingedeutet. Während ihres Frühlings-Updates präsentierte das Unternehmen Video- und Bildschirmfreigabefunktionen für GPT-4o, die eine gleichzeitige Verarbeitung von visuellen und hörbaren Informationen ermöglichen. Obwohl diese Funktionen in dieser Version nicht enthalten sind, deuten sie auf eine spannende Roadmap für zukünftige Updates hin.
Häufig gestellte Fragen
★Wie greife ich auf den erweiterten Sprachmodus zu?
Der erweiterte Sprachmodus wird derzeit für ChatGPT Plus- und Team-Benutzer eingeführt. Sie können überprüfen, ob Sie Zugang haben, indem Sie nach dem Sprachsymbol unten rechts auf dem Bildschirm in der ChatGPT-App suchen.
★Kann ich den erweiterten Sprachmodus mit GPTs verwenden?
Nein, der erweiterte Sprachmodus ist noch nicht für die Verwendung mit GPTs verfügbar. Wenn Sie versuchen, ein erweitertes Sprachgespräch mit einem GPT zu führen, werden Sie umgeleitet, um einen neuen Chat mit der Standardsprache zu beginnen.
★Gibt es Nutzungsbeschränkungen für den erweiterten Sprachmodus?
Ja, die Nutzung des erweiterten Sprachmodus (Audio-Eingaben und -Ausgaben) ist für Plus- und Team-Benutzer täglich begrenzt. Die genauen Grenzen können sich ändern.
★Ist der erweiterte Sprachmodus in allen Regionen verfügbar?
Nein, zum Zeitpunkt der Einführung am 25. September 2024 ist der erweiterte Sprachmodus noch nicht in der EU, UK, Schweiz, Island, Norwegen und Liechtenstein verfügbar.
Die Einführung des erweiterten Sprachmodus markiert einen bedeutenden Meilenstein in der Entwicklung von KI-gesteuerten Konversationsschnittstellen. Indem KI-Interaktionen natürlicher, personalisierter und zugänglicher gestaltet werden, ebnet OpenAI den Weg für eine breitere Akzeptanz und vielfältigere Anwendungen der KI-Technologie im Alltag.
Um über die neuesten KI-Entwicklungen auf dem Laufenden zu bleiben und modernste KI-Tools zu erkunden, besuchen Sie AIPURE(https://aipure.ai/) für umfassende Informationen und Ressourcen.