OpenAI начала развертывание своего долгожданного режима Advanced Voice Mode для подписчиков ChatGPT Plus. Эта новая функция, обещающая сверхреалистичные аудиоответы и способность определять эмоциональные интонации, знаменует собой значительный шаг вперед в технологии искусственного интеллекта для голосового общения.
Advanced Voice Mode: Новая эра для ChatGPT
Режим Advanced Voice Mode от OpenAI, впервые представленный в мае 2024 года, наконец начал поэтапное развертывание для избранной группы пользователей ChatGPT Plus. Эта новая функция предназначена для обеспечения более плавных и реалистичных разговоров, способных распознавать эмоциональные сигналы и реагировать на них. В отличие от предыдущего голосового режима, который опирался на три отдельные модели, новый мультимодальный GPT-4o может обрабатывать все задачи внутренне, уменьшая задержку и улучшая течение разговора.
Решение проблем с противоречиями и безопасностью
Запуск режима Advanced Voice Mode был отложен на месяц из-за проблем с безопасностью и противоречий. Первоначальная демонстрация включала голос, поразительно похожий на голос актрисы Скарлетт Йоханссон, что привело к судебным искам и общественному возмущению. С тех пор OpenAI удалила спорный голос и представила четыре новых предустановленных голоса — Juniper, Breeze, Cove и Ember — созданных в сотрудничестве с профессиональными актерами озвучивания.
Для обеспечения безопасности OpenAI внедрила строгие протоколы тестирования. Более 100 внешних экспертов, говорящих на 45 различных языках, протестировали голосовую модель. Кроме того, были введены новые фильтры для блокировки запросов на генерацию защищенного авторским правом аудио или вредоносного контента.
Функции и пользовательский опыт
Режим Advanced Voice Mode предлагает несколько инновационных функций:
- Разговоры в реальном времени: Пользователи могут вести более естественные и плавные разговоры с возможностью прерывать и направлять чат-бота в реальном времени.
- Определение эмоциональной интонации: Модель может распознавать различные эмоциональные сигналы и реагировать на них, делая взаимодействие более увлекательным и реалистичным.
- Простота использования: Пользователи могут легко активировать голосовой режим, выбрав значок голоса рядом со значком микрофона в приложении ChatGPT. Функция также включает опции отключения или включения микрофона и плавного завершения разговоров.
Перспективы на будущее и более широкое влияние
OpenAI планирует постепенно расширить доступ к режиму Advanced Voice Mode для всех пользователей ChatGPT Plus к осени 2024 года. Компания также изучает дополнительные функциональные возможности, такие как видео и возможности совместного использования экрана, запуск которых ожидается позже.
Внедрение этой передовой голосовой технологии открывает множество возможностей для различных приложений, от обслуживания клиентов до персональных помощников. Однако это также поднимает важные этические вопросы и вопросы безопасности, особенно в отношении потенциального злоупотребления синтетическими голосами.
В заключение, режим Advanced Voice Mode от OpenAI представляет собой значительный этап в технологии искусственного интеллекта для голосового общения, предлагая более реалистичные и эмоционально осознанные взаимодействия. По мере того как OpenAI продолжает совершенствовать и расширять эту функцию, будет крайне важно найти баланс между инновациями и этическими соображениями для обеспечения безопасного и полезного использования.
Для получения дополнительной информации о последних разработках и инструментах в области ИИ посетите AIPURE.