OpenAI улучшает ChatGPT с помощью расширенного голосового режима
25 сентября 2024 года OpenAI сделала значительный шаг вперед в создании более естественного и увлекательного взаимодействия с ИИ, запустив Advanced Voice Mode (AVM) для ChatGPT. Эта новая функция, изначально доступная для клиентов уровней Plus и Teams, представляет собой значительный прогресс в технологии разговорного ИИ.
(Пост в Twitter о выпуске ChatGPT Advanced Voice Mode: https://twitter.com/OpenAI/status/1838642444365369814)
Ключевые особенности расширенного голосового режима ChatGPT
- Расширенные голосовые опции
ChatGPT теперь предлагает пользователям выбор из пяти новых голосов: Arbor, Maple, Sol, Spruce и Vale. Эти голоса, вдохновленные природой, присоединяются к существующей линейке, доводя общее количество до девяти различных голосовых опций. Это расширение позволяет пользователям настраивать свой опыт взаимодействия с ИИ, делая разговоры более личными и адаптированными к индивидуальным предпочтениям.
- Улучшенный поток разговора
OpenAI утверждает, что внесла значительные улучшения в AVM с момента начальной фазы альфа-тестирования. Система теперь обладает улучшенными возможностями распознавания акцентов и более плавными, быстрыми разговорами. Эти обновления направлены на уменьшение сбоев и создание более плавного взаимодействия между пользователями и ИИ.
- Визуальный редизайн
Расширенный голосовой режим имеет новое визуальное представление в виде синей анимированной сферы, заменяющей предыдущие анимированные черные точки. Этот редизайн придает интерфейсу свежий, современный вид, делая его более визуально привлекательным и интуитивно понятным для пользователей.
Пользовательские инструкции и память расширенного голосового режима ChatGPT
OpenAI интегрировала две мощные функции из текстового ChatGPT в AVM:
- Пользовательские инструкции: Пользователи могут персонализировать то, как ChatGPT отвечает им, создавая более индивидуальный опыт взаимодействия.
- Память: Эта функция позволяет ChatGPT запоминать и ссылаться на предыдущие разговоры, обеспечивая более контекстуальные и релевантные ответы с течением времени.
Эти дополнения значительно улучшают способность ИИ предоставлять персонализированные и контекстно-зависимые ответы в голосовых взаимодействиях.
Развертывание и доступность расширенного голосового режима ChatGPT
Развертывание расширенного голосового режима проводится в несколько этапов:
- Изначально доступен для клиентов ChatGPT Plus и Teams с 24 сентября 2024 года
- Клиенты Enterprise и Edu получат доступ начиная со следующей недели
- Пока недоступен в нескольких регионах, включая ЕС, Великобританию, Швейцарию, Исландию, Норвегию и Лихтенштейн
Этот поэтапный подход позволяет OpenAI отслеживать производительность и собирать отзывы пользователей по мере расширения доступности функции.
Будущие разработки OpenAI
Хотя текущее развертывание сосредоточено на голосовых взаимодействиях, OpenAI намекнула на будущие улучшения. Во время весеннего обновления компания продемонстрировала возможности видео и совместного использования экрана для GPT-4o, позволяющие одновременно обрабатывать визуальную и звуковую информацию. Хотя эти функции не включены в данный релиз, они предполагают захватывающую дорожную карту для будущих обновлений.
Часто задаваемые вопросы
★Как получить доступ к расширенному голосовому режиму?
Расширенный голосовой режим в настоящее время развертывается для пользователей ChatGPT Plus и Team. Вы можете проверить, есть ли у вас доступ, посмотрев на значок голоса в правом нижнем углу экрана в приложении ChatGPT.
★Могу ли я использовать расширенный голосовой режим с GPT?
Нет, расширенный голосовой режим пока недоступен для использования с GPT. Если вы попытаетесь провести расширенный голосовой разговор с GPT, вас перенаправят на начало нового чата с использованием стандартного голоса.
★Есть ли ограничения на использование расширенного голосового режима?
Да, использование расширенного голосового режима (аудиовходы и выходы) ограничено на ежедневной основе для пользователей Plus и Team. Точные лимиты могут меняться.
★Доступен ли расширенный голосовой режим во всех регионах?
Нет, по состоянию на 25 сентября 2024 года расширенный голосовой режим пока недоступен в ЕС, Великобритании, Швейцарии, Исландии, Норвегии и Лихтенштейне.
Внедрение расширенного голосового режима знаменует собой значительную веху в эволюции разговорных интерфейсов на основе ИИ. Делая взаимодействие с ИИ более естественным, персонализированным и доступным, OpenAI прокладывает путь для более широкого внедрения и разнообразного применения технологий ИИ в повседневной жизни.
Чтобы быть в курсе последних разработок в области ИИ и изучить передовые инструменты ИИ, посетите AIPURE(https://aipure.ai/) для получения исчерпывающей информации и ресурсов.