OpenAI улучшает ChatGPT с помощью расширенного голосового режима
25 сентября 2024 года OpenAI сделала значительный шаг вперед в создании более естественного и увлекательного взаимодействия с ИИ, запустив Advanced Voice Mode (AVM) для ChatGPT. Эта новая функция, изначально доступная для клиентов уровней Plus и Teams, представляет собой значительный прогресс в технологии разговорного ИИ.
(Пост в Twitter о выпуске ChatGPT Advanced Voice Mode: https://twitter.com/OpenAI/status/1838642444365369814)
Ключевые особенности расширенного голосового режима ChatGPT
![]()
- Расширенные голосовые опции
ChatGPT теперь предлагает пользователям выбор из пяти новых голосов: Arbor, Maple, Sol, Spruce и Vale. Эти голоса, вдохновленные природой, присоединяются к существующей линейке, доводя общее количество до девяти различных голосовых опций. Это расширение позволяет пользователям настраивать свой опыт взаимодействия с ИИ, делая разговоры более личными и адаптированными к индивидуальным предпочтениям.
- Улучшенный поток разговора
OpenAI утверждает, что внесла значительные улучшения в AVM с момента начальной фазы альфа-тестирования. Система теперь обладает улучшенными возможностями распознавания акцентов и более плавными, быстрыми разговорами. Эти обновления направлены на уменьшение сбоев и создание более плавного взаимодействия между пользователями и ИИ.
- Визуальный редизайн
Расширенный голосовой режим имеет новое визуальное представление в виде синей анимированной сферы, заменяющей предыдущие анимированные черные точки. Этот редизайн придает интерфейсу свежий, современный вид, делая его более визуально привлекательным и интуитивно понятным для пользователей.
![]()
Пользовательские инструкции и память расширенного голосового режима ChatGPT
OpenAI интегрировала две мощные функции из текстового ChatGPT в AVM:
- Пользовательские инструкции: Пользователи могут персонализировать то, как ChatGPT отвечает им, создавая более индивидуальный опыт взаимодействия.
- Память: Эта функция позволяет ChatGPT запоминать и ссылаться на предыдущие разговоры, обеспечивая более контекстуальные и релевантные ответы с течением времени.
Эти дополнения значительно улучшают способность ИИ предоставлять персонализированные и контекстно-зависимые ответы в голосовых взаимодействиях.
![]()
Развертывание и доступность расширенного голосового режима ChatGPT
Развертывание расширенного голосового режима проводится в несколько этапов:
- Изначально доступен для клиентов ChatGPT Plus и Teams с 24 сентября 2024 года
- Клиенты Enterprise и Edu получат доступ начиная со следующей недели
- Пока недоступен в нескольких регионах, включая ЕС, Великобританию, Швейцарию, Исландию, Норвегию и Лихтенштейн
Этот поэтапный подход позволяет OpenAI отслеживать производительность и собирать отзывы пользователей по мере расширения доступности функции.
![]()
Будущие разработки OpenAI
Хотя текущее развертывание сосредоточено на голосовых взаимодействиях, OpenAI намекнула на будущие улучшения. Во время весеннего обновления компания продемонстрировала возможности видео и совместного использования экрана для GPT-4o, позволяющие одновременно обрабатывать визуальную и звуковую информацию. Хотя эти функции не включены в данный релиз, они предполагают захватывающую дорожную карту для будущих обновлений.
![]()
Часто задаваемые вопросы
![]()
★Как получить доступ к расширенному голосовому режиму?
Расширенный голосовой режим в настоящее время развертывается для пользователей ChatGPT Plus и Team. Вы можете проверить, есть ли у вас доступ, посмотрев на значок голоса в правом нижнем углу экрана в приложении ChatGPT.
★Могу ли я использовать расширенный голосовой режим с GPT?
Нет, расширенный голосовой режим пока недоступен для использования с GPT. Если вы попытаетесь провести расширенный голосовой разговор с GPT, вас перенаправят на начало нового чата с использованием стандартного голоса.
★Есть ли ограничения на использование расширенного голосового режима?
Да, использование расширенного голосового режима (аудиовходы и выходы) ограничено на ежедневной основе для пользователей Plus и Team. Точные лимиты могут меняться.
★Доступен ли расширенный голосовой режим во всех регионах?
Нет, по состоянию на 25 сентября 2024 года расширенный голосовой режим пока недоступен в ЕС, Великобритании, Швейцарии, Исландии, Норвегии и Лихтенштейне.
Внедрение расширенного голосового режима знаменует собой значительную веху в эволюции разговорных интерфейсов на основе ИИ. Делая взаимодействие с ИИ более естественным, персонализированным и доступным, OpenAI прокладывает путь для более широкого внедрения и разнообразного применения технологий ИИ в повседневной жизни.
Чтобы быть в курсе последних разработок в области ИИ и изучить передовые инструменты ИИ, посетите AIPURE(https://aipure.ai/) для получения исчерпывающей информации и ресурсов.



