OpenAI улучшает ChatGPT с помощью расширенного голосового режима
25 сентября 2024 года (сегодня) компания OpenAI сделала значительный шаг вперед в создании более естественного и увлекательного взаимодействия с ИИ, выпустив расширенный голосовой режим (Advanced Voice Mode, AVM) для ChatGPT. Эта новая функция, изначально доступная клиентам уровней Plus и Teams, представляет собой значительный прогресс в технологии разговорного ИИ.
(Пост в Twitter о выпуске расширенного голосового режима ChatGPT: https://twitter.com/OpenAI/status/1838642444365369814)
Ключевые особенности расширенного голосового режима ChatGPT
- Расширенные голосовые опции
ChatGPT теперь предлагает пользователям выбор из пяти новых голосов: Arbor, Maple, Sol, Spruce и Vale. Эти голоса, вдохновленные природой, присоединяются к существующему списку, доводя общее количество до девяти различных голосовых опций. Это расширение позволяет пользователям настраивать свой опыт взаимодействия с ИИ, делая разговоры более личными и адаптированными к индивидуальным предпочтениям.
- Улучшенный поток разговора
OpenAI заявляет о значительных улучшениях AVM с момента начальной фазы альфа-тестирования. Система теперь обладает улучшенными возможностями распознавания акцентов и более плавными, быстрыми разговорами. Эти обновления направлены на уменьшение сбоев и создание более плавного взаимодействия между пользователями и ИИ.
- Визуальный редизайн
Расширенный голосовой режим имеет новое визуальное представление в виде синей анимированной сферы, заменяющей предыдущие анимированные черные точки. Этот редизайн придает интерфейсу свежий, современный вид, делая его более визуально привлекательным и интуитивно понятным для пользователей.
Пользовательские инструкции и память расширенного голосового режима ChatGPT
OpenAI интегрировала две мощные функции из текстового ChatGPT в AVM:
- Пользовательские инструкции: Пользователи могут персонализировать то, как ChatGPT отвечает им, создавая более индивидуальный опыт взаимодействия.
- Память: Эта функция позволяет ChatGPT запоминать и ссылаться на предыдущие разговоры, обеспечивая более контекстуальные и релевантные ответы со временем.
Эти дополнения значительно улучшают способность ИИ предоставлять персонализированные и контекстно-зависимые ответы в голосовых взаимодействиях.
Развертывание и доступность расширенного голосового режима ChatGPT
Развертывание расширенного голосового режима проводится в несколько этапов:
- Изначально доступен для клиентов ChatGPT Plus и Teams с 24 сентября 2024 года
- Клиенты Enterprise и Edu получат доступ начиная со следующей недели
- Пока недоступен в нескольких регионах, включая ЕС, Великобританию, Швейцарию, Исландию, Норвегию и Лихтенштейн
Этот поэтапный подход позволяет OpenAI отслеживать производительность и собирать отзывы пользователей по мере расширения доступности функции.
Будущие разработки OpenAI
Хотя текущий выпуск сосредоточен на голосовых взаимодействиях, OpenAI намекнула на будущие улучшения. Во время весеннего обновления компания продемонстрировала возможности видео и демонстрации экрана для GPT-4o, позволяющие одновременно обрабатывать визуальную и звуковую информацию. Хотя эти функции не включены в данный релиз, они предполагают захватывающую дорожную карту для будущих обновлений.
Часто задаваемые вопросы
★Как получить доступ к расширенному голосовому режиму?
Расширенный голосовой режим в настоящее время развертывается для пользователей ChatGPT Plus и Team. Вы можете проверить, есть ли у вас доступ, посмотрев на значок голоса в нижнем правом углу экрана в приложении ChatGPT.
★Могу ли я использовать расширенный голосовой режим с GPT?
Нет, расширенный голосовой режим пока недоступен для использования с GPT. Если вы попытаетесь провести расширенный голосовой разговор с GPT, вас перенаправят на начало нового чата с использованием стандартного голоса.
★Есть ли ограничения на использование расширенного голосового режима?
Да, использование расширенного голосового режима (аудиовходы и выходы) ограничено ежедневно для пользователей Plus и Team. Точные лимиты могут меняться.
★Доступен ли расширенный голосовой режим во всех регионах?
Нет, по состоянию на 25 сентября 2024 года расширенный голосовой режим пока недоступен в ЕС, Великобритании, Швейцарии, Исландии, Норвегии и Лихтенштейне.
Внедрение расширенного голосового режима знаменует собой важную веху в эволюции разговорных интерфейсов на основе ИИ. Делая взаимодействие с ИИ более естественным, персонализированным и доступным, OpenAI прокладывает путь для более широкого внедрения и разнообразного применения технологии ИИ в повседневной жизни.
Чтобы быть в курсе последних разработок в области ИИ и изучить передовые инструменты ИИ, посетите AIPURE(https://aipure.ai/) для получения исчерпывающей информации и ресурсов.