Google's Gemini Live Brings Advanced Voice Chat to Your Phone

Google представляет Gemini Live: Новая эра голосового ИИ

Google сделал значительный шаг в области разговорного ИИ с запуском Gemini Live, функции, которая позволяет пользователям вести полуестественные разговоры с ИИ-чатботом. Это разработка, представленная во время мероприятия Google's Made By Google в Маунтин-Вью, Калифорния, знаменует собой заметный прогресс в голосовых взаимодействиях с ИИ.

Nano Banana 2 (Gemini 3.1 Flash Image) - Official

Freemium

AI Photo & Image Generator

Nano Banana 2 (Gemini 3.1 Flash Image) - это новейшая современная модель Google для создания изображений, которая сочетает в себе качество Pro-уровня с производительностью Flash-скорости, предлагая улучшенную визуальную точность, интеграцию знаний о реальном мире и расширенные возможности редактирования.

Посетить сайт

Ключевые особенности и возможности Gemini Live

Естественные разговоры с ИИ

Gemini Live позволяет пользователям вести голосовые взаимодействия с новейшей языковой моделью Google. Функция обеспечивает время отклика менее двух секунд, создавая более плавный разговорный опыт. Пользователи могут прерывать ИИ на полуслове, что позволяет вести более динамичный и естественный диалог.

Разнообразные голосовые опции

Одной из выдающихся особенностей Gemini Live является наличие 10 различных голосовых опций, превосходящих три голоса, предлагаемых аналогичной функцией OpenAI. Google сотрудничал с актерами озвучивания для создания этих человекоподобных голосов, улучшая пользовательский опыт.

OpenAI: ChatGPT Atlas

Free Trial

Large Language Models (LLMs)

ChatGPT Atlas — это веб-браузер OpenAI на базе ИИ, который интегрирует ChatGPT непосредственно в процесс просмотра веб-страниц, позволяя пользователям взаимодействовать с ChatGPT в любом месте в Интернете, предоставляя такие функции, как обобщение веб-страниц, автоматизация задач и персонализированная помощь.

Посетить сайт

Обработка сложных запросов

Gemini Live демонстрирует впечатляющие возможности в обработке сложных запросов. Например, он успешно рекомендовал семейную винодельню недалеко от Маунтин-Вью с открытыми площадками и игровыми площадками поблизости, демонстрируя способность обрабатывать и отвечать на многоаспектные запросы.

Ограничения и области для улучшения Gemini Live

Хотя Gemini Live представляет собой значительный шаг вперед, он не лишен ограничений:

Случайные неточности

ИИ иногда предоставляет неточную информацию, например, упоминая несуществующие близлежащие места. Это подчеркивает постоянную проблему обеспечения надежных и точных ответов от систем ИИ.

Обработка прерываний

Хотя Google рекламирует возможность прерывать Gemini Live на полуслове, эта функция не всегда работает безупречно. Были случаи, когда ИИ и пользователи говорили одновременно, что указывает на необходимость улучшения управления разговором в реальном времени.

Ограниченные возможности

В отличие от некоторых конкурентов, Gemini Live не может петь или имитировать голоса за пределами предоставленных опций. Кроме того, он не фокусируется на понимании эмоциональной интонации в голосах пользователей, функции, которую исследуют некоторые другие ИИ-ассистенты.

Будущее Gemini Live

Google рассматривает Gemini Live как шаг к Project Astra, их амбициозной мультимодальной модели ИИ. Хотя в настоящее время он ограничен голосовыми разговорами, будущие итерации нацелены на включение понимания видео в реальном времени, что потенциально может революционизировать наше взаимодействие с ИИ-ассистентами.

Как получить доступ к Gemini Live

Gemini Live в настоящее время доступен подписчикам Gemini Advanced на устройствах Android. Эта премиум-услуга является частью плана Google One AI Premium, стоимость которого составляет 20 долларов в месяц. Для пользователей Pixel 9 Pro доступ к Gemini Advanced, включая Gemini Live, предоставляется бесплатно в течение первого года.

По мере того как ИИ продолжает менять наши цифровые взаимодействия, такие инструменты, как Gemini Live, прокладывают путь к более интуитивным и полезным цифровым ассистентам. Хотя технология все еще развивается, потенциал ИИ для улучшения нашей повседневной жизни становится все более очевидным.

Для тех, кто заинтересован в том, чтобы быть в курсе последних разработок в области ИИ и исследовать передовые инструменты ИИ, посетите AIPURE (https://aipure.ai/) для получения исчерпывающей информации и ресурсов в мире искусственного интеллекта.