Gemini Live de Google trae chat de voz avanzado a tu teléfono

Gemini Live de Google ofrece una experiencia de IA conversacional más natural y desafía a Siri y los modos de voz avanzados de OpenAI, pero no cumple con las expectativas en algunas áreas.

Rock Smith
Actualización 19/08/2024
Tabla de Contenidos

    Google presenta Gemini Live: Una nueva era de IA de voz

    Google ha dado un salto significativo en el ámbito de la IA conversacional con el lanzamiento de Gemini Live, una función que permite a los usuarios mantener conversaciones habladas semi-naturales con un chatbot de IA. Este desarrollo, presentado durante el evento Made by Google en Mountain View, California, marca un avance notable en las interacciones de IA basadas en voz.

    Gemini - Google Vids AI
    Gemini - Google Vids AI
    Gemini es la familia de modelos de IA multimodal más avanzada y capaz de Google que puede entender y razonar sin problemas a través de texto, imágenes, video, audio y código para impulsar diversas aplicaciones y servicios de IA.
    Visitar Sitio Web

    Características y capacidades clave de Gemini Live


    • Conversaciones naturales con IA

    Gemini Live permite a los usuarios tener interacciones basadas en voz con el último modelo de lenguaje de Google. La función cuenta con un tiempo de respuesta de menos de dos segundos, creando una experiencia conversacional más fluida. Los usuarios pueden interrumpir a la IA a mitad de frase, permitiendo un diálogo más dinámico y natural.

    Google Gemini Live

    • Opciones de voz versátiles

    Asistente de voz IA

    Una de las características destacadas de Gemini Live es su gama de 10 opciones de voz distintas, superando las tres voces ofrecidas por la función similar de OpenAI. Google colaboró con actores de voz para crear estas voces humanizadas, mejorando la experiencia del usuario.

    OpenAI - 12 Days of OpenAI
    OpenAI - 12 Days of OpenAI
    OpenAI es una empresa líder en investigación de inteligencia artificial que desarrolla modelos y tecnologías de IA avanzados para beneficiar a la humanidad.
    Visitar Sitio Web


    • Manejo de consultas complejas

    Gemini Live demuestra impresionantes capacidades en el manejo de consultas complejas. Por ejemplo, recomendó con éxito una bodega familiar cerca de Mountain View con áreas al aire libre y parques infantiles cercanos, mostrando su capacidad para procesar y responder a solicitudes multifacéticas.

    Gemini Advanced

    Limitaciones y áreas de mejora de Gemini Live

    Aunque Gemini Live representa un paso significativo hacia adelante, no está exento de limitaciones:

    • Inexactitudes ocasionales

    La IA a veces proporciona información inexacta, como mencionar ubicaciones cercanas inexistentes. Esto resalta el desafío continuo de garantizar respuestas confiables y precisas de los sistemas de IA.

    • Manejo de interrupciones

    Aunque Google promociona la capacidad de interrumpir a Gemini Live a mitad de frase, esta función no siempre funciona sin problemas. Hubo casos en los que la IA y los usuarios hablaban al mismo tiempo, lo que indica que hay margen de mejora en la gestión de conversaciones en tiempo real.

    modo de chat de voz

    • Capacidades limitadas

    A diferencia de algunos competidores, Gemini Live no puede cantar ni imitar voces más allá de sus opciones proporcionadas. Además, no se centra en comprender la entonación emocional en las voces de los usuarios, una característica que algunos otros asistentes de IA están explorando.

    Asistente de IA para Android

    El futuro de Gemini Live

    Google ve a Gemini Live como un paso hacia el Project Astra, su ambicioso modelo de IA multimodal. Aunque actualmente se limita a conversaciones de voz, las futuras iteraciones apuntan a incorporar la comprensión de video en tiempo real, revolucionando potencialmente cómo interactuamos con los asistentes de IA.

    lenguaje natural

    Cómo acceder a Gemini Live

    Gemini Live está actualmente disponible para los suscriptores de Gemini Advanced en dispositivos Android. Este servicio premium es parte del Plan Premium de IA de Google One, con un precio de $20 por mes. Para los usuarios de Pixel 9 Pro, el acceso a Gemini Advanced, incluyendo Gemini Live, está incluido gratis durante el primer año.

    Gemini Live de Google

    A medida que la IA continúa remodelando nuestras interacciones digitales, herramientas como Gemini Live están allanando el camino para asistentes digitales más intuitivos y útiles. Aunque la tecnología aún está evolucionando, el potencial de la IA para mejorar nuestra vida diaria es cada vez más claro.

    Para aquellos interesados en mantenerse al día con los últimos desarrollos de IA y explorar herramientas de IA de vanguardia, visita AIPURE (https://aipure.ai/) para obtener información completa y recursos en el mundo de la inteligencia artificial.

    Encuentra fácilmente la herramienta de IA que mejor se adapte a ti.
    ¡Encuentra Ahora!
    Datos de productos integrados
    Múltiples opciones
    Información abundante