Gemini Live của Google Mang Trò Chuyện Bằng Giọng Nói Nâng Cao đến Điện Thoại của Bạn

Gemini Live của Google mang đến trải nghiệm AI hội thoại tự nhiên hơn và thách thức các chế độ giọng nói nâng cao của Siri và OpenAI, nhưng vẫn chưa đáp ứng được kỳ vọng ở một số lĩnh vực.

Rock Smith
Cập nhật Aug 19, 2024
Mục Lục

    Google ra mắt Gemini Live: Kỷ nguyên mới của AI giọng nói

    Google đã có một bước tiến quan trọng trong lĩnh vực AI hội thoại với việc ra mắt Gemini Live, một tính năng cho phép người dùng tham gia các cuộc trò chuyện bằng giọng nói gần như tự nhiên với một chatbot AI. Sự phát triển này, được công bố trong sự kiện Made By Google tại Mountain View, California, đánh dấu một bước tiến đáng kể trong tương tác AI dựa trên giọng nói.

    Gemini - Google Vids AI
    Gemini - Google Vids AI
    Gemini là gia đình mô hình AI đa phương thức tiên tiến và mạnh mẽ nhất của Google có thể hiểu và suy luận liền mạch qua văn bản, hình ảnh, video, âm thanh và mã để cung cấp sức mạnh cho nhiều ứng dụng và dịch vụ AI khác nhau.
    Truy cập Trang web

    Các tính năng và khả năng chính của Gemini Live


    • Cuộc trò chuyện tự nhiên với AI

    Gemini Live cho phép người dùng có tương tác bằng giọng nói với mô hình ngôn ngữ lớn mới nhất của Google. Tính năng này có thời gian phản hồi dưới hai giây, tạo ra trải nghiệm trò chuyện trôi chảy hơn. Người dùng có thể ngắt lời AI giữa câu, cho phép đối thoại năng động và tự nhiên hơn.

    Google Gemini Live

    • Các tùy chọn giọng nói đa dạng

    Trợ lý giọng nói AI

    Một trong những tính năng nổi bật của Gemini Live là phạm vi 10 tùy chọn giọng nói khác nhau, vượt qua ba giọng nói được cung cấp bởi tính năng tương tự của OpenAI. Google đã hợp tác với các diễn viên lồng tiếng để tạo ra những giọng nói giống con người này, nâng cao trải nghiệm người dùng.

    OpenAI - 12 Days of OpenAI
    OpenAI - 12 Days of OpenAI
    OpenAI là một công ty nghiên cứu trí tuệ nhân tạo hàng đầu phát triển các mô hình và công nghệ AI tiên tiến để mang lại lợi ích cho nhân loại.
    Truy cập Trang web


    • Xử lý truy vấn phức tạp

    Gemini Live thể hiện khả năng ấn tượng trong việc xử lý các truy vấn phức tạp. Ví dụ, nó đã thành công trong việc đề xuất một nhà máy rượu thân thiện với gia đình gần Mountain View với khu vực ngoài trời và sân chơi gần đó, thể hiện khả năng xử lý và phản hồi các yêu cầu đa diện.

    Gemini Advanced

    Hạn chế và các lĩnh vực cần cải thiện của Gemini Live

    Mặc dù Gemini Live đại diện cho một bước tiến quan trọng, nó không phải là không có hạn chế:

    • Đôi khi không chính xác

    AI đôi khi cung cấp thông tin không chính xác, chẳng hạn như đề cập đến các địa điểm gần đó không tồn tại. Điều này nhấn mạnh thách thức đang diễn ra trong việc đảm bảo phản hồi đáng tin cậy và chính xác từ các hệ thống AI.

    • Xử lý ngắt lời

    Mặc dù Google quảng cáo khả năng ngắt lời Gemini Live giữa câu, tính năng này không phải lúc nào cũng hoạt động trơn tru. Có những trường hợp AI và người dùng nói chồng lên nhau, cho thấy còn nhiều chỗ để cải thiện trong việc quản lý cuộc trò chuyện thời gian thực.

    chế độ trò chuyện bằng giọng nói

    • Khả năng hạn chế

    Không giống như một số đối thủ cạnh tranh, Gemini Live không thể hát hoặc bắt chước giọng nói ngoài các tùy chọn được cung cấp. Ngoài ra, nó không tập trung vào việc hiểu ngữ điệu cảm xúc trong giọng nói của người dùng, một tính năng mà một số trợ lý AI khác đang khám phá.

    Trợ lý AI Android

    Tương lai của Gemini Live

    Google xem Gemini Live như một bước đệm hướng tới Project Astra, mô hình AI đa phương thức tham vọng của họ. Trong khi hiện tại chỉ giới hạn ở các cuộc trò chuyện bằng giọng nói, các phiên bản trong tương lai nhằm mục đích kết hợp hiểu video thời gian thực, có khả năng cách mạng hóa cách chúng ta tương tác với các trợ lý AI.

    ngôn ngữ tự nhiên

    Cách truy cập Gemini Live

    Gemini Live hiện có sẵn cho người đăng ký Gemini Advanced trên các thiết bị Android. Dịch vụ cao cấp này là một phần của Gói Google One AI Premium, có giá 20 đô la mỗi tháng. Đối với người dùng Pixel 9 Pro, quyền truy cập vào Gemini Advanced, bao gồm cả Gemini Live, được miễn phí trong năm đầu tiên.

    Gemini Live của Google

    Khi AI tiếp tục định hình lại các tương tác kỹ thuật số của chúng ta, các công cụ như Gemini Live đang mở đường cho các trợ lý kỹ thuật số trực quan và hữu ích hơn. Mặc dù công nghệ vẫn đang phát triển, tiềm năng của AI trong việc nâng cao cuộc sống hàng ngày của chúng ta đang ngày càng rõ ràng.

    Đối với những người quan tâm đến việc cập nhật các phát triển AI mới nhất và khám phá các công cụ AI tiên tiến, hãy truy cập AIPURE (https://aipure.ai/) để có thông tin và tài nguyên toàn diện trong thế giới trí tuệ nhân tạo.

    Dễ dàng tìm công cụ AI phù hợp nhất với bạn.
    Tìm ngay!
    Dữ liệu sản phẩm tích hợp
    Nhiều lựa chọn
    Thông tin phong phú