OpenAI giới thiệu Chế độ Giọng nói Siêu thực cho Người dùng ChatGPT Plus

Chế độ Giọng nói Nâng cao mới của OpenAI cho ChatGPT đang được triển khai cho một số người dùng được chọn, cung cấp phản hồi âm thanh siêu thực và khả năng phát hiện ngữ điệu cảm xúc.

Kennedy Johnson
Cập nhật Aug 12, 2024

OpenAI đã bắt đầu triển khai Chế độ Giọng nói Nâng cao được mong đợi từ lâu cho người đăng ký ChatGPT Plus. Tính năng mới này, hứa hẹn phản hồi âm thanh siêu thực và khả năng phát hiện ngữ điệu cảm xúc, đánh dấu một bước tiến quan trọng trong công nghệ giọng nói AI.

ChatGPT
ChatGPT
ChatGPT là một chatbot tiên tiến được phát triển bởi OpenAI, sử dụng xử lý ngôn ngữ tự nhiên để tham gia vào các cuộc trò chuyện giống như con người và hỗ trợ một loạt các nhiệm vụ.
Truy cập Trang web


Mục Lục

    Chế độ Giọng nói Nâng cao: Kỷ nguyên Mới cho ChatGPT

    Chế độ Giọng nói Nâng cao của OpenAI, được giới thiệu lần đầu vào tháng 5 năm 2024, cuối cùng đã bắt đầu triển khai theo từng giai đoạn cho một nhóm người dùng ChatGPT Plus được chọn. Tính năng mới này được thiết kế để cung cấp các cuộc hội thoại trôi chảy và thực tế hơn, có khả năng phát hiện và phản ứng với các dấu hiệu cảm xúc. Không giống như chế độ giọng nói trước đây, vốn dựa vào ba mô hình riêng biệt, GPT-4o đa phương thức mới có thể xử lý tất cả các tác vụ nội bộ, giảm độ trễ và nâng cao tính liên tục của cuộc hội thoại.

    Chế độ Giọng nói Nâng cao

    Giải quyết Tranh cãi và Mối lo ngại về An toàn

    Việc ra mắt Chế độ Giọng nói Nâng cao đã bị trì hoãn một tháng do những lo ngại về an toàn và tranh cãi. Bản demo ban đầu có giọng nói giống đáng kinh ngạc với nữ diễn viên Scarlett Johansson, dẫn đến các hành động pháp lý và phản đối của công chúng. OpenAI đã loại bỏ giọng nói gây tranh cãi và giới thiệu bốn giọng nói cài đặt sẵn mới—Juniper, Breeze, Cove và Ember—được tạo ra với sự hợp tác của các diễn viên lồng tiếng chuyên nghiệp.

    ChatGPT

    Để đảm bảo an toàn, OpenAI đã triển khai các quy trình kiểm tra nghiêm ngặt. Hơn 100 chuyên gia bên ngoài, nói 45 ngôn ngữ khác nhau, đã kiểm tra mô hình giọng nói. Ngoài ra, các bộ lọc mới đã được giới thiệu để chặn các yêu cầu tạo âm thanh có bản quyền hoặc nội dung có hại.

    Tính năng và Trải nghiệm Người dùng

    Chế độ Giọng nói Nâng cao cung cấp một số tính năng đổi mới:

    • Hội thoại Thời gian Thực: Người dùng có thể tham gia vào các cuộc hội thoại tự nhiên và trôi chảy hơn, với khả năng ngắt lời và nhắc nhở chatbot trong thời gian thực.
    • Phát hiện Ngữ điệu Cảm xúc: Mô hình có thể phát hiện và phản ứng với các dấu hiệu cảm xúc khác nhau, làm cho tương tác trở nên hấp dẫn và sống động hơn.
    • Dễ sử dụng: Người dùng có thể dễ dàng kích hoạt chế độ giọng nói bằng cách chọn biểu tượng giọng nói bên cạnh biểu tượng micrô trong ứng dụng ChatGPT. Tính năng này cũng bao gồm các tùy chọn để tắt tiếng hoặc bật tiếng micrô và kết thúc cuộc hội thoại một cách liền mạch.

    giọng nói tổng hợp

    Triển vọng Tương lai và Tác động Rộng lớn hơn

    OpenAI có kế hoạch mở rộng dần quyền truy cập vào Chế độ Giọng nói Nâng cao cho tất cả người dùng ChatGPT Plus vào mùa thu năm 2024. Công ty cũng đang khám phá các chức năng bổ sung, như khả năng chia sẻ video và màn hình, dự kiến sẽ ra mắt vào một ngày sau đó.

    Việc giới thiệu công nghệ giọng nói nâng cao này mở ra nhiều khả năng cho các ứng dụng khác nhau, từ dịch vụ khách hàng đến trợ lý cá nhân. Tuy nhiên, nó cũng đặt ra những cân nhắc quan trọng về đạo đức và an toàn, đặc biệt là liên quan đến khả năng lạm dụng giọng nói tổng hợp.

    OpenAI Giới thiệu Chế độ Giọng nói Siêu thực

    Tóm lại, Chế độ Giọng nói Nâng cao của OpenAI đại diện cho một cột mốc quan trọng trong công nghệ giọng nói AI, cung cấp tương tác thực tế hơn và nhận thức được cảm xúc. Khi OpenAI tiếp tục hoàn thiện và mở rộng tính năng này, việc cân bằng giữa đổi mới và cân nhắc đạo đức sẽ là điều quan trọng để đảm bảo sử dụng an toàn và có lợi.

    Để biết thêm thông tin về các phát triển và công cụ AI mới nhất, hãy truy cập AIPURE.

    Dễ dàng tìm công cụ AI phù hợp nhất với bạn.
    Tìm ngay!
    Dữ liệu sản phẩm tích hợp
    Nhiều lựa chọn
    Thông tin phong phú