OpenAI Unveils Advanced Voice Mode for ChatGPT

GPT-5.5 trong ChatGPT là mô hình tập trung vào công việc mới nhất của OpenAI được thiết kế để hiểu các mục tiêu phức tạp, sử dụng các công cụ hiệu quả, kiểm tra công việc của nó và thực hiện các tác vụ nhiều bước (viết mã, nghiên cứu, tài liệu, bảng tính) cho đến khi hoàn thành với các biện pháp bảo vệ mạnh mẽ hơn.

Truy cập Trang web

OpenAI Nâng cấp ChatGPT với Chế độ Giọng nói Nâng cao

Vào ngày 25 tháng 9 năm 2024, OpenAI đã thực hiện một bước tiến quan trọng trong việc làm cho tương tác AI trở nên tự nhiên và hấp dẫn hơn với việc ra mắt Chế độ Giọng nói Nâng cao (Advanced Voice Mode - AVM) cho ChatGPT. Tính năng mới này, ban đầu chỉ có sẵn cho khách hàng cấp độ Plus và Teams, đại diện cho một bước tiến lớn trong công nghệ AI đàm thoại.

(Bài đăng Twitter về việc ra mắt Chế độ Giọng nói Nâng cao của ChatGPT: https://twitter.com/OpenAI/status/1838642444365369814)

Các Tính năng Chính của Chế độ Giọng nói Nâng cao ChatGPT

Mở rộng Tùy chọn Giọng nói

ChatGPT hiện cung cấp cho người dùng lựa chọn năm giọng nói mới: Arbor, Maple, Sol, Spruce và Vale. Những giọng nói lấy cảm hứng từ thiên nhiên này tham gia vào danh sách hiện có, nâng tổng số lên chín tùy chọn giọng nói khác nhau. Sự mở rộng này cho phép người dùng tùy chỉnh trải nghiệm tương tác AI của họ, làm cho các cuộc trò chuyện cảm thấy cá nhân hóa hơn và phù hợp với sở thích cá nhân.

Cải thiện Luồng Đàm thoại

OpenAI tuyên bố đã thực hiện những cải tiến đáng kể cho AVM kể từ giai đoạn thử nghiệm alpha ban đầu. Hệ thống hiện có khả năng nhận dạng giọng nói được nâng cao và các cuộc trò chuyện mượt mà, nhanh chóng hơn. Những nâng cấp này nhằm giảm thiểu lỗi và tạo ra tương tác liền mạch hơn giữa người dùng và AI.

Thiết kế Lại Giao diện

Chế độ Giọng nói Nâng cao có một đại diện trực quan mới dưới dạng một quả cầu hoạt hình màu xanh, thay thế các chấm đen hoạt hình trước đây. Việc thiết kế lại này mang lại một diện mạo mới, hiện đại cho giao diện, làm cho nó hấp dẫn hơn về mặt thị giác và trực quan hơn đối với người dùng.

Hướng dẫn Tùy chỉnh và Bộ nhớ của Chế độ Giọng nói Nâng cao ChatGPT

OpenAI đã tích hợp hai tính năng mạnh mẽ từ ChatGPT dựa trên văn bản vào AVM:

Hướng dẫn Tùy chỉnh: Người dùng có thể cá nhân hóa cách ChatGPT phản hồi với họ, tạo ra trải nghiệm tương tác được điều chỉnh hơn.
Bộ nhớ: Tính năng này cho phép ChatGPT ghi nhớ và tham chiếu các cuộc trò chuyện trước đó, cho phép các phản hồi có ngữ cảnh và liên quan hơn theo thời gian.

Những bổ sung này nâng cao đáng kể khả năng của AI trong việc cung cấp các phản hồi được cá nhân hóa và nhận thức ngữ cảnh trong các tương tác bằng giọng nói.

Triển khai và Khả dụng của Chế độ Giọng nói Nâng cao ChatGPT

Việc triển khai Chế độ Giọng nói Nâng cao được thực hiện theo từng giai đoạn:

Ban đầu có sẵn cho khách hàng ChatGPT Plus và Teams bắt đầu từ ngày 24 tháng 9 năm 2024
Khách hàng Enterprise và Edu sẽ được truy cập bắt đầu từ tuần tiếp theo
Chưa có sẵn ở một số khu vực, bao gồm EU, UK, Thụy Sĩ, Iceland, Na Uy và Liechtenstein

Cách tiếp cận theo từng giai đoạn này cho phép OpenAI theo dõi hiệu suất và thu thập phản hồi từ người dùng khi họ mở rộng tính khả dụng của tính năng.

Phát triển Tương lai của OpenAI

Mặc dù việc triển khai hiện tại tập trung vào tương tác bằng giọng nói, OpenAI đã gợi ý về các cải tiến trong tương lai. Trong bản cập nhật mùa xuân của họ, công ty đã giới thiệu khả năng chia sẻ video và màn hình cho GPT-4o, cho phép xử lý đồng thời thông tin hình ảnh và âm thanh. Mặc dù không được bao gồm trong bản phát hành này, những tính năng này gợi ý một lộ trình thú vị cho các bản cập nhật trong tương lai.

Câu hỏi Thường gặp

★Làm thế nào để tôi truy cập Chế độ Giọng nói Nâng cao?

Chế độ Giọng nói Nâng cao hiện đang được triển khai cho người dùng ChatGPT Plus và Team. Bạn có thể kiểm tra xem bạn có quyền truy cập hay không bằng cách tìm biểu tượng Giọng nói ở góc dưới bên phải màn hình trong ứng dụng ChatGPT.

★Tôi có thể sử dụng Chế độ Giọng nói Nâng cao với GPTs không?

Không, Chế độ Giọng nói Nâng cao hiện chưa có sẵn để sử dụng với GPTs. Nếu bạn cố gắng có một cuộc trò chuyện giọng nói nâng cao với một GPT, bạn sẽ được chuyển hướng để bắt đầu một cuộc trò chuyện mới sử dụng giọng nói tiêu chuẩn.

★Có giới hạn sử dụng nào cho Chế độ Giọng nói Nâng cao không?

Có, việc sử dụng Chế độ Giọng nói Nâng cao (đầu vào và đầu ra âm thanh) bị giới hạn hàng ngày đối với người dùng Plus và Team. Các giới hạn chính xác có thể thay đổi.

★Chế độ Giọng nói Nâng cao có sẵn ở tất cả các khu vực không?

Không, tính đến ngày 25 tháng 9 năm 2024, Chế độ Giọng nói Nâng cao chưa có sẵn ở EU, UK, Thụy Sĩ, Iceland, Na Uy và Liechtenstein.

Để biết thêm câu hỏi thường gặp về Chế độ Giọng nói Nâng cao ChatGPT, vui lòng truy cập trang web chính thức của Open AI: https://help.openai.com/en/articles/8400625-voice-mode-faq

Việc giới thiệu Chế độ Giọng nói Nâng cao đánh dấu một cột mốc quan trọng trong sự phát triển của giao diện đàm thoại được hỗ trợ bởi AI. Bằng cách làm cho tương tác AI trở nên tự nhiên, cá nhân hóa và dễ tiếp cận hơn, OpenAI đang mở đường cho việc áp dụng rộng rãi hơn và các ứng dụng đa dạng hơn của công nghệ AI trong cuộc sống hàng ngày.

AIPURE

Freemium

AI Tools Directory AI Productivity Tools AI Search Engine

AIPURE là một nền tảng toàn diện giúp người dùng khám phá và tìm hiểu các công cụ và dịch vụ AI tốt nhất của năm 2024 thông qua một giao diện tìm kiếm dễ sử dụng.

Truy cập Trang web

Để cập nhật những phát triển AI mới nhất và khám phá các công cụ AI tiên tiến, hãy truy cập AIPURE(https://aipure.ai/) để biết thông tin và tài nguyên toàn diện.