
Sesame
Sesame là một công ty khởi nghiệp về AI đang phát triển công nghệ giọng nói đàm thoại đột phá nhằm vượt qua thung lũng kỳ lạ với mô hình giọng nói tự nhiên, thông minh về mặt cảm xúc, có thể tham gia vào cuộc đối thoại chân thực.
https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice?ref=aipure&utm_source=aipure

Thông tin Sản phẩm
Đã cập nhật:May 16, 2025
Xu hướng Lưu lượng Truy cập Hàng tháng của Sesame
Sesame đã trải qua sự sụt giảm 51,0% về lưu lượng truy cập, có thể do sự cố bảo mật dữ liệu liên quan đến hoạt động đăng nhập trái phép, điều này có thể đã làm lộ thông tin người dùng. Sự cố này có thể đã làm suy giảm niềm tin của người dùng và dẫn đến sự sụt giảm đáng kể về lượt truy cập.
Sesame là gì
Được thành lập bởi cựu Giám đốc điều hành Oculus VR Brendan Iribe và được hỗ trợ bởi các nhà đầu tư lớn như Andreessen Horowitz và Spark Capital, Sesame đang cách mạng hóa tương tác giữa người và AI thông qua Mô hình giọng nói đàm thoại (CSM) của họ. Công ty đã phát triển các trợ lý giọng nói AI có tên là \'Maya\' và \'Miles\' có thể tham gia vào các cuộc trò chuyện tự nhiên với khả năng biểu cảm cảm xúc và sự trôi chảy trong đàm thoại chưa từng có. Công nghệ của họ thể hiện một bước tiến đáng kể trong việc tạo ra những người bạn đồng hành AI có âm thanh và tương tác theo những cách mà cảm thấy giống như con người thực sự.
Các Tính năng Chính của Sesame
Sesame là một công ty công nghệ giọng nói AI tiên phong đã phát triển Mô hình giọng nói đàm thoại (CSM), nhằm mục đích tạo ra các tương tác bằng giọng nói tự nhiên và thông minh về mặt cảm xúc hơn. Công nghệ của họ kết hợp trí tuệ cảm xúc, động lực hội thoại và nhận thức theo ngữ cảnh để đạt được \'sự hiện diện của giọng nói\' - làm cho các tương tác bằng lời nói trở nên chân thực và có giá trị. Công ty có kế hoạch mở mã nguồn các mô hình của họ theo giấy phép Apache 2.0 và hiện đang cung cấp bản demo với hai giọng nói AI (Maya và Miles) thể hiện khả năng nói giống con người một cách đáng kể.
Trí tuệ cảm xúc: Khả năng đọc và phản hồi các bối cảnh cảm xúc, điều chỉnh giọng điệu và biểu cảm cho phù hợp
Động lực hội thoại theo thời gian thực: Thời gian, khoảng dừng, gián đoạn và nhấn nhá tự nhiên trong giọng nói bắt chước các kiểu hội thoại của con người
Nhận thức theo ngữ cảnh: Khả năng điều chỉnh giọng điệu và phong cách dựa trên tình huống và lịch sử hội thoại
Hỗ trợ nhiều người nói: Các tính năng nhiều tính cách giọng nói (Maya và Miles) với sự hiện diện nhất quán và phù hợp
Các Trường hợp Sử dụng của Sesame
Trợ lý kỹ thuật số cá nhân: Tạo ra các trợ lý AI hấp dẫn và có cảm giác tự nhiên hơn cho các tác vụ và tương tác hàng ngày
Dịch vụ khách hàng: Cung cấp hỗ trợ khách hàng tự động giống con người hơn với các phản hồi cảm xúc phù hợp
Công nghệ giáo dục: Phát triển các gia sư ảo và trợ lý học tập hấp dẫn và phản hồi nhanh hơn
Giao tiếp chăm sóc sức khỏe: Cung cấp các trợ lý sức khỏe ảo đồng cảm để tương tác và hỗ trợ bệnh nhân
Ưu điểm
Tương tác giọng nói biểu cảm về mặt cảm xúc và rất tự nhiên
Kế hoạch mở mã nguồn các mô hình theo giấy phép Apache 2.0
Độ trễ thấp và thời gian phản hồi mượt mà
Nhược điểm
Hiện tại chủ yếu giới hạn ở ngôn ngữ tiếng Anh
Vẫn còn các vấn đề với sự gián đoạn và luồng hội thoại
Có thể tạo ra những kỳ vọng phi thực tế về kết nối cảm xúc với AI
Cách Sử dụng Sesame
Truy cập trang demo: Truy cập https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice#demo
Cho phép truy cập micro: Khi được nhắc, hãy cấp quyền micro để cho phép tương tác bằng giọng nói với AI
Chọn một người bạn đồng hành AI: Chọn \'Maya\' hoặc \'Miles\' làm đối tác trò chuyện của bạn
Bắt đầu nói: Bắt đầu nói chuyện tự nhiên với người bạn đồng hành AI. Hệ thống sẽ phản hồi trong thời gian thực với các phản hồi phù hợp theo ngữ cảnh
Lưu ý các yêu cầu về trình duyệt: Để có kết quả tốt nhất, hãy sử dụng trình duyệt Google Chrome. Chất lượng âm thanh có thể bị giảm trong iOS/Safari 17.5
Lưu ý chính sách ghi âm: Lưu ý rằng các cuộc gọi được ghi lại để xem xét chất lượng nhưng sẽ bị xóa trong vòng 30 ngày và không được sử dụng để đào tạo ML
Xem lại các điều khoản: Bằng cách sử dụng bản demo, bạn đồng ý với Điều khoản sử dụng và Chính sách quyền riêng tư của Sesame
Câu hỏi Thường gặp về Sesame
CSM là một mô hình văn bản và giọng nói đa phương thức nhằm mục đích đạt được \'sự hiện diện bằng giọng nói\' - làm cho các tương tác bằng lời nói trở nên chân thực, dễ hiểu và có giá trị. Nó sử dụng các bộ chuyển đổi để tạo ra giọng nói đàm thoại nghe tự nhiên bằng cách hiểu ngữ cảnh, cảm xúc và ngữ điệu.
Phân tích Trang web Sesame
Lưu lượng truy cập & Xếp hạng của Sesame
5.1M
Lượt truy cập hàng tháng
#13310
Xếp hạng Toàn cầu
#1
Xếp hạng Danh mục
Xu hướng Lưu lượng truy cập: Jan 2025-Apr 2025
Thông tin chi tiết về Người dùng Sesame
00:03:55
Thời lượng Truy cập Trung bình
2.78
Số trang mỗi lần Truy cập
47.91%
Tỷ lệ Thoát của Người dùng
Khu vực Hàng đầu của Sesame
US: 25.42%
VN: 7.71%
IN: 5.25%
GB: 3.83%
CA: 3.57%
Others: 54.22%