
Sesame
Sesame은 자연스럽고 감성적으로 지능적인 음성 모델로 불쾌한 골짜기를 넘어서 진정한 대화에 참여할 수 있는 획기적인 대화형 음성 기술을 개발하는 AI 스타트업입니다.
https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice?ref=aipure&utm_source=aipure

제품 정보
업데이트됨:May 16, 2025
Sesame 월간 트래픽 동향
Sesame는 승인되지 않은 로그인 활동과 관련된 개인정보 유출 사고로 인해 트래픽이 51.0% 감소했으며, 이는 사용자 정보가 노출되었을 가능성이 있습니다. 이 사고로 인해 사용자 신뢰도가 하락하여 방문자 수가 크게 감소했을 수 있습니다.
Sesame이란?
전 Oculus VR CEO인 Brendan Iribe가 설립하고 Andreessen Horowitz 및 Spark Capital과 같은 주요 투자자의 지원을 받는 Sesame은 대화형 음성 모델(CSM)을 통해 인간-AI 상호 작용에 혁명을 일으키고 있습니다. 이 회사는 전례 없는 감정적 표현력과 대화 유창성으로 자연스러운 대화에 참여할 수 있는 \'Maya\' 및 \'Miles\'라는 AI 음성 비서를 개발했습니다. 그들의 기술은 진정으로 인간과 같은 방식으로 들리고 상호 작용하는 AI 동반자를 만드는 데 있어 중요한 진전을 나타냅니다.
Sesame의 주요 기능
Sesame은 더욱 자연스럽고 감성적인 음성 상호 작용을 만드는 것을 목표로 하는 대화형 음성 모델(CSM)을 개발한 선구적인 AI 음성 기술 회사입니다. 그들의 기술은 감성 지능, 대화 역학 및 상황 인식 기능을 결합하여 '음성 존재감'을 달성하여 음성 상호 작용이 실제적이고 가치 있게 느껴지도록 합니다. 이 회사는 Apache 2.0 라이선스 하에 모델을 오픈 소스로 공개할 계획이며 현재 놀라울 정도로 인간과 유사한 음성 기능을 보여주는 두 개의 AI 음성(Maya 및 Miles)을 특징으로 하는 데모를 제공합니다.
감성 지능: 감정적 맥락을 읽고 그에 따라 어조와 표현을 조정하는 능력
실시간 대화 역학: 인간의 대화 패턴을 모방하는 자연스러운 타이밍, 일시 중지, 중단 및 음성 강조
상황 인식: 상황 및 대화 기록에 따라 어조와 스타일을 조정하는 기능
다중 화자 지원: 일관되고 적절한 존재감을 가진 여러 음성 개성(Maya 및 Miles) 제공
Sesame의 사용 사례
개인 디지털 비서: 일상적인 작업 및 상호 작용을 위한 더욱 매력적이고 자연스러운 느낌의 AI 비서 만들기
고객 서비스: 적절한 감정적 반응을 보이는 더욱 인간과 유사한 자동화된 고객 지원 제공
교육 기술: 더욱 매력적이고 반응성이 뛰어난 가상 튜터 및 학습 도우미 개발
의료 커뮤니케이션: 환자 상호 작용 및 지원을 위한 공감적인 가상 건강 도우미 제공
장점
매우 자연스럽고 감정적으로 표현력이 풍부한 음성 상호 작용
Apache 2.0 라이선스 하에 모델을 오픈 소스로 공개할 계획
낮은 지연 시간과 부드러운 응답 시간
단점
현재 주로 영어로 제한됨
여전히 중단 및 대화 흐름에 문제가 있음
AI와의 감정적 연결에 대한 비현실적인 기대를 만들 수 있음
Sesame 사용 방법
데모 페이지 방문: https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice#demo로 이동합니다.
마이크 접근 허용: 메시지가 표시되면 AI와의 음성 상호 작용을 활성화하기 위해 마이크 권한을 부여합니다.
AI 동반자 선택: 대화 파트너로 \'Maya\' 또는 \'Miles\'를 선택합니다.
말하기 시작: AI 동반자와 자연스럽게 대화를 시작합니다. 시스템은 상황에 맞는 적절한 응답으로 실시간으로 응답합니다.
브라우저 요구 사항 참고: 최상의 결과를 얻으려면 Google Chrome 브라우저를 사용하십시오. iOS/Safari 17.5에서는 오디오 품질이 저하될 수 있습니다.
녹음 정책 숙지: 통화는 품질 검토를 위해 녹음되지만 30일 이내에 삭제되고 ML 교육에 사용되지 않습니다.
약관 검토: 데모를 사용함으로써 귀하는 Sesame의 이용 약관 및 개인 정보 보호 정책에 동의하는 것입니다.
Sesame 자주 묻는 질문
CSM은 \'음성 존재감\'을 달성하여 음성 상호 작용이 실제적이고 이해되고 가치 있게 느껴지도록 하는 것을 목표로 하는 멀티모달 텍스트 및 음성 모델입니다. 컨텍스트, 감정 및 운율을 이해하여 자연스러운 대화 음성을 생성하기 위해 트랜스포머를 사용합니다.
Sesame 웹사이트 분석
Sesame 트래픽 및 순위
5.1M
월간 방문자 수
#13310
전 세계 순위
#1
카테고리 순위
트래픽 트렌드: Jan 2025-Apr 2025
Sesame 사용자 인사이트
00:03:55
평균 방문 시간
2.78
방문당 페이지 수
47.91%
사용자 이탈률
Sesame의 상위 지역
US: 25.42%
VN: 7.71%
IN: 5.25%
GB: 3.83%
CA: 3.57%
Others: 54.22%