
Sesame
Sesameは、自然で感情的にインテリジェントな音声モデルで不気味の谷を越えることを目指し、本物の対話を行うことができる画期的な会話型音声技術を開発しているAIスタートアップです。
https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice?ref=aipure&utm_source=aipure

製品情報
更新日:2025年05月16日
Sesame の月間トラフィック傾向
Sesameは、ユーザー情報が漏洩した可能性のある不正ログイン活動に関連するデータプライバシーインシデントにより、トラフィックが51.0%減少しました。このインシデントによりユーザーの信頼が損なわれ、訪問者数が大幅に減少した可能性があります。
Sesameとは
Oculus VRの元CEOであるBrendan Iribeによって設立され、Andreessen HorowitzやSpark Capitalなどの主要投資家の支援を受けているSesameは、会話型音声モデル(CSM)を通じて、人間とAIのインタラクションに革命を起こしています。同社は、前例のない感情的な表現力と会話の流暢さで自然な会話をすることができるAI音声アシスタント「Maya」と「Miles」を開発しました。彼らの技術は、本物の人間のように聞こえ、インタラクトするAIコンパニオンを作成する上で重要な一歩となります。
Sesameの主な機能
Sesameは、より自然で感情的に知的な音声インタラクションの創造を目指すConversational Speech Model(CSM)を開発した、先駆的なAI音声技術企業です。彼らの技術は、感情知能、会話のダイナミクス、およびコンテキスト認識を組み合わせて「音声プレゼンス」を実現し、会話を現実的で価値のあるものと感じさせます。同社はApache 2.0ライセンスの下でモデルをオープンソース化する予定であり、現在、驚くほど人間のような音声機能を示す2つのAI音声(MayaとMiles)をフィーチャーしたデモを提供しています。
感情知能: 感情的なコンテキストを読み取り、それに応じてトーンと表現を調整する能力
リアルタイム会話ダイナミクス: 人間の会話パターンを模倣した、自然なタイミング、ポーズ、中断、および音声の強調
コンテキスト認識: 状況と会話履歴に基づいてトーンとスタイルを調整する機能
マルチスピーカーサポート: 一貫性があり適切なプレゼンスを備えた複数の音声パーソナリティ(MayaとMiles)をフィーチャー
Sesameのユースケース
パーソナルデジタルアシスタント: 日々のタスクやインタラクションのため、より魅力的で自然なAIアシスタントを作成
カスタマーサービス: 適切な感情的な反応を備えた、より人間らしい自動化されたカスタマーサポートの提供
教育技術: より魅力的で応答性の高いバーチャルチューターと学習アシスタントの開発
ヘルスケアコミュニケーション: 患者のインタラクションとサポートのための共感的なバーチャルヘルスアシスタントの提供
メリット
非常に自然で感情的に表現力豊かな音声インタラクション
Apache 2.0ライセンスの下でモデルをオープンソース化する計画
低遅延でスムーズな応答時間
デメリット
現在、主に英語に限定されている
中断や会話の流れにまだ問題がある
AIとの感情的なつながりについて非現実的な期待を生み出す可能性がある
Sesameの使い方
デモページにアクセス: https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice#demo にアクセスしてください
マイクへのアクセスを許可: プロンプトが表示されたら、AIとの音声インタラクションを有効にするためにマイクのアクセス許可を付与します
AIコンパニオンを選択: 会話の相手として「Maya」または「Miles」のいずれかを選択します
話し始める: AIコンパニオンと自然に話し始めます。システムは、文脈的に適切な応答でリアルタイムに応答します
ブラウザの要件に注意: 最良の結果を得るには、Google Chromeブラウザを使用してください。iOS/Safari 17.5では音質が低下する可能性があります
記録ポリシーに注意: 通話は品質レビューのために記録されますが、30日以内に削除され、MLトレーニングには使用されないことに注意してください
利用規約を確認: デモを使用することにより、Sesameの利用規約とプライバシーポリシーに同意したことになります
Sesameのよくある質問
CSMは、\"声の存在感\"を実現することを目指すマルチモーダルなテキストおよび音声モデルです。つまり、話し言葉のやり取りをリアルで、理解され、価値のあるものに感じさせることを目指しています。トランスフォーマーを使用して、コンテキスト、感情、プロソディを理解することにより、自然な会話音声の生成を行います。
Sesameウェブサイトの分析
Sesameのトラフィック&ランキング
5.1M
月間訪問数
#13310
グローバルランク
#1
カテゴリーランク
トラフィックトレンド: Jan 2025-Apr 2025
Sesameユーザーインサイト
00:03:55
平均訪問時間
2.78
訪問あたりのページ数
47.91%
ユーザーバウンス率
Sesameの主要地域
US: 25.42%
VN: 7.71%
IN: 5.25%
GB: 3.83%
CA: 3.57%
Others: 54.22%