
Whispering
Whispering は、ユーザーがローカル モデルまたはクラウド モデルを選択して音声をテキストに変換しながら、データを所有できるオープンソースのトランスクリプション ソフトウェアです。
https://epicenter.so/whispering?ref=producthunt&utm_source=aipure

製品情報
更新日:2025年08月14日
Whisperingとは
Whispering は、データの所有権と透明性を第一に考える、無料のオープンソースのトランスクリプション アプリケーションです。ローカル モデルまたは Groq や OpenAI などのクラウド プロバイダーを使用して、ブラック ボックスの仲介業者なしでオーディオをトランスクリプトできます。Epicenter プラットフォームの一部として、閉鎖的でサイロ化されたトランスクリプション サービスを、ユーザーがデータとトランスクリプション プロセスを完全に制御できる、オープンで相互運用可能な代替サービスに置き換えることを目指しています。
Whisperingの主な機能
Whisperingは、ユーザーが音声からテキストへの変換を、完全なデータ所有権と透明性をもって行えるオープンソースの文字起こしソフトウェアです。ローカルモデルとクラウドベースのモデル(GroqやOpenAIなど)の選択における柔軟性、シンプルなショートカットベースのインターフェース、従来の文字起こしサービスと比較して大幅なコスト削減を提供します。このアプリケーションは、プライバシー、ローカルファーストのストレージ、および仲介サーバーなしでプロバイダーAPIとの直接統合を重視しています。
モデルの柔軟性: クラウドベースのプロバイダー(Groq、OpenAI)またはローカルモデル(Speaches)から文字起こしを選択でき、ユーザーは好みのソリューションを完全に制御できます
ショートカットベースのインターフェース: システム全体で機能するシンプルなプレスショートカットアンドスピーク機能により、デバイス上のどこからでも迅速な文字起こしが可能
ローカルファーストのストレージ: すべての文字起こしはプレーンテキストおよびSQLite形式でローカルに保存され、データの所有権とプライバシーを確保
費用対効果の高い価格設定: 直接プロバイダーAPI統合により、従来の文字起こしサービスと比較して最大90%のコスト削減が可能になり、ローカルモデルの場合は無料から始まるオプションがあります
Whisperingのユースケース
プロフェッショナルなノート作成: 会議、インタビュー、講義の迅速な文字起こしにより、ドキュメント作成と参照を改善
コンテンツ作成: ブログ、記事、ソーシャルメディアの投稿のために、話されたコンテンツを効率的に書かれた形式に変換
学術研究: 完全なデータプライバシーと所有権を伴う、研究インタビューとフィールドレコーディングの文字起こし
個人の生産性: 音声を通じてアイデアや思考を迅速にキャプチャし、検索可能なテキストに自動的に変換
メリット
完全な透明性とデータ所有権
従来のサービスと比較して大幅なコスト削減
ローカルモデルとクラウドモデルの選択における柔軟性
デメリット
クラウドサービスには初期設定とAPIキーが必要
サポートされているプラットフォームとモデルに限定される
Whisperingの使い方
ダウンロードとインストール: GitHub リリースからプラットフォーム (macOS、利用可能な Web バージョン) 用の Whispering をダウンロードするか、Web バージョンを直接試してください
API キーの設定 (オプション): クラウド プロバイダー (Groq、OpenAI) またはローカル モデル (Speaches) を選択します。クラウドを使用する場合は、プロバイダーに直接支払うために独自の API キーを追加します
ショートカットの設定: トランスクリプション機能をトリガーするキーボード ショートカットを設定します
マイクの位置: 最適なパフォーマンスを得るには、マイクを口から約 1 cm 離して配置します。最良の結果を得るには、演台マイクを使用できます
アクティブ化して話す: 設定したショートカットを押してから、トランスクリプトしたい内容を話します。公共の場でのプライバシーのために、静かにささやくことができます
トランスクリプトされたテキストを取得: 話されたオーディオは自動的にテキストにトランスクリプトされ、システムに表示されます
フォーマットと編集: 組み込みツールを使用して、テキストのフォーマット、文法の修正、および必要に応じたカスタム ワークフローの作成を行います
Whisperingのよくある質問
ささやくとき、声帯は緊張し、振動しません。代わりに、披裂軟骨の間を空気が通過し、発話中に聞こえる乱流が発生します。口の動き(声門上構音)は通常の発話と同じです。