Whispering

Whispering

Whispering は、ユーザーがローカル モデルまたはクラウド モデルを選択して音声をテキストに変換しながら、データを所有できるオープンソースのトランスクリプション ソフトウェアです。
https://epicenter.so/whispering?ref=producthunt&utm_source=aipure
Whispering

製品情報

更新日:2025年08月14日

Whisperingとは

Whispering は、データの所有権と透明性を第一に考える、無料のオープンソースのトランスクリプション アプリケーションです。ローカル モデルまたは Groq や OpenAI などのクラウド プロバイダーを使用して、ブラック ボックスの仲介業者なしでオーディオをトランスクリプトできます。Epicenter プラットフォームの一部として、閉鎖的でサイロ化されたトランスクリプション サービスを、ユーザーがデータとトランスクリプション プロセスを完全に制御できる、オープンで相互運用可能な代替サービスに置き換えることを目指しています。

Whisperingの主な機能

Whisperingは、ユーザーが音声からテキストへの変換を、完全なデータ所有権と透明性をもって行えるオープンソースの文字起こしソフトウェアです。ローカルモデルとクラウドベースのモデル(GroqやOpenAIなど)の選択における柔軟性、シンプルなショートカットベースのインターフェース、従来の文字起こしサービスと比較して大幅なコスト削減を提供します。このアプリケーションは、プライバシー、ローカルファーストのストレージ、および仲介サーバーなしでプロバイダーAPIとの直接統合を重視しています。
モデルの柔軟性: クラウドベースのプロバイダー(Groq、OpenAI)またはローカルモデル(Speaches)から文字起こしを選択でき、ユーザーは好みのソリューションを完全に制御できます
ショートカットベースのインターフェース: システム全体で機能するシンプルなプレスショートカットアンドスピーク機能により、デバイス上のどこからでも迅速な文字起こしが可能
ローカルファーストのストレージ: すべての文字起こしはプレーンテキストおよびSQLite形式でローカルに保存され、データの所有権とプライバシーを確保
費用対効果の高い価格設定: 直接プロバイダーAPI統合により、従来の文字起こしサービスと比較して最大90%のコスト削減が可能になり、ローカルモデルの場合は無料から始まるオプションがあります

Whisperingのユースケース

プロフェッショナルなノート作成: 会議、インタビュー、講義の迅速な文字起こしにより、ドキュメント作成と参照を改善
コンテンツ作成: ブログ、記事、ソーシャルメディアの投稿のために、話されたコンテンツを効率的に書かれた形式に変換
学術研究: 完全なデータプライバシーと所有権を伴う、研究インタビューとフィールドレコーディングの文字起こし
個人の生産性: 音声を通じてアイデアや思考を迅速にキャプチャし、検索可能なテキストに自動的に変換

メリット

完全な透明性とデータ所有権
従来のサービスと比較して大幅なコスト削減
ローカルモデルとクラウドモデルの選択における柔軟性

デメリット

クラウドサービスには初期設定とAPIキーが必要
サポートされているプラットフォームとモデルに限定される

Whisperingの使い方

ダウンロードとインストール: GitHub リリースからプラットフォーム (macOS、利用可能な Web バージョン) 用の Whispering をダウンロードするか、Web バージョンを直接試してください
API キーの設定 (オプション): クラウド プロバイダー (Groq、OpenAI) またはローカル モデル (Speaches) を選択します。クラウドを使用する場合は、プロバイダーに直接支払うために独自の API キーを追加します
ショートカットの設定: トランスクリプション機能をトリガーするキーボード ショートカットを設定します
マイクの位置: 最適なパフォーマンスを得るには、マイクを口から約 1 cm 離して配置します。最良の結果を得るには、演台マイクを使用できます
アクティブ化して話す: 設定したショートカットを押してから、トランスクリプトしたい内容を話します。公共の場でのプライバシーのために、静かにささやくことができます
トランスクリプトされたテキストを取得: 話されたオーディオは自動的にテキストにトランスクリプトされ、システムに表示されます
フォーマットと編集: 組み込みツールを使用して、テキストのフォーマット、文法の修正、および必要に応じたカスタム ワークフローの作成を行います

Whisperingのよくある質問

ささやくとき、声帯は緊張し、振動しません。代わりに、披裂軟骨の間を空気が通過し、発話中に聞こえる乱流が発生します。口の動き(声門上構音)は通常の発話と同じです。

Whisperingに類似した最新のAIツール

Ticknotes
Ticknotes
Ticknotesは、音声、ビデオ、テキストコンテンツから自動的に記録、転写、パーソナライズされた会議の要約、アクションアイテム、重要な洞察を生成するAI駆動の会議アシスタントです。
Feta
Feta
Fetaは、製品およびエンジニアリングチームが議論をキャプチャし、タスクを自動化し、スマートな要約と統合を通じて実行可能な洞察を提供することで、効率的な会議を実施するのを助けるAI駆動の会議ツールです
TranscriptionPlus
TranscriptionPlus
TranscriptionPlusは、スピーカー識別、要約生成、多言語サポートなどの高度な機能を備えた、正確な音声からテキストへの変換を提供するAI駆動の書き起こしサービスです。手頃な価格のティアで利用できます。
AudioScribe.io
AudioScribe.io
AudioScribe.ioは、音声およびビデオコンテンツを正確なテキストに変換し、自動会議録音、全文検索、多言語サポートなどの高度な機能を提供する革命的なAI駆動の転写サービスです