Clicky

Clicky

Clickyは、macOSメニューバーに存在するオープンソースのAI搭載デスクトップコンパニオンであり、画面を見て、音声コマンドに応答し、リアルタイムでUI要素を指し示すことでインタラクティブな視覚的ガイダンスを提供できます。
https://github.com/farzaa/clicky?ref=producthunt&utm_source=aipure
Clicky

製品情報

更新日:2026年04月16日

Clickyとは

Clickyは、macOS上でカーソルのすぐ隣に存在する、インタラクティブなリアルタイムコンパニオンとして機能するように設計された、実験的なAIティーチングアシスタントです。開発者のFarzaによって構築され、オープンソースソフトウェアとしてリリースされたClickyは、スクリーンキャプチャ、音声インタラクション、視覚的なフィードバックを組み合わせたメニューバーアプリケーションとして機能し、まるで人間の家庭教師が隣に座っているかのような体験をシミュレートします。このアプリケーションは、インテリジェントな応答にClaude AI、リアルタイム音声転写にAssemblyAI、自然なテキスト読み上げ出力にElevenLabsを活用しています。別のウィンドウとして動作する従来のAIアシスタントとは異なり、Clickyはフォーカスを奪うことなくワークフローにシームレスに統合され、プッシュツートークのホットキー(Control + Option)を通じて必要なときにのみ表示されます。このプロジェクトはGitHubで3,700以上のスターを獲得し、Windows向けのコミュニティ構築バージョンに影響を与え、AI支援学習をよりアクセスしやすく直感的にすることに貢献しています。

Clickyの主な機能

Clickyは、macOS用のオープンソースのAI搭載デスクトップコンパニオンで、メニューバーに常駐するインタラクティブなティーチングアシスタントとして機能します。ビジョンAI(Claude)を使用して画面を認識し、音声文字変換(AssemblyAI)を使用してプッシュツートーク入力を処理し、テキスト読み上げ(ElevenLabs)を使用して音声応答を生成します。このアプリは、カーソルオーバーレイを使用して複数のモニター上のUI要素を物理的に指し示すことができ、まるで本物の家庭教師が隣に座っているかのように感じられます。フォーカスを奪うことなく控えめに動作し、独自のウィンドウを除外しながらスクリーンショットをキャプチャし、すべてのAPI呼び出しをCloudflare Workerプロキシ経由でルーティングして、認証情報を安全に保ちます。
画面認識AIビジョン: ScreenCaptureKitを使用して画面をリアルタイムでキャプチャして分析し、Clicky自身のウィンドウを除外して、複数のモニターで実際に作業している内容に基づいてコンテキストに応じた支援を提供します。
プッシュツートーク音声インターフェース: Control+Optionホットキーでアクティブになり、AssemblyAI経由で音声入力をストリーミングし、ワークフローを中断することなく作業に集中しながらハンズフリー操作を可能にします。
視覚的なカーソルポインティング: Claudeの応答に基づいて画面上の特定のUI要素を物理的に指し示すことができる青いカーソルオーバーレイを表示し、正確な視覚的ガイダンスのために座標を[POINT:x,y:label:screenN]タグとして埋め込みます。
メニューバー統合: カスタムフローティングパネルを備えたmacOSステータスバーに完全に常駐し、フォーカスを奪わない非アクティブ化NSPanelウィンドウを使用して、既存のワークフローへのシームレスな統合を可能にします。
プロアクティブなチューターモード: アクティビティを監視し、自然な一時停止ポイント中にステップバイステップのガイダンスを自動的に提供するオプションモードで、クエリに応答するだけでなく、プロアクティブなインストラクターとして機能します。
安全なAPIプロキシアーキテクチャ: 認証情報をサーバー側に保持するCloudflare Workerプロキシを介してすべてのAPI呼び出しをルーティングし、APIキーがアプリバイナリに出荷されることがなく、安全であることを保証します。

Clickyのユースケース

ソフトウェアの学習とオンボーディング: DaVinci Resolve、Adobe Creative Suite、開発ツールなどの複雑なアプリケーションを、画面を監視し、特定のボタンや機能への視覚的なポインターを使用してコンテキストに応じたガイダンスを提供することで、ユーザーが学習するのを支援します。
テクニカルサポートとトラブルシューティング: エラーメッセージ、システム構成、アプリケーションの状態を確認できるオンデマンドのテクニカルアシスタントとして機能し、リアルタイムのデバッグ支援とステップバイステップのソリューションを提供します。
ワークフローの最適化: ユーザーのワークフローを観察し、画面上で実行されているタスクのコンテキストを理解することで、より効率的な方法、キーボードショートカット、または代替アプローチを提案します。
アクセシビリティ支援: 音声制御ナビゲーションと、アプリケーション全体のUI要素を特定するための音声説明と視覚的なポインターを活用するユーザー向けに、視覚的なガイダンスを提供します。
開発者の生産性: 画面上のコードを分析し、改善点を提案し、エラーメッセージを説明し、開発中に適切なドキュメントまたはコードセクションを指摘することで、プログラマーを支援します。
教育的指導: 画面に表示されている内容に基づいてコンテキストに応じた指示を提供することにより、新しいソフトウェア、プログラミング言語、またはデジタルスキルを学習する学生向けのパーソナライズされた家庭教師として機能します。

メリット

フォーカスを奪ったりワークフローを中断したりしない非侵入的な設計で、中断ではなく真のコンパニオンのように感じられます
オープンソースアーキテクチャにより、完全なカスタマイズと透明性が可能になり、開発者向けのClaude Codeによる簡単なセットアップが可能です
正確な視覚的ポインティングを備えたマルチモニターサポートは、人間の指示を模倣した直感的な教育体験を生み出します
Cloudflare Workerプロキシによる安全な認証情報管理により、APIキーを安全に保ち、アプリケーションバイナリから分離します

デメリット

macOSのみのサポート(14.2以降が必要)は、WindowsおよびLinuxユーザーのアクセシビリティを制限しますが、コミュニティポートが存在します
複数の有料APIサブスクリプション(Anthropic、AssemblyAI、ElevenLabs)が必要であり、頻繁に使用するとコストが増加する可能性があります
Claude Codeの支援にもかかわらず、技術に詳しくないユーザー向けのセットアップの複雑さ、CloudflareアカウントとAPIキーの管理が必要
アプリが適切に機能するために広範な権限(画面録画、アクセシビリティ、マイク)を必要とするため、プライバシーに関する考慮事項

Clickyの使い方

1: Macでhttps://www.clicky.so/からClickyを無料でダウンロードしてインストールします(macOS 14.2以降が必要です)
2: アプリを起動します - メニューバーに表示されます(ドックではありません)。メニューバーのアイコンをクリックして、コントロールパネルを開きます
3: プロンプトが表示されたら、必要な権限を付与します:マイク(音声キャプチャ用)、アクセシビリティ(キーボードショートカット用)、画面録画(スクリーンショット用)、画面コンテンツ(ScreenCaptureKitアクセス用)
4: Control + Optionキーを押しながら、画面上の内容に関する質問やリクエストを話します
5: 話し終わったらキーを離します。Clickyがあなたの声を文字に起こし、画面を分析し、音声と視覚的なガイダンスで応答します
6: Clickyの青いカーソルコンパニオンが画面に表示され、説明している特定のUI要素を指し示すのを見てください
7: (オプション)メニューバーパネル(卒業帽アイコン)から「チューターモード」をオンにすると、Clickyがあなたの行動を積極的に監視し、プッシュツートークを必要とせずに段階的にガイドします
8: (オプション)メニューバーパネルから「応答をコピー」をオンにすると、Clickyからのすべての応答が自動的にクリップボードにコピーされ、メモやドキュメントに簡単に貼り付けることができます

Clickyのよくある質問

Clickyは、macOS上でカーソルの隣にいるバディとして存在するAI教師です。画面を見たり、話しかけたり、UI要素を指し示したりできます。音声インタラクションと画面キャプチャを使用してリアルタイムの支援を提供するメニューバーアプリで、まるで本物の教師が隣にいるかのようです。

Clickyに類似した最新のAIツール

Advanced Voice
Advanced Voice
Advanced Voiceは、カスタム指示、複数の音声オプション、改善されたアクセントを備えたChatGPTの最先端の音声対話機能で、シームレスな人間とAIのコミュニケーションを実現します
Vagent
Vagent
Vagentは、ユーザーが音声コマンドを通じてカスタムAIエージェントと対話できる軽量の音声インターフェースであり、60以上の言語をサポートする自動化を制御する自然で直感的な方法を提供します
Vapify
Vapify
Vapifyは、エージェンシーがVapi.aiの音声AIソリューションを自社のブランドの下で提供し、クライアント関係を管理し、収益を最大化できるホワイトラベルプラットフォームです
Wedding Speech Genie
Wedding Speech Genie
ウェディングスピーチジーニーは、入力に基づいて3つのカスタムバージョンを生成することで、数分で個別化されたウェディングスピーチを作成し、スピーカーがどんなウェディングロールでも記憶に残るトーストを届けるのを助けるAI駆動のプラットフォームです