
Clicky
Clicky ist ein Open-Source-KI-gestützter Desktop-Begleiter, der sich in Ihrer macOS-Menüleiste befindet und in der Lage ist, Ihren Bildschirm zu sehen, auf Sprachbefehle zu reagieren und interaktive visuelle Anleitungen zu geben, indem er in Echtzeit auf UI-Elemente zeigt.
https://github.com/farzaa/clicky?ref=producthunt&utm_source=aipure

Produktinformationen
Aktualisiert:Apr 16, 2026
Was ist Clicky
Clicky ist ein experimenteller KI-Lehrassistent, der als interaktiver Echtzeit-Begleiter fungieren soll, der direkt neben Ihrem Cursor auf macOS lebt. Clicky wurde vom Entwickler Farza entwickelt und als Open-Source-Software veröffentlicht. Es fungiert als Menüleistenanwendung, die Bildschirmaufnahme, Sprachinteraktion und visuelles Feedback kombiniert, um die Erfahrung zu simulieren, einen menschlichen Tutor neben sich sitzen zu haben. Die Anwendung nutzt Claude AI für intelligente Antworten, AssemblyAI für Echtzeit-Sprachaufzeichnung und ElevenLabs für natürliche Text-to-Speech-Ausgabe. Im Gegensatz zu herkömmlichen KI-Assistenten, die als separate Fenster fungieren, integriert sich Clicky nahtlos in Ihren Workflow, ohne den Fokus zu stehlen, und erscheint nur bei Bedarf über eine Push-to-Talk-Hotkeys (Control + Option). Das Projekt hat mit über 3.700 Sternen auf GitHub erhebliche Aufmerksamkeit erlangt und Community-basierte Versionen für Windows inspiriert, was seine Auswirkungen auf die Zugänglichkeit und Intuitivität des KI-gestützten Lernens demonstriert.
Hauptfunktionen von Clicky
Clicky ist ein Open-Source, KI-gestützter Desktop-Begleiter für macOS, der als interaktiver Lernassistent in Ihrer Menüleiste fungiert. Es verwendet Vision AI (Claude), um Ihren Bildschirm zu sehen, Sprachtranskription (AssemblyAI) für Push-to-Talk-Eingabe und Text-to-Speech (ElevenLabs) für Audio-Antworten. Die App kann physisch auf UI-Elemente über mehrere Monitore hinweg zeigen, indem sie ein Cursor-Overlay verwendet, wodurch es sich anfühlt, als hätte man einen echten Tutor neben sich sitzen. Es arbeitet unaufdringlich, ohne den Fokus zu stehlen, erfasst Screenshots, während es seine eigenen Fenster herausfiltert, und leitet alle API-Aufrufe über einen Cloudflare Worker-Proxy, um die Anmeldeinformationen sicher zu verwahren.
Bildschirmbewusste KI-Vision: Erfasst und analysiert Ihren Bildschirm in Echtzeit mit ScreenCaptureKit und filtert Clickys eigene Fenster heraus, um kontextbezogene Unterstützung basierend auf dem zu bieten, woran Sie tatsächlich über mehrere Monitore hinweg arbeiten.
Push-to-Talk-Sprachschnittstelle: Wird mit dem Hotkey Control+Option aktiviert, um Spracheingaben über AssemblyAI zu streamen, wodurch eine freihändige Interaktion ermöglicht wird, während der Fokus auf Ihrer Arbeit erhalten bleibt, ohne Ihren Workflow zu unterbrechen.
Visuelles Cursor-Zeigen: Zeigt ein blaues Cursor-Overlay an, das basierend auf Claudes Antworten physisch auf bestimmte UI-Elemente auf dem Bildschirm zeigen kann, wobei Koordinaten als [POINT:x,y:label:screenN]-Tags für eine präzise visuelle Anleitung eingebettet sind.
Menüleisten-Integration: Befindet sich vollständig in der macOS-Statusleiste mit einem benutzerdefinierten schwebenden Panel, wobei nicht aktivierende NSPanel-Fenster verwendet werden, die nicht den Fokus stehlen, was eine nahtlose Integration in bestehende Workflows ermöglicht.
Proaktiver Tutor-Modus: Optionaler Modus, der Ihre Aktivität beobachtet und automatisch schrittweise Anleitungen während natürlicher Pausenpunkte gibt, wobei er als proaktiver Ausbilder fungiert, anstatt nur auf Anfragen zu reagieren.
Sichere API-Proxy-Architektur: Leitet alle API-Aufrufe über einen Cloudflare Worker-Proxy, der Anmeldeinformationen serverseitig speichert, wodurch sichergestellt wird, dass API-Schlüssel niemals in der App-Binärdatei enthalten sind und sicher bleiben.
Anwendungsfälle von Clicky
Software-Lernen & Onboarding: Hilft Benutzern beim Erlernen komplexer Anwendungen wie DaVinci Resolve, Adobe Creative Suite oder Entwicklungstools, indem es ihren Bildschirm beobachtet und kontextbezogene Anleitungen mit visuellen Zeigern auf bestimmte Schaltflächen und Funktionen gibt.
Technischer Support & Fehlerbehebung: Fungiert als technischer Assistent auf Abruf, der Fehlermeldungen, Systemkonfigurationen und Anwendungszustände sehen kann, um Echtzeit-Debugging-Hilfe und schrittweise Lösungen bereitzustellen.
Workflow-Optimierung: Beobachtet Benutzer-Workflows und schlägt effizientere Methoden, Tastenkombinationen oder alternative Ansätze vor, indem es den Kontext dessen versteht, welche Aufgaben auf dem Bildschirm ausgeführt werden.
Barrierefreiheits-Unterstützung: Bietet sprachgesteuerte Navigation und visuelle Anleitungen für Benutzer, die von Audiobeschreibungen und visuellen Zeigern profitieren, um UI-Elemente in Anwendungen zu finden.
Entwicklerproduktivität: Unterstützt Programmierer durch die Analyse von Code auf dem Bildschirm, schlägt Verbesserungen vor, erklärt Fehlermeldungen und verweist auf relevante Dokumentationen oder Codeabschnitte während der Entwicklung.
Pädagogische Betreuung: Dient als personalisierter Tutor für Studenten, die neue Software, Programmiersprachen oder digitale Fähigkeiten erlernen, indem es kontextbezogene Anweisungen basierend auf dem gibt, was auf ihrem Bildschirm angezeigt wird.
Vorteile
Unaufdringliches Design, das nicht den Fokus stiehlt oder den Workflow unterbricht, wodurch es sich eher wie ein echter Begleiter als eine Unterbrechung anfühlt
Die Open-Source-Architektur ermöglicht vollständige Anpassung und Transparenz, mit einfacher Einrichtung über Claude Code für Entwickler
Multi-Monitor-Unterstützung mit präzisem visuellem Zeigen schafft eine intuitive Lernerfahrung, die menschliche Anweisungen nachahmt
Sichere Anmeldeinformationsverwaltung durch Cloudflare Worker-Proxy hält API-Schlüssel sicher und getrennt von der Anwendungsbinärdatei
Nachteile
Die ausschließliche Unterstützung von macOS (erfordert 14.2+) schränkt die Zugänglichkeit für Windows- und Linux-Benutzer ein, obwohl Community-Ports existieren
Erfordert mehrere kostenpflichtige API-Abonnements (Anthropic, AssemblyAI, ElevenLabs), die bei starker Nutzung kostspielig sein können
Komplexe Einrichtung für nicht-technische Benutzer trotz Claude Code-Unterstützung, die ein Cloudflare-Konto und API-Schlüsselverwaltung erfordert
Datenschutzbedenken, da die App umfangreiche Berechtigungen (Bildschirmaufnahme, Barrierefreiheit, Mikrofon) benötigt, um ordnungsgemäß zu funktionieren
Wie verwendet man Clicky
1: Laden Sie Clicky kostenlos von https://www.clicky.so/ für Ihren Mac herunter und installieren Sie es (erfordert macOS 14.2+)
2: Starten Sie die App - sie wird in Ihrer Menüleiste angezeigt (nicht im Dock). Klicken Sie auf das Menüleistensymbol, um das Bedienfeld zu öffnen
3: Erteilen Sie die erforderlichen Berechtigungen, wenn Sie dazu aufgefordert werden: Mikrofon (für Sprachaufnahme), Bedienungshilfen (für Tastaturkürzel), Bildschirmaufnahme (für Screenshots) und Bildschirminhalt (für ScreenCaptureKit-Zugriff)
4: Verwenden Sie Push-to-Talk, indem Sie die Tasten Control + Option gedrückt halten und dann Ihre Frage oder Anfrage zu dem sprechen, was auf Ihrem Bildschirm angezeigt wird
5: Lassen Sie die Tasten los, wenn Sie mit dem Sprechen fertig sind. Clicky transkribiert Ihre Stimme, analysiert Ihren Bildschirm und antwortet mit Sprach- und visueller Anleitung
6: Beobachten Sie, wie Clickys blauer Cursor-Begleiter auf dem Bildschirm erscheint, um auf bestimmte UI-Elemente zu zeigen, die er erklärt
7: (Optional) Aktivieren Sie den \'Tutormodus\' über das Menüleistenfeld (Abschlusskappensymbol), damit Clicky proaktiv beobachtet, was Sie tun, und Sie Schritt für Schritt anleitet, ohne Push-to-Talk verwenden zu müssen
8: (Optional) Aktivieren Sie \'Antworten kopieren\' über das Menüleistenfeld, um jede Antwort von Clicky automatisch in Ihre Zwischenablage zu kopieren, um sie einfach in Notizen oder Dokumente einzufügen
Clicky FAQs
Clicky ist ein KI-Lehrer, der als Kumpel neben Ihrem Cursor auf macOS lebt. Er kann Ihren Bildschirm sehen, mit Ihnen sprechen und auf UI-Elemente zeigen. Es ist eine Menüleisten-App, die Sprachinteraktion und Bildschirmaufnahme verwendet, um in Echtzeit Unterstützung zu bieten, ähnlich wie ein echter Lehrer neben Ihnen.
Clicky Video
Beliebte Artikel

Nano Banana SBTI: Was es ist, wie es funktioniert und wie man es im Jahr 2026 einsetzt
Apr 15, 2026

Atoms Review – Der KI-Produkt-Builder, der die digitale Erstellung im Jahr 2026 neu definiert
Apr 10, 2026

Kilo Claw: Wie man einen echten "Do-It-For-You" KI-Agenten bereitstellt und verwendet (2026 Update)
Apr 3, 2026

OpenAI schaltet Sora App ab: Was die Zukunft der KI-Videogenerierung im Jahr 2026 bereithält
Mar 25, 2026







