Clicky

Clicky

Clicky é um companheiro de desktop de código aberto com tecnologia de IA que vive na sua barra de menu do macOS, capaz de ver sua tela, responder a comandos de voz e fornecer orientação visual interativa, apontando para elementos da interface do usuário em tempo real.
https://github.com/farzaa/clicky?ref=producthunt&utm_source=aipure
Clicky

Informações do Produto

Atualizado:Apr 16, 2026

O que é Clicky

Clicky é um assistente de ensino de IA experimental projetado para atuar como um companheiro interativo em tempo real que vive diretamente ao lado do seu cursor no macOS. Construído pelo desenvolvedor Farza e lançado como software de código aberto, o Clicky funciona como um aplicativo de barra de menu que combina captura de tela, interação por voz e feedback visual para simular a experiência de ter um tutor humano sentado ao seu lado. O aplicativo aproveita o Claude AI para respostas inteligentes, o AssemblyAI para transcrição de voz em tempo real e o ElevenLabs para saída de texto para fala natural. Ao contrário dos assistentes de IA tradicionais que operam como janelas separadas, o Clicky se integra perfeitamente ao seu fluxo de trabalho sem roubar o foco, aparecendo apenas quando necessário por meio de uma tecla de atalho push-to-talk (Control + Option). O projeto ganhou força significativa com mais de 3.700 estrelas no GitHub e inspirou versões construídas pela comunidade para Windows, demonstrando seu impacto em tornar o aprendizado assistido por IA mais acessível e intuitivo.

Principais Recursos do Clicky

Clicky é um companheiro de desktop de código aberto alimentado por IA para macOS que funciona como um assistente de ensino interativo que vive na sua barra de menu. Ele usa visão de IA (Claude) para ver sua tela, transcrição de voz (AssemblyAI) para entrada push-to-talk e conversão de texto em fala (ElevenLabs) para respostas de áudio. O aplicativo pode apontar fisicamente para elementos da interface do usuário em vários monitores usando uma sobreposição de cursor, fazendo com que pareça ter um tutor real sentado ao seu lado. Ele opera de forma não intrusiva, sem roubar o foco, captura capturas de tela enquanto filtra suas próprias janelas e encaminha todas as chamadas de API por meio de um proxy Cloudflare Worker para manter as credenciais seguras.
Visão de IA com reconhecimento de tela: Captura e analisa sua tela em tempo real usando o ScreenCaptureKit, filtrando as próprias janelas do Clicky para fornecer assistência contextual com base no que você está realmente trabalhando em vários monitores.
Interface de voz Push-to-Talk: Ativa com a tecla de atalho Control+Option para transmitir a entrada de voz via AssemblyAI, permitindo a interação mãos-livres, mantendo o foco no seu trabalho sem interromper o seu fluxo de trabalho.
Apontamento visual do cursor: Exibe uma sobreposição de cursor azul que pode apontar fisicamente para elementos específicos da interface do usuário na tela com base nas respostas de Claude, com coordenadas incorporadas como tags [POINT:x,y:label:screenN] para orientação visual precisa.
Integração da barra de menu: Vive inteiramente na barra de status do macOS com um painel flutuante personalizado, usando janelas NSPanel não ativadoras que não roubam o foco, permitindo uma integração perfeita nos fluxos de trabalho existentes.
Modo de tutor proativo: Modo opcional que observa sua atividade e fornece orientação passo a passo automaticamente durante os pontos de pausa naturais, atuando como um instrutor proativo em vez de apenas responder a consultas.
Arquitetura de proxy de API segura: Encaminha todas as chamadas de API por meio de um proxy Cloudflare Worker que mantém as credenciais do lado do servidor, garantindo que as chaves de API nunca sejam enviadas no binário do aplicativo e permaneçam seguras.

Casos de Uso do Clicky

Aprendizado e integração de software: Ajuda os usuários a aprender aplicativos complexos como DaVinci Resolve, Adobe Creative Suite ou ferramentas de desenvolvimento, observando sua tela e fornecendo orientação contextual com ponteiros visuais para botões e recursos específicos.
Suporte técnico e solução de problemas: Atua como um assistente técnico sob demanda que pode ver mensagens de erro, configurações de sistema e estados de aplicativos para fornecer ajuda de depuração em tempo real e soluções passo a passo.
Otimização de fluxo de trabalho: Observa os fluxos de trabalho do usuário e sugere métodos mais eficientes, atalhos de teclado ou abordagens alternativas, entendendo o contexto de quais tarefas estão sendo executadas na tela.
Assistência de acessibilidade: Fornece navegação controlada por voz e orientação visual para usuários que se beneficiam de descrições de áudio e ponteiros visuais para localizar elementos da interface do usuário em aplicativos.
Produtividade do desenvolvedor: Auxilia os programadores analisando o código na tela, sugerindo melhorias, explicando mensagens de erro e apontando para documentação ou seções de código relevantes durante o desenvolvimento.
Tutoria educacional: Serve como um tutor personalizado para alunos que estão aprendendo novos softwares, linguagens de programação ou habilidades digitais, fornecendo instruções contextuais com base no que é exibido em sua tela.

Vantagens

Design não intrusivo que não rouba o foco ou interrompe o fluxo de trabalho, fazendo com que pareça um verdadeiro companheiro em vez de uma interrupção
A arquitetura de código aberto permite total personalização e transparência, com fácil configuração via Claude Code para desenvolvedores
O suporte a vários monitores com apontamento visual preciso cria uma experiência de ensino intuitiva que imita a instrução humana
O gerenciamento seguro de credenciais por meio do proxy Cloudflare Worker mantém as chaves de API seguras e separadas do binário do aplicativo

Desvantagens

O suporte apenas para macOS (requer 14.2+) limita a acessibilidade para usuários de Windows e Linux, embora existam portas da comunidade
Requer várias assinaturas de API pagas (Anthropic, AssemblyAI, ElevenLabs), o que pode aumentar o custo para uso intenso
Complexidade de configuração para usuários não técnicos, apesar da assistência do Claude Code, exigindo conta Cloudflare e gerenciamento de chaves de API
Considerações de privacidade, pois o aplicativo requer permissões extensivas (gravação de tela, acessibilidade, microfone) para funcionar corretamente

Como Usar o Clicky

1: Baixe e instale o Clicky de https://www.clicky.so/ gratuitamente no seu Mac (requer macOS 14.2+)
2: Inicie o aplicativo - ele aparecerá na sua barra de menu (não no dock). Clique no ícone da barra de menu para abrir o painel de controle
3: Conceda as permissões necessárias quando solicitado: Microfone (para captura de voz), Acessibilidade (para atalhos de teclado), Gravação de tela (para capturas de tela) e Conteúdo da tela (para acesso ao ScreenCaptureKit)
4: Use o push-to-talk pressionando e segurando as teclas Control + Option e, em seguida, fale sua pergunta ou solicitação sobre o que está na sua tela
5: Solte as teclas quando terminar de falar. O Clicky transcreverá sua voz, analisará sua tela e responderá com orientação visual e por voz
6: Observe como o cursor azul do Clicky aparece na tela para apontar para elementos específicos da interface do usuário que ele está explicando
7: (Opcional) Ative o 'Modo Tutor' no painel da barra de menu (ícone de chapéu de formatura) para que o Clicky observe proativamente o que você está fazendo e o guie passo a passo sem precisar usar o push-to-talk
8: (Opcional) Ative 'Copiar respostas' no painel da barra de menu para copiar automaticamente todas as respostas do Clicky para a sua área de transferência para facilitar a colagem em notas ou documentos

Perguntas Frequentes do Clicky

Clicky é um professor de IA que vive como um companheiro ao lado do seu cursor no macOS. Ele pode ver sua tela, falar com você e apontar para elementos da interface do usuário. É um aplicativo da barra de menu que usa interação por voz e captura de tela para fornecer assistência em tempo real, semelhante a ter um professor de verdade ao seu lado.

Ferramentas de IA Mais Recentes Semelhantes a Clicky

Advanced Voice
Advanced Voice
Advanced Voice é o recurso de interação por voz de ponta do ChatGPT que permite conversas naturais em tempo real com instruções personalizadas, múltiplas opções de voz e sotaques aprimorados para uma comunicação humana-IA sem interrupções.
Vagent
Vagent
O Vagent é uma interface de voz leve que permite aos usuários interagir com agentes de IA personalizados através de comandos de voz, proporcionando uma maneira natural e intuitiva de controlar automações com suporte para mais de 60 idiomas.
Vapify
Vapify
O Vapify é uma plataforma de marca branca que permite que as agências ofereçam soluções de IA de voz da Vapi.ai sob sua própria marca, mantendo o controle sobre os relacionamentos com os clientes e maximizando a receita.
Wedding Speech Genie
Wedding Speech Genie
Wedding Speech Genie é uma plataforma alimentada por IA que cria discursos de casamento personalizados em minutos, gerando 3 versões personalizadas com base em suas informações, ajudando os palestrantes a fazer brindes memoráveis para qualquer papel de casamento.