Clicky

Clicky

Clicky là một người bạn đồng hành trên máy tính được hỗ trợ bởi AI mã nguồn mở, sống trong thanh menu macOS của bạn, có khả năng nhìn thấy màn hình của bạn, phản hồi các lệnh thoại và cung cấp hướng dẫn trực quan tương tác bằng cách chỉ vào các thành phần giao diện người dùng trong thời gian thực.
https://github.com/farzaa/clicky?ref=producthunt&utm_source=aipure
Clicky

Thông tin Sản phẩm

Đã cập nhật:Apr 16, 2026

Clicky là gì

Clicky là một trợ lý giảng dạy AI thử nghiệm được thiết kế để hoạt động như một người bạn đồng hành tương tác, theo thời gian thực, sống trực tiếp cùng với con trỏ của bạn trên macOS. Được xây dựng bởi nhà phát triển Farza và được phát hành dưới dạng phần mềm mã nguồn mở, Clicky hoạt động như một ứng dụng thanh menu kết hợp chụp màn hình, tương tác bằng giọng nói và phản hồi trực quan để mô phỏng trải nghiệm có một gia sư là người ngồi cạnh bạn. Ứng dụng tận dụng Claude AI để có các phản hồi thông minh, AssemblyAI để phiên âm giọng nói theo thời gian thực và ElevenLabs cho đầu ra chuyển văn bản thành giọng nói tự nhiên. Không giống như các trợ lý AI truyền thống hoạt động như các cửa sổ riêng biệt, Clicky tích hợp liền mạch vào quy trình làm việc của bạn mà không làm mất tập trung, chỉ xuất hiện khi cần thiết thông qua phím nóng nhấn để nói (Control + Option). Dự án đã đạt được sức hút đáng kể với hơn 3.700 sao trên GitHub và đã truyền cảm hứng cho các phiên bản do cộng đồng xây dựng cho Windows, chứng minh tác động của nó trong việc làm cho việc học tập có sự hỗ trợ của AI trở nên dễ tiếp cận và trực quan hơn.

Các Tính năng Chính của Clicky

Clicky là một trợ lý ảo mã nguồn mở, hỗ trợ AI cho máy tính để bàn macOS, hoạt động như một trợ giảng tương tác nằm trên thanh menu của bạn. Nó sử dụng AI thị giác (Claude) để xem màn hình của bạn, phiên âm giọng nói (AssemblyAI) cho đầu vào push-to-talk và chuyển văn bản thành giọng nói (ElevenLabs) cho các phản hồi âm thanh. Ứng dụng có thể trỏ vật lý vào các thành phần giao diện người dùng trên nhiều màn hình bằng cách sử dụng lớp phủ con trỏ, tạo cảm giác như có một gia sư thực sự ngồi cạnh bạn. Nó hoạt động không xâm phạm mà không làm mất tập trung, chụp ảnh màn hình trong khi lọc ra các cửa sổ của chính nó và định tuyến tất cả các lệnh gọi API thông qua proxy Cloudflare Worker để giữ an toàn cho thông tin đăng nhập.
AI Thị giác Nhận biết Màn hình: Chụp và phân tích màn hình của bạn trong thời gian thực bằng ScreenCaptureKit, lọc ra các cửa sổ của chính Clicky để cung cấp hỗ trợ theo ngữ cảnh dựa trên những gì bạn thực sự đang làm trên nhiều màn hình.
Giao diện Giọng nói Push-to-Talk: Kích hoạt bằng phím nóng Control+Option để truyền phát đầu vào giọng nói qua AssemblyAI, cho phép tương tác rảnh tay trong khi vẫn tập trung vào công việc của bạn mà không làm gián đoạn quy trình làm việc của bạn.
Trỏ Con trỏ Trực quan: Hiển thị lớp phủ con trỏ màu xanh lam có thể trỏ vật lý vào các thành phần giao diện người dùng cụ thể trên màn hình dựa trên phản hồi của Claude, với tọa độ được nhúng dưới dạng thẻ [POINT:x,y:label:screenN] để có hướng dẫn trực quan chính xác.
Tích hợp Thanh Menu: Nằm hoàn toàn trong thanh trạng thái macOS với một bảng điều khiển nổi tùy chỉnh, sử dụng các cửa sổ NSPanel không kích hoạt, không làm mất tập trung, cho phép tích hợp liền mạch vào các quy trình làm việc hiện có.
Chế độ Gia sư Chủ động: Chế độ tùy chọn theo dõi hoạt động của bạn và cung cấp hướng dẫn từng bước tự động trong các điểm tạm dừng tự nhiên, hoạt động như một người hướng dẫn chủ động thay vì chỉ phản hồi các truy vấn.
Kiến trúc Proxy API An toàn: Định tuyến tất cả các lệnh gọi API thông qua proxy Cloudflare Worker giữ thông tin đăng nhập phía máy chủ, đảm bảo khóa API không bao giờ được vận chuyển trong tệp nhị phân của ứng dụng và vẫn an toàn.

Các Trường hợp Sử dụng của Clicky

Học & Làm quen Phần mềm: Giúp người dùng học các ứng dụng phức tạp như DaVinci Resolve, Adobe Creative Suite hoặc các công cụ phát triển bằng cách theo dõi màn hình của họ và cung cấp hướng dẫn theo ngữ cảnh với các con trỏ trực quan đến các nút và tính năng cụ thể.
Hỗ trợ Kỹ thuật & Khắc phục Sự cố: Hoạt động như một trợ lý kỹ thuật theo yêu cầu có thể xem các thông báo lỗi, cấu hình hệ thống và trạng thái ứng dụng để cung cấp trợ giúp gỡ lỗi theo thời gian thực và các giải pháp từng bước.
Tối ưu hóa Quy trình làm việc: Quan sát quy trình làm việc của người dùng và đề xuất các phương pháp hiệu quả hơn, phím tắt hoặc các phương pháp thay thế bằng cách hiểu ngữ cảnh của những tác vụ đang được thực hiện trên màn hình.
Hỗ trợ Khả năng truy cập: Cung cấp điều hướng bằng giọng nói và hướng dẫn trực quan cho những người dùng được hưởng lợi từ mô tả âm thanh và con trỏ trực quan để xác định vị trí các thành phần giao diện người dùng trên các ứng dụng.
Năng suất của Nhà phát triển: Hỗ trợ các lập trình viên bằng cách phân tích mã trên màn hình, đề xuất các cải tiến, giải thích các thông báo lỗi và chỉ ra các tài liệu hoặc phần mã có liên quan trong quá trình phát triển.
Dạy kèm Giáo dục: Đóng vai trò là một gia sư cá nhân cho học sinh học phần mềm mới, ngôn ngữ lập trình hoặc kỹ năng kỹ thuật số bằng cách cung cấp hướng dẫn nhận biết ngữ cảnh dựa trên những gì được hiển thị trên màn hình của họ.

Ưu điểm

Thiết kế không xâm phạm, không làm mất tập trung hoặc làm gián đoạn quy trình làm việc, tạo cảm giác như một người bạn đồng hành thực sự hơn là một sự gián đoạn
Kiến trúc mã nguồn mở cho phép tùy chỉnh và minh bạch hoàn toàn, với thiết lập dễ dàng thông qua Claude Code cho các nhà phát triển
Hỗ trợ đa màn hình với khả năng trỏ trực quan chính xác tạo ra trải nghiệm giảng dạy trực quan mô phỏng hướng dẫn của con người
Quản lý thông tin đăng nhập an toàn thông qua proxy Cloudflare Worker giúp giữ an toàn cho khóa API và tách biệt với tệp nhị phân của ứng dụng

Nhược điểm

Chỉ hỗ trợ macOS (yêu cầu 14.2+) giới hạn khả năng truy cập cho người dùng Windows và Linux, mặc dù có các cổng cộng đồng
Yêu cầu nhiều đăng ký API trả phí (Anthropic, AssemblyAI, ElevenLabs) có thể cộng thêm chi phí cho việc sử dụng nhiều
Độ phức tạp thiết lập cho người dùng không am hiểu kỹ thuật mặc dù có hỗ trợ Claude Code, yêu cầu tài khoản Cloudflare và quản lý khóa API
Cân nhắc về quyền riêng tư vì ứng dụng yêu cầu các quyền mở rộng (ghi màn hình, trợ năng, micrô) để hoạt động đúng cách

Cách Sử dụng Clicky

1: Tải xuống và cài đặt Clicky từ https://www.clicky.so/ miễn phí trên máy Mac của bạn (yêu cầu macOS 14.2+)
2: Khởi chạy ứng dụng - nó sẽ xuất hiện trong thanh menu của bạn (không phải dock). Nhấp vào biểu tượng thanh menu để mở bảng điều khiển
3: Cấp các quyền cần thiết khi được nhắc: Microphone (để thu giọng nói), Accessibility (cho các phím tắt), Screen Recording (để chụp ảnh màn hình) và Screen Content (để truy cập ScreenCaptureKit)
4: Sử dụng nhấn để nói bằng cách nhấn và giữ các phím Control + Option, sau đó nói câu hỏi hoặc yêu cầu của bạn về những gì trên màn hình của bạn
5: Thả các phím khi nói xong. Clicky sẽ phiên âm giọng nói của bạn, phân tích màn hình của bạn và trả lời bằng cả giọng nói và hướng dẫn trực quan
6: Xem khi người bạn đồng hành con trỏ màu xanh lam của Clicky xuất hiện trên màn hình để chỉ vào các thành phần giao diện người dùng cụ thể mà nó đang giải thích
7: (Tùy chọn) Bật 'Chế độ gia sư' từ bảng điều khiển thanh menu (biểu tượng mũ tốt nghiệp) để Clicky chủ động theo dõi những gì bạn đang làm và hướng dẫn bạn từng bước mà không cần nhấn để nói
8: (Tùy chọn) Bật 'Sao chép phản hồi' từ bảng điều khiển thanh menu để tự động sao chép mọi phản hồi từ Clicky vào khay nhớ tạm của bạn để dễ dàng dán vào ghi chú hoặc tài liệu

Câu hỏi Thường gặp về Clicky

Clicky là một gia sư AI sống như một người bạn bên cạnh con trỏ của bạn trên macOS. Nó có thể nhìn thấy màn hình của bạn, nói chuyện với bạn và chỉ vào các thành phần giao diện người dùng. Đây là một ứng dụng trên thanh menu sử dụng tương tác bằng giọng nói và chụp màn hình để cung cấp hỗ trợ theo thời gian thực, tương tự như có một giáo viên thực sự bên cạnh bạn.

Công cụ AI Mới nhất Tương tự Clicky

Advanced Voice
Advanced Voice
Advanced Voice là tính năng tương tác giọng nói tiên tiến của ChatGPT cho phép các cuộc trò chuyện bằng giọng nói tự nhiên theo thời gian thực với hướng dẫn tùy chỉnh, nhiều tùy chọn giọng nói và giọng điệu cải thiện để giao tiếp liền mạch giữa con người và AI.
Vagent
Vagent
Vagent là một giao diện giọng nói nhẹ nhàng cho phép người dùng tương tác với các đại lý AI tùy chỉnh thông qua các lệnh giọng nói, cung cấp một cách tự nhiên và trực quan để kiểm soát các quy trình tự động hóa với hỗ trợ cho hơn 60 ngôn ngữ.
Vapify
Vapify
Vapify là một nền tảng gán nhãn trắng cho phép các cơ quan cung cấp các giải pháp AI giọng nói của Vapi.ai dưới thương hiệu của riêng họ trong khi vẫn duy trì kiểm soát mối quan hệ với khách hàng và tối đa hóa doanh thu.
Wedding Speech Genie
Wedding Speech Genie
Wedding Speech Genie là một nền tảng sử dụng AI giúp tạo ra các bài phát biểu đám cưới cá nhân hóa trong vài phút bằng cách tạo ra 3 phiên bản tùy chỉnh dựa trên thông tin đầu vào của bạn, giúp những người phát biểu truyền đạt những lời chúc mừng đáng nhớ cho bất kỳ vai trò nào trong đám cưới.