SlimSnap 是一款 macOS 工具,可让您捕获和注释屏幕截图,然后将其复制为结构化 JSON(带有 OCR 和确定性边界框),以粘贴到任何接受文本的基于终端的 AI 编码代理中。
https://slimsnap.ai/?ref=producthunt&utm_source=aipure
SlimSnap

产品信息

更新于:2026年06月12日

什么是 SlimSnap

SlimSnap 是一款仅限 Mac 的实用工具,旨在弥合 AI 辅助开发中的一个常见空白:终端和 CLI 编码代理(例如 Claude Code、Aider、Codex CLI)可以读取文本,但通常无法接受图像。SlimSnap 不会冗长地解释屏幕上的内容,而是将屏幕截图转换为紧凑的、机器可读的 UI JSON 表示,包括识别的文本和布局坐标。它在本地运行,无需帐户,旨在快速共享仅支持文本的地方(如终端、SSH 会话、CI 日志或 git 提交)的精确 UI 上下文。

SlimSnap 的主要功能

SlimSnap 是一款 macOS 工具,可将带注释的屏幕截图转换为结构化、可复制粘贴的 JSON,以便纯文本环境(终端、CLI 编码代理、SSH、CI 日志)能够“看到”UI 布局。它支持快速捕获和注释,执行本地 OCR 以提取屏幕文本,并输出确定性元素映射(ID + 规范化边界框),以减少与将原始图像粘贴到视觉模型中相比的歧义和令牌使用。该格式是开放的(MIT 模式),旨在与 Claude Code、Aider、Codex CLI、Cursor 和 Continue.dev 等代理配合使用——无需将屏幕截图上传到服务器。
屏幕截图 → JSON 导出: 捕获屏幕区域并导出结构化的 JSON 表示(屏幕元数据、图像大小、元素和注释),可以粘贴到任何接受文本的地方。
确定性 UI 元素映射: 每个检测到的元素都获得一个 ID 和一个规范化的 0-1 边界框,从而清楚地表明注释指的是哪个按钮/标签/输入——减少了 AI 工具的“猜测”。
内置本地 OCR: 直接从屏幕截图读取标签、按钮和错误消息,以便下游工具可以处理用户看到的相同文本。
注释工具(箭头/标注/高亮): 标记特定的损坏或重要的 UI 区域,并将注释绑定到目标元素以精确传达意图。
AI 工作流的令牌效率: 生成数百个 JSON 令牌,而不是将图像粘贴到模型中产生的高成本视觉令牌,从而为代码和日志留下更多的上下文预算。
隐私优先 + 开放模式: 捕获和 OCR 在 Mac 本地运行,无需服务器上传;JSON 模式在 MIT 下发布,因此团队可以验证、生成或构建导出器。

SlimSnap 的使用场景

面向开发人员的基于 CLI 的 UI 调试: 在诊断无法接受图像的环境中的 UI 错误(组件未对齐、标签错误、按钮禁用)时,将 SlimSnap JSON 粘贴到 Claude Code/Aider/Codex CLI 中。
大规模 QA 和错误报告: 用结构化元素坐标 + OCR 文本替换工单中模糊的屏幕截图,从而实现可重现的错误报告和分布式团队之间更轻松的分类。
客户支持和事件响应: 支持代理可以将用户的 UI 屏幕截图转换为文本数据,以便更快地进行故障排除、可搜索的日志和更清晰的升级说明。
CI/CD 和远程故障排除 (SSH/终端): 将 UI 状态作为 JSON 附加到 CI 日志、终端会话或 git 提交中,从而使 UI 问题可以在纯文本管道和代码审查中进行审查。
UX 审查和设计反馈循环: 设计师和产品经理可以注释 UI 问题并分享精确的、机器可读的反馈(什么元素、在哪里、为什么)以加快迭代。

优点

在图像无法工作的地方工作:输出可在终端、SSH、CI 日志和纯文本 AI 代理中使用的纯文本 JSON。
更可靠的 UI 引用:元素 ID + 边界框与自然语言屏幕截图描述相比,减少了歧义。
更低的模型成本/上下文使用:通常比视觉粘贴的令牌更少,尤其是在长时间的迭代会话中。
隐私导向:捕获和 OCR 在本地运行;屏幕截图无需离开 Mac。

缺点

平台限制:目前仅限 Mac(Windows/Linux 需要替代导出器或手写 JSON)。
取决于 OCR/元素检测质量:复杂或不寻常的 UI 可能会产生不完美的提取,需要手动澄清。
主要针对代理工作流进行优化:如果您的工作流已经支持端到端直接图像输入,则收益较小。

如何使用 SlimSnap

1. 下载 SlimSnap (Mac): 访问 https://slimsnap.ai/download 并安装 SlimSnap Mac 应用程序。它是免费的,无需注册。
2. 打开您要与代理共享的屏幕: 导航到您需要帮助的 UI(例如,网页、应用程序窗口、错误对话框)。
3. 捕获屏幕区域: 按下 ⌘⇧S,然后点击并拖动以选择要捕获的区域。释放以在 SlimSnap 中创建捕获。
4. 标注重要内容: 在 SlimSnap 编辑器中,添加箭头、标注和高亮显示以指向损坏/重要的 UI 元素。
5. 将捕获复制为结构化 JSON: 使用“复制 JSON”操作。SlimSnap 导出 JSON 表示(带有 OCR 文本 + 规范化边界框的元素,以及您的注释)。
6. 将 JSON 粘贴到您的工具中: 将 JSON 粘贴到任何接受文本的地方——如 Claude Code、Aider、Codex CLI 等终端代理,或 Cursor/Continue.dev 等其他工具,以及问题、CI 日志或 git 提交。
7. 使用元素引用请求 UI 特定修复: 在您的提示中,引用 JSON 的元素/注释(例如,按钮/输入 ID 及其值),以便代理可以确定性地推断您所指向的内容。
8. 迭代:根据需要重新捕获和重新粘贴: 进行更改后,再次进行 SlimSnap 捕获并粘贴新的 JSON,以使用更新的 UI 状态继续调试循环。
9. (可选)使用 Claude Code 技能工作流程: 如果使用 SlimSnap Claude Code 技能,SlimSnap 会在 ~/.slimsnap/config.json 中写入一个配置文件,其中包含您的默认保存文件夹和文件名模式。该技能读取该配置,从文件夹中加载最新的 SlimSnap JSON,并将其注入到代理上下文中。
10. (可选)在没有 Mac 应用程序的情况下生成 SlimSnap JSON: 如果您无法使用 Mac 应用程序,请使用已发布的 MIT 模式 (https://github.com/bickov/slimsnap-schema) 生成任何有效的 SlimSnap JSON。只要 JSON 与模式匹配,工作流程仍然有效。

SlimSnap 常见问题

SlimSnap 是一款 macOS 工具,可让您捕获屏幕截图、进行注释,并复制一个由 OCR 支持的结构化 JSON 表示,您可以将其粘贴到任何接受文本的地方(例如终端和 CLI 编码代理)。

与 SlimSnap 类似的最新 AI 工具

altcheckerai
altcheckerai
AltCheckerAI是一款AI驱动的工具,通过智能建议自动优化图像alt文本,以提高网站的SEO和无障碍性。
IMG Processing
IMG Processing
IMG Processing 是一项强大的 API 服务,通过简单的集成提供快速可靠的图像处理功能,包括上传、变换和加水印。
ImageKit.io
ImageKit.io
ImageKit.io is a comprehensive media management and delivery platform that provides real-time image and video optimization, processing APIs, and Digital Asset Management (DAM) solutions for delivering high-quality visual experiences on websites and apps.
FLORA
FLORA
FLORA是一个创新的AI驱动的创意工具,结合了多个AI功能在一个无限画布上,实现个性化的植物识别、创意设计和互动植物辅助。