2026-06-30 16:15 UTC+8站内改写1 分钟阅读更新: 2026-06-30 16:29 UTC+8

SlimSnap：截取屏幕元素，为编程助手生成JSON

SlimSnap是一款macOS应用，可将屏幕截图转换为JSON格式，供Claude Code、Aider等终端AI编程助手直接读取。它支持区域捕获、箭头标注、本地OCR识别，并能减少55%以上的令牌消耗。所有处理均在本地完成，无需上传或注册。

来源Hacker News AI作者: bickov

SlimSnap 是一款专为 macOS 设计的轻量级应用，它解决了终端 AI 编程助手（如 Claude Code、Aider、Codex CLI）无法直接读取图片的核心痛点。用户只需使用快捷键 ⌘⇧S 在屏幕上拖拽选择任意区域，即可完成截图。随后，应用会通过内置 OCR 自动识别该区域内的所有文字元素（标签、按钮、错误提示等），并将其与每个元素的精确位置（以标准化 0 到 1 坐标表示的边界框）一并提取，最终生成结构化的 JSON 数据。用户还可添加箭头、标注和高亮等注释来强调重点。

生成的 JSON 文件可一键复制并直接粘贴到任何接受文本输入的终端或编程助手中。根据官方数据，一张截图在 Claude Code (Sonnet) 中的消耗约为 1,568 个视觉令牌，而 SlimSnap 生成的 JSON 仅为 600 至 800 个令牌，在 Sonnet 模型上节省约 55% 的令牌，在 Opus 4.7 和 4.8 模型上节省高达 85%。这意味着在长时间的迭代会话中，上下文窗口中有更多空间留给实际代码。

隐私方面，所有捕获和 OCR 处理都在用户的 Mac 上本地完成，无需创建账户，截图数据不会离开设备。此外，SlimSnap 的 JSON 模式和 Claude Code 技能在 GitHub 上以 MIT 许可证开源，但 macOS 应用本身为闭源。应用目前仅支持 macOS，开发者正在根据用户需求评估 Windows 和 Linux 版本的可能性。

对于常见问题，SlimSnap 团队也给出了明确解答：与直接粘贴截图到 ChatGPT 相比，SlimSnap 在长时间迭代会话中更便宜且更可靠；裁剪截图不会降低令牌成本，因为 API 按图像计费上限固定；暗模式界面同样支持，仅低对比度主题需要额外检查。JSON 格式保留了元素的文本、位置和颜色信息，虽然丢失了像素级美学细节，但对于修复具体元素的循环任务来说更加精确。用户还可以通过电子邮件向团队提出对新平台的支持请求。