SlimSnap:截取屏幕元素,為編程助手生成JSON
SlimSnap是一款macOS應用,可將屏幕截圖轉換為JSON格式,供Claude Code、Aider等終端AI編程助手直接讀取。它支持區域捕獲、箭頭標註、本地OCR識別,並能減少55%以上的令牌消耗。所有處理均在本地完成,無需上傳或註冊。
SlimSnap 是一款專為 macOS 設計的輕量級應用,它解決了終端 AI 編程助手(如 Claude Code、Aider、Codex CLI)無法直接讀取圖片的核心痛點。用户只需使用快捷鍵 ⌘⇧S 在屏幕上拖拽選擇任意區域,即可完成截圖。隨後,應用會通過內置 OCR 自動識別該區域內的所有文字元素(標籤、按鈕、錯誤提示等),並將其與每個元素的精確位置(以標準化 0 到 1 座標表示的邊界框)一併提取,最終生成結構化的 JSON 數據。用户還可添加箭頭、標註和高亮等註釋來強調重點。
生成的 JSON 文件可一鍵複製並直接粘貼到任何接受文本輸入的終端或編程助手中。根據官方數據,一張截圖在 Claude Code (Sonnet) 中的消耗約為 1,568 個視覺令牌,而 SlimSnap 生成的 JSON 僅為 600 至 800 個令牌,在 Sonnet 模型上節省約 55% 的令牌,在 Opus 4.7 和 4.8 模型上節省高達 85%。這意味着在長時間的迭代會話中,上下文窗口中有更多空間留給實際代碼。
隱私方面,所有捕獲和 OCR 處理都在用户的 Mac 上本地完成,無需創建賬户,截圖數據不會離開設備。此外,SlimSnap 的 JSON 模式和 Claude Code 技能在 GitHub 上以 MIT 許可證開源,但 macOS 應用本身為閉源。應用目前僅支持 macOS,開發者正在根據用户需求評估 Windows 和 Linux 版本的可能性。
對於常見問題,SlimSnap 團隊也給出了明確解答:與直接粘貼截圖到 ChatGPT 相比,SlimSnap 在長時間迭代會話中更便宜且更可靠;裁剪截圖不會降低令牌成本,因為 API 按圖像計費上限固定;暗模式界面同樣支持,僅低對比度主題需要額外檢查。JSON 格式保留了元素的文本、位置和顏色信息,雖然丟失了像素級美學細節,但對於修復具體元素的循環任務來説更加精確。用户還可以通過電子郵件向團隊提出對新平台的支持請求。