AI News HubLIVE
站內改寫1 分鐘閱讀

SlimSnap:擷取螢幕元素,為程式設計助手生成JSON

SlimSnap是一款macOS應用,可將螢幕截圖轉換為JSON格式,供Claude Code、Aider等終端AI程式設計助手直接讀取。它支援區域捕獲、箭頭標註、本地OCR識別,並能減少55%以上的令牌消耗。所有處理均在本地完成,無需上傳或註冊。

來源Hacker News AI作者: bickov

SlimSnap 是一款專為 macOS 設計的輕量級應用,它解決了終端 AI 程式設計助手(如 Claude Code、Aider、Codex CLI)無法直接讀取圖片的核心痛點。使用者只需使用快捷鍵 ⌘⇧S 在螢幕上拖拽選擇任意區域,即可完成截圖。隨後,應用會透過內建 OCR 自動識別該區域內的所有文字元素(標籤、按鈕、錯誤提示等),並將其與每個元素的精確位置(以標準化 0 到 1 座標表示的邊界框)一併提取,最終生成結構化的 JSON 資料。使用者還可新增箭頭、標註和高亮等註釋來強調重點。

生成的 JSON 檔案可一鍵複製並直接貼上到任何接受文本輸入的終端或程式設計助手中。根據官方資料,一張截圖在 Claude Code (Sonnet) 中的消耗約為 1,568 個視覺令牌,而 SlimSnap 生成的 JSON 僅為 600 至 800 個令牌,在 Sonnet 模型上節省約 55% 的令牌,在 Opus 4.7 和 4.8 模型上節省高達 85%。這意味著在長時間的迭代會話中,上下文視窗中有更多空間留給實際程式碼。

隱私方面,所有捕獲和 OCR 處理都在使用者的 Mac 上本地完成,無需建立賬戶,截圖資料不會離開裝置。此外,SlimSnap 的 JSON 模式和 Claude Code 技能在 GitHub 上以 MIT 許可證開源,但 macOS 應用本身為閉源。應用目前僅支援 macOS,開發者正在根據使用者需求評估 Windows 和 Linux 版本的可能性。

對於常見問題,SlimSnap 團隊也給出了明確解答:與直接貼上截圖到 ChatGPT 相比,SlimSnap 在長時間迭代會話中更便宜且更可靠;裁剪截圖不會降低令牌成本,因為 API 按影像計費上限固定;暗模式介面同樣支援,僅低對比度主題需要額外檢查。JSON 格式保留了元素的文本、位置和顏色資訊,雖然丟失了畫素級美學細節,但對於修復具體元素的迴圈任務來說更加精確。使用者還可以透過電子郵件向團隊提出對新平臺的支援請求。