AI News HubLIVE
站內改寫1 分鐘閱讀

ParseHawk:完全本地的文檔AI,提供API、CLI和Web UI

ParseHawk是一款完全本地運行的文檔AI工具,能夠將PDF、掃描件、圖像、文本文件和Markdown轉換為結構化JSON,無需將敏感文檔發送至第三方AI API。它基於vLLM,支持Linux NVIDIA和macOS Apple Silicon,提供API、CLI和Web UI,允許用户自定義提取模式、進行零樣本或少樣本提取,並輸出經過驗證的JSON。本文介紹了其核心功能、系統要求、快速入門、提取器與模式定義、運行配置、遙測數據以及本地數據管理。

來源Hacker News AI作者: francisrafal

ParseHawk是一款面向開發者和團隊的本地優先文檔AI工具,其核心能力是從非結構化文檔中提取結構化數據。與傳統雲服務不同,ParseHawk默認在用户自己的硬件上運行,無需將發票、合同、醫療記錄等敏感信息上傳至第三方API。

工具支持多種輸入格式,包括PDF、掃描件、圖像、純文本和Markdown。用户可以通過定義JSON Schema(支持Draft 2020-12)來指定提取目標,並利用自然語言指令進行零樣本提取。對於需要更多指導的文檔類型,可以添加少量示例(few-shot)來提升提取質量。所有提取結果均經過模式驗證,確保輸出格式準確。

ParseHawk的架構由底層推理引擎驅動,默認為NuExtract3-W4A16模型,通過vLLM在本地運行。在Linux系統上,它利用NVIDIA GPU和Docker容器;在macOS Apple Silicon上,則直接使用vLLM Metal。推薦至少16GB統一內存(macOS)或16GB顯存(Linux)以保證流暢運行。工具還提供豐富的配置項,如最大模型長度、GPU內存利用率、PDF渲染DPI等,用户可通過環境變量或CLI命令調整。

用户可通過三種方式與ParseHawk交互:Web UI(基於Vite構建)、REST API(自動生成OpenAPI文檔)和命令行工具(parsehawk)。CLI不僅管理數據操作(文件上傳、提取器創建、作業提交),還控制本地棧的啓動、停止和診斷。快速啓動只需執行parsehawk start,即可在本地打開Web界面和API文檔。

在數據隱私方面,ParseHawk僅收集匿名使用統計(安裝事件和運行事件),不發送文件內容或提取結果。用户可通過設置環境變量選擇退出。所有本地數據默認存儲在data/目錄下,包括SQLite數據庫、上傳文件、日誌等,可隨時刪除重置。

對於開發者,項目提供了完整的開發環境配置(需git、just、uv、pnpm),支持產品模式(Docker)和本地源碼模式。總體而言,ParseHawk為需要處理私有文檔的團隊提供了一個強大且安全的本地化解決方案。