AI News HubLIVE
站內改寫1 分鐘閱讀

ParseHawk:完全本地的文件AI,提供API、CLI和Web UI

ParseHawk是一款完全本地執行的文件AI工具,能夠將PDF、掃描件、影像、文本檔案和Markdown轉換為結構化JSON,無需將敏感文件傳送至第三方AI API。它基於vLLM,支援Linux NVIDIA和macOS Apple Silicon,提供API、CLI和Web UI,允許使用者自定義提取模式、進行零樣本或少樣本提取,並輸出經過驗證的JSON。本文介紹了其核心功能、系統要求、快速入門、提取器與模式定義、執行配置、遙測資料以及本地資料管理。

來源Hacker News AI作者: francisrafal

ParseHawk是一款面向開發者和團隊的本地優先文件AI工具,其核心能力是從非結構化文件中提取結構化資料。與傳統雲服務不同,ParseHawk預設在使用者自己的硬體上執行,無需將發票、合同、醫療記錄等敏感資訊上傳至第三方API。

工具支援多種輸入格式,包括PDF、掃描件、影像、純文本和Markdown。使用者可以透過定義JSON Schema(支援Draft 2020-12)來指定提取目標,並利用自然語言指令進行零樣本提取。對於需要更多指導的文件型別,可以新增少量示例(few-shot)來提升提取質量。所有提取結果均經過模式驗證,確保輸出格式準確。

ParseHawk的架構由底層推理引擎驅動,預設為NuExtract3-W4A16模型,透過vLLM在本地執行。在Linux系統上,它利用NVIDIA GPU和Docker容器;在macOS Apple Silicon上,則直接使用vLLM Metal。推薦至少16GB統一記憶體(macOS)或16GB視訊記憶體(Linux)以保證流暢執行。工具還提供豐富的配置項,如最大模型長度、GPU記憶體利用率、PDF渲染DPI等,使用者可透過環境變數或CLI命令調整。

使用者可透過三種方式與ParseHawk互動:Web UI(基於Vite構建)、REST API(自動生成OpenAPI文件)和命令列工具(parsehawk)。CLI不僅管理資料操作(檔案上傳、提取器建立、作業提交),還控制本地棧的啟動、停止和診斷。快速啟動只需執行parsehawk start,即可在本地開啟Web介面和API文件。

在資料隱私方面,ParseHawk僅收集匿名使用統計(安裝事件和執行事件),不傳送檔案內容或提取結果。使用者可透過設定環境變數選擇退出。所有本地資料預設儲存在data/目錄下,包括SQLite資料庫、上傳檔案、日誌等,可隨時刪除重置。

對於開發者,專案提供了完整的開發環境配置(需git、just、uv、pnpm),支援產品模式(Docker)和本地原始碼模式。總體而言,ParseHawk為需要處理私有文件的團隊提供了一個強大且安全的本地化解決方案。