2026-06-02 22:13 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Holo3.1：快速且本地的計算機使用代理

HCompany發佈Holo3.1，這是其計算機使用代理模型系列的重大升級，增強了在桌面、移動和不同代理框架中的魯棒性，並首次推出量化檢查點以支持本地推理。

HCompany於2026年6月2日發佈了Holo3.1，這是其計算機使用代理模型系列的重大升級。繼3月推出Holo3後，開發者和企業迅速將其部署於瀏覽器自動化、商業軟件和內部工具等場景。然而，團隊發現僅靠性能不足以滿足用户需求——用户需要跨桌面和移動環境的無縫體驗，以及從雲端到完全本地執行的靈活部署。

Holo3.1正是為此而生。該模型在三個關鍵維度上提升了魯棒性：環境支持（Web、桌面、移動）、代理框架兼容性以及部署目標。特別地，Holo3.1首次發佈了量化檢查點，包括FP8、Q4 GGUF和NVFP4，為本地推理優化。

在移動自動化方面，Holo3.1的35B-A3B模型在AndroidWorld上從67%提升至79.3%，而4B和9B小模型也從58%提升至72%。在跨框架性能上，Holo3.1引入了函數調用協議，與原有的結構化JSON輸出互補，在OSWorld和內部基準測試中與原生執行達到近乎一致的表現，同時在與Holotab產品框架的集成中比Holo3提升了25%以上。

為支持成本效益和私有部署，Holo3.1提供了多種模型尺寸：超輕量級的0.8B、經濟高效的4B、平衡性能與延遲的9B，以及最先進的35B-A3B。量化版本是本次發佈的亮點：NVFP4（W4A16）在DGX Spark上實現了1.41倍於FP8和1.74倍於BF16的總吞吐量。結合與NVIDIA合作開發的代理框架優化，端到端平均步驟時間從6.8秒縮短至3.3秒，提速約2倍。

Holo3.1還發布了Q4 GGUF檢查點，專為在Windows或Mac機器上本地運行代理設計，模型可運行在同一設備（如Apple Silicon）或同一網絡的DGX Spark上，確保數據完全私有且不離開用户網絡。

Holo3.1系列已在Hugging Face和Holo Models API上提供。開發者可通過技術博客和Hugging Face集合獲取詳情。HCompany期待看到社區基於Holo3.1構建更多創新應用。