Holo3.1:快速且本地的計算機使用代理
HCompany發佈Holo3.1,這是其計算機使用代理模型系列的重大升級,增強了在桌面、移動和不同代理框架中的魯棒性,並首次推出量化檢查點以支持本地推理。
HCompany於2026年6月2日發佈了Holo3.1,這是其計算機使用代理模型系列的重大升級。繼3月推出Holo3後,開發者和企業迅速將其部署於瀏覽器自動化、商業軟件和內部工具等場景。然而,團隊發現僅靠性能不足以滿足用户需求——用户需要跨桌面和移動環境的無縫體驗,以及從雲端到完全本地執行的靈活部署。
Holo3.1正是為此而生。該模型在三個關鍵維度上提升了魯棒性:環境支持(Web、桌面、移動)、代理框架兼容性以及部署目標。特別地,Holo3.1首次發佈了量化檢查點,包括FP8、Q4 GGUF和NVFP4,為本地推理優化。
在移動自動化方面,Holo3.1的35B-A3B模型在AndroidWorld上從67%提升至79.3%,而4B和9B小模型也從58%提升至72%。在跨框架性能上,Holo3.1引入了函數調用協議,與原有的結構化JSON輸出互補,在OSWorld和內部基準測試中與原生執行達到近乎一致的表現,同時在與Holotab產品框架的集成中比Holo3提升了25%以上。
為支持成本效益和私有部署,Holo3.1提供了多種模型尺寸:超輕量級的0.8B、經濟高效的4B、平衡性能與延遲的9B,以及最先進的35B-A3B。量化版本是本次發佈的亮點:NVFP4(W4A16)在DGX Spark上實現了1.41倍於FP8和1.74倍於BF16的總吞吐量。結合與NVIDIA合作開發的代理框架優化,端到端平均步驟時間從6.8秒縮短至3.3秒,提速約2倍。
Holo3.1還發布了Q4 GGUF檢查點,專為在Windows或Mac機器上本地運行代理設計,模型可運行在同一設備(如Apple Silicon)或同一網絡的DGX Spark上,確保數據完全私有且不離開用户網絡。
Holo3.1系列已在Hugging Face和Holo Models API上提供。開發者可通過技術博客和Hugging Face集合獲取詳情。HCompany期待看到社區基於Holo3.1構建更多創新應用。