2026-05-16 16:48 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Show HN：用於本地LLM推理和GPU/CPU上XGBoost訓練的AI/ML基準測試

一個開源的基準測試套件，通過一條命令即可全面測試本地GPU/CPU在AI/ML工作負載上的性能，包括Ollama LLM推理和XGBoost訓練，並自動生成交互式HTML報告。

來源Hacker News AI作者: albedan

AI/ML GPU Bench 是一個開源基準測試套件，旨在幫助用户評估本地GPU和CPU在典型人工智能和機器學習工作負載上的性能。該項目由 GitHub 用户 albedan 創建，目前獲得了13顆星和0個分支。

該套件的核心功能是通過一條命令執行完整的基準測試，並生成交互式HTML報告。它涵蓋了兩種主要工作負載：Ollama LLM推理（支持3B到14B參數的多種模型）和XGBoost訓練與推理（使用HIGGS數據集，從10萬行到1000萬行以上）。所有測試都通過一個YAML配置文件（ai_bench_suite.yaml）和運行腳本（run_suite.py）編排。

使用非常簡單：克隆倉庫後，運行uv run run_suite.py即可。首次運行可能需要更長的時間，因為uv會自動創建環境並安裝依賴。如果需要進行Ollama基準測試，需要確保Ollama已安裝並運行在http://localhost:11434。還可以使用--autopull標誌自動拉取缺失的Ollama模型。

測試結果會以CSV文件記錄，並自動執行Jupyter筆記本生成HTML報告，在瀏覽器中打開。報告包含與參考系統的對比。此外，項目還提供了一個定期更新的Streamlit儀表板（https://ai-ml-gpu-bench.streamlit.app），方便查看不斷增長的結果集。

為了幫助建立參考數據庫，用户可以選擇上傳加密的測試結果（使用RSA 4096位加密）。上傳僅包含技術基準數據，不包含提示、模型輸出或系統文件。用户可以使用--no-upload-results標誌完全跳過上傳。

項目支持多種運行模式：可以單獨運行Ollama或XGBoost基準測試，也可以使用--fast選項只測試較快的模型。對於沒有GPU的用户，套件會自動跳過GPU測試。對於AMD GPU，Ollama可以利用GPU加速，而XGBoost可能僅在CPU上運行。

該套件還注重隱私保護：結果分享默認啓用，但用户可以通過命令行選項選擇退出。所有基準測試參數都可以在YAML文件中自定義，例如註釋掉不需要測試的LLM模型。

總之，AI/ML GPU Bench 是一個全面、易用的本地AI/ML性能測試工具，適合從個人開發者到研究人員的各類用户。