2026-05-16 16:48 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

Show HN：用于本地LLM推理和GPU/CPU上XGBoost训练的AI/ML基准测试

一个开源的基准测试套件，通过一条命令即可全面测试本地GPU/CPU在AI/ML工作负载上的性能，包括Ollama LLM推理和XGBoost训练，并自动生成交互式HTML报告。

来源Hacker News AI作者: albedan

AI/ML GPU Bench 是一个开源基准测试套件，旨在帮助用户评估本地GPU和CPU在典型人工智能和机器学习工作负载上的性能。该项目由 GitHub 用户 albedan 创建，目前获得了13颗星和0个分支。

该套件的核心功能是通过一条命令执行完整的基准测试，并生成交互式HTML报告。它涵盖了两种主要工作负载：Ollama LLM推理（支持3B到14B参数的多种模型）和XGBoost训练与推理（使用HIGGS数据集，从10万行到1000万行以上）。所有测试都通过一个YAML配置文件（ai_bench_suite.yaml）和运行脚本（run_suite.py）编排。

使用非常简单：克隆仓库后，运行uv run run_suite.py即可。首次运行可能需要更长的时间，因为uv会自动创建环境并安装依赖。如果需要进行Ollama基准测试，需要确保Ollama已安装并运行在http://localhost:11434。还可以使用--autopull标志自动拉取缺失的Ollama模型。

测试结果会以CSV文件记录，并自动执行Jupyter笔记本生成HTML报告，在浏览器中打开。报告包含与参考系统的对比。此外，项目还提供了一个定期更新的Streamlit仪表板（https://ai-ml-gpu-bench.streamlit.app），方便查看不断增长的结果集。

为了帮助建立参考数据库，用户可以选择上传加密的测试结果（使用RSA 4096位加密）。上传仅包含技术基准数据，不包含提示、模型输出或系统文件。用户可以使用--no-upload-results标志完全跳过上传。

项目支持多种运行模式：可以单独运行Ollama或XGBoost基准测试，也可以使用--fast选项只测试较快的模型。对于没有GPU的用户，套件会自动跳过GPU测试。对于AMD GPU，Ollama可以利用GPU加速，而XGBoost可能仅在CPU上运行。

该套件还注重隐私保护：结果分享默认启用，但用户可以通过命令行选项选择退出。所有基准测试参数都可以在YAML文件中自定义，例如注释掉不需要测试的LLM模型。

总之，AI/ML GPU Bench 是一个全面、易用的本地AI/ML性能测试工具，适合从个人开发者到研究人员的各类用户。