2026-05-16 17:48 UTC+9サイト内リライト2 分で読了更新: 2026-06-30 22:03 UTC+9

Show HN：ローカルLLM推論とGPU/CPUでのXGBoostトレーニングのためのAI/MLベンチマーク

AI/ML GPU Benchは、1つのコマンドでGPU/CPUのベンチマークを実行し、Ollama LLM推論とXGBoostトレーニングをカバーし、インタラクティブなHTMLレポートを生成するオープンソースのベンチマークスイートです。

ソースHacker News AI著者: albedan

記事インテリジェンス

エンジニア上級

要点

Ollama LLM（3B～14Bパラメータモデル）およびXGBoostトレーニング/推論ベンチマークをサポート
単一コマンドで実行し、HTMLレポートとStreamlitダッシュボードを自動生成
暗号化された結果のアップロード（オプション）でリファレンスデータベース構築に貢献
CPUおよびNVIDIA GPUをサポート、AMD GPUは一部サポート

重要な理由

このニュースが重要なのは、Ollama LLM（3B～14Bパラメータモデル）およびXGBoostトレーニング/推論ベンチマークをサポートためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

AI/ML GPU Benchは、ローカルのGPUおよびCPUが人工知能・機械学習ワークロードにおいてどのようなパフォーマンスを発揮するかを評価するためのオープンソースのベンチマークスイートです。GitHubユーザーのalbedanによって作成され、現在13スター、0フォークを獲得しています。

このスイートの核となる機能は、1つのコマンドで完全なベンチマークを実行し、インタラクティブなHTMLレポートを生成することです。カバーするワークロードは2つ：Ollama LLM推論（3Bから14Bパラメータの複数モデルをサポート）と、XGBoostトレーニング・推論（HIGGSデータセットを使用、10万行から1000万行以上）。すべてのテストはYAML設定ファイル（ai_bench_suite.yaml）と実行スクリプト（run_suite.py）でオーケストレーションされます。

使い方は簡単：リポジトリをクローンし、uv run run_suite.pyを実行するだけです。初回実行は、uvが自動的に環境を作成し依存関係をインストールするため、少し時間がかかる場合があります。Ollamaベンチマークを行うには、Ollamaがインストールされ、http://localhost:11434で実行されている必要があります。--autopullフラグを使用すると、不足しているOllamaモデルを自動的にプルできます。

テスト結果はCSVファイルに記録され、Jupyterノートブックが自動実行されてHTMLレポートが生成され、ブラウザで開きます。レポートにはリファレンスシステムとの比較が含まれます。さらに、定期的に更新されるStreamlitダッシュボード（https://ai-ml-gpu-bench.streamlit.app）も提供されており、増え続ける結果セットを簡単に閲覧できます。

リファレンスデータベースの構築に貢献するため、ユーザーは暗号化された結果（RSA 4096ビット暗号化）をアップロードすることを選択できます。アップロードされるのは技術的なベンチマークデータのみで、プロンプト、モデル出力、システムファイルは含まれません。--no-upload-resultsフラグを使用すれば、アップロードを完全にスキップできます。

プロジェクトは複数の実行モードをサポート：OllamaまたはXGBoostベンチマークのみを個別に実行したり、--fastオプションで高速なモデルのみをテストすることもできます。GPUがない場合、スイートは自動的にGPUテストをスキップします。AMD GPUの場合、OllamaはGPUアクセラレーションを利用できますが、XGBoostはCPUのみで動作する可能性があります。

プライバシーにも配慮：結果共有はデフォルトで有効ですが、コマンドラインオプションでオプトアウトできます。すべてのベンチマークパラメータはYAMLファイルでカスタマイズ可能で、テストしたくないLLMモデルをコメントアウトすることもできます。

要約すると、AI/ML GPU Benchは、個人開発者から研究者まで幅広いユーザーにとって、ローカルAI/MLパフォーマンスを評価するための包括的で使いやすいツールです。