2026-06-16站内改写3 分で読了更新: 2026-06-16

2026年にNvidia eGPUをMacで使用してローカルAIを実行する方法

AppleはTiny CorpのTinyGPUドライバを承認し、Apple Silicon MacでNvidiaおよびAMDのeGPUを計算ワークロードに使用できるようになりました。このガイドでは、CUDAベースのローカルAIを実行するためのハードウェア推奨、セットアップ手順、パフォーマンスベンチマークを紹介します。

ソースHacker News AI著者: falava

2026年4月、AppleはTiny Corpが開発したTinyGPUドライバを正式に署名・公証しました。これは、Apple Silicon搭載MacでNvidiaおよびAMDの外付けGPUを計算用途に使用するための初の公式承認経路です。この画期的な進展により、ユーザーはThunderbolt 4経由でRTX 4090などのグラフィックカードをMac Mini M4 Proに接続し、推論、ファインチューニング、画像生成にCUDAアクセラレーションを利用できるようになりました。Macのユニファイドメモリはオーバーフローバッファとして機能します。

TinyGPUドライバは、ジョージ・ホッツ率いるTiny Corpが開発し、グラフィックスではなくコンピュートに特化しています。Appleの標準的な公証プロセスを通過しており、システム整合性保護を無効にする必要はありません。このドライバは、NvidiaのAmpere以降のアーキテクチャ（RTX 3090、4090、5090など）とAMDのRDNA3以降をサポートします。Nvidia GPUの場合、CUDAコンパイルはDockerコンテナ内で行う必要がありますが、AMDのROCmはネイティブに動作します。Tom's Hardwareの分析では、ドライバがAppleの公証要件を満たし、標準のIOKitカーネル拡張APIを使用していることが確認されました。AppleInsiderのテストでは、Sonnet Breakaway Box 750とRTX 4090の組み合わせで動作することが確認されています。eGPU.ioコミュニティは、30以上のGPUとエンクロージャの組み合わせをカバーする互換性データベースをすでにまとめています。

パフォーマンス面では、Thunderbolt 4は約32 Gbpsの実効帯域幅を提供し、ネイティブPCIe 4.0 x16の約半分です。しかし、ほとんどの推論タスクでは、PCIe帯域幅よりもGPUのメモリ帯域幅がボトルネックとなるため、実用上の影響は限定的です。初期ベンチマークによると、LLM推論はネイティブPCIeの60〜85%の性能を発揮し、画像生成やファインチューニングはやや低くなります。具体的には、シングルユーザーのLLM推論では、13B未満のモデルでネイティブPCIeの60〜75%、それ以上のモデルで75〜85%です。Stable Diffusion XL画像生成は55〜65%、ファインチューニングは50〜60%です。

ハードウェアの選択では、24GB GDDR6X VRAMを搭載したRTX 4090が最適な選択肢で、最大30Bパラメータのモデルを扱え、Llama 3 8B Q4では約45〜50 tok/s、70B Q4では9〜10 tok/sを達成します。70Bモデルを実行する場合は、32GB GDDR7のRTX 5090が適しており、8Bモデルで約70〜75 tok/s、70B Q4で13〜15 tok/sですが、750W以上のエンクロージャが必要です。予算が限られている場合は、中古のRTX 3090（約$699〜$999）が同じ24GB VRAMを提供し、性能は4090の約75%で、8Bモデルで35〜38 tok/sです。エントリーレベルのRTX 5060 Ti 16GB（$429〜$479）は8B〜13Bモデルを快適に実行し、8Bモデルで約40〜45 tok/sです。ミッドレンジのRTX 5080（$999〜$1,099）は計算集約型のワークロードに適しています。最も安価なオプションはIntel Arc B580（$249〜$289）で、12GB VRAM、性能は5060 Tiの約半分で、7B〜8Bモデル向けです。

eGPUエンクロージャについては、750W電源搭載のSonnet Breakaway Box 750eX（$349〜$399）がハイエンドGPUに最適です。Razer Core X Chroma（$299〜$349）は700W電源でUSBハブ付きですが、内部クリアランスが狭いです。予算向けのSonnet Breakaway Box 550（$199〜$249）は550Wで、RTX 5060 Tiや5080に適しています。

ホストMacとしては、Mac Mini M4 Pro（$1,399から）が24GBユニファイドメモリとThunderbolt 4を備え、コストパフォーマンスに優れています。Mac Studio M4 Maxは最大128GBメモリをサポートし、大規模モデルをMac上で直接実行できるハイブリッドワークフローに適しています。このエコシステムの成熟により、MacユーザーはついにNvidia GPUを活用したローカルAIを手軽に利用できるようになりました。