単一のモデルでは救われない:私たちはどのようにAIスタックを構築したか
一つのAIプラットフォームですべてを解決しようとするのは誤りであり、タスクに応じたツール選択が重要だと論じる。セルフホスティング、従量課金、サブスクリプションのコストとプライバシー、欧州のデジタル主権の課題を分析。実際のスタックとして、GitHub Copilot Pro+(開発)、Gemini(業務)、n8n+OpenAI(自動化)を採用し、タスクの複雑さに応じたモデル選択の指針を示す。
AIプラットフォームを選ぶ際、多くの企業は万能なモデルを探そうとするが、それは誤りだ。著者は、同業者から「完璧なAIプラットフォーム」を探して悩んでいる話を聞き、一つのモデルですべてを解決しようとするのは神話に過ぎないと指摘する。実際には、システムアーキテクチャから人事メールまでを一つのモデルで処理しようとすると、コストが高すぎるか能力が不足する。そこで、同社は「聖杯」を探すのをやめ、ツールボックスを構築する道を選んだ。
コスト評価の第一歩は、表面的な価格を超えた要素を考慮することだ。セルフホスティング(LlamaやMistralなど)はプライバシーの点で優れているが、インフラと専門人材のコストが高い。従量課金はスケーラブルで透明だが、開発中のバグのあるループが予算を一瞬で消費するリスクがある。サブスクリプションは予測可能性が魅力だが、ソフトリミットを超えると性能が低下する。さらに、欧州企業にとってはデジタル主権の問題があり、外国モデルに依存することは認知インフラを借りることに等しい。
著者の会社では、開発チームにGitHub Copilot Pro+を採用。コードはGitHubにあり、開発者はVSCodeで作業するため、シームレスな統合が実現した。サブスクリプションモデルは、高生産性のエンジニアリングチームにとって費用対効果が高い。業務部門(マーケティング、人事、管理)には、Google WorkspaceにバンドルされたGeminiを活用。追加コストなしでスプレッドシートやメールの処理が可能だ。自動化には、n8nとOpenAIの組み合わせを標準化。CRM、Notion、BambooHRなどを連携し、必要に応じてOpenAI APIを呼び出すことで、従量課金の利点を最大限に活かしている。
また、タスクの複雑さに応じてモデルを選択する「実行手順書」を導入。複雑な設計やセキュリティレビューにはClaude Opus 4.7、標準的なコードレビューにはClaude Opus 4.6、簡単な修正にはClaude SonnetやGPT-5.4を使い分ける。目標は、AIが一度のセッションで問題を解決し、レート制限を消費しないようにすることだ。
結論として、「最高のAI」を探すのではなく、ワークフローを分析し、メスが必要な場面とハンマーが必要な場面を見極めるべきだ。タスクに適したツールを選ぶことで、チームの生産性が向上し、予算も健全に保たれる。