Daikin Applied AmericasがGenie Codeで一貫性のあるデータパイプラインを大規模に構築する方法
Daikin Applied Americasは、Databricks Genie Codeを使用してデータエンジニアリングの運用モデルを再設計し、MECEスキルフレームワークとメダリオンアーキテクチャを実装して一貫性を確保しています。このAI支援アプローチは、ガバナンスを維持しながらパイプライン開発を加速し、ビジネスコンセプトとの整合性を向上させます。
Daikin Applied Americas(DAA)は、北米全域で業務用HVACシステムの製造とサービスを提供する企業であり、機器のテレメトリー、サプライチェーンデータ、現場サービス記録など、大量の運用データ、製造データ、サービスデータを管理しています。分析とAIのユースケースが増加するにつれ、データチームへのプレッシャーも高まりました。これに対処するため、DAAチームはパイプラインの設計、構築、ガバナンスのためのより構造化された運用モデルを定義し、DatabricksのGenie Codeを活用してそのモデル内での実行を加速しました。
チームは、MECE(相互排他的で集合的に網羅的)スキルフレームワークを導入しました。各スキルはデータエンジニアリングのライフサイクルにおける特定の能力を定義し、メダリオンアーキテクチャ設計、ソース準備、変換パターン、正規化アラインメント、ガバナンス基準をカバーしています。Genie Codeは実行時に関連スキルをロードし、計画と実行中に適用することで、アドホックなプロンプトへの依存から脱却し、定義された実行モデル内で動作するようにしました。
また、メダリオンアーキテクチャの役割を強化し、単なるストレージ層ではなく、パイプライン生成時の明確な決定境界としました。Bronze、Silver、Goldの各層の間には、ソース粒度定義、結合検証、データ安定性チェックなどのチェックポイントが設けられ、開発ワークフロー内で強制されます。これにより、チーム間の一貫性を維持しつつ、迅速な開発中のアーキテクチャの逸脱を防止します。
さらに、パイプライン設計を安定したビジネスエンティティ(機器、顧客、サービスイベント、契約)に基づかせることで、技術モデルとビジネス言語の整合性を向上させました。これにより、下流の作業が改善され、データセットがドメイン間で再利用される際の曖昧さが低減されました。
新しい運用モデルの導入後、チームは明確な変化を経験しました:パイプライン開発が加速し、特に初期の探索と反復段階で効果が顕著でした。エンジニアは定型コードを書く時間を減らし、ビジネスロジックの洗練に集中できるようになりました。チーム間の出力もより一貫し、保守性と再利用性が向上しました。AI生成出力への信頼も高まり、エンジニアは構造的正しさの検証に費やす時間を減らし、迅速に反復できるようになりました。
DAAのデータ・アナリティクス担当シニアディレクターであるTrent Lezer氏は、「目標はAIにさらに多くのルールを守らせることではなく、正しいルールを無視できないようにすることです」と述べています。
構造化された運用モデルとAI支援開発を組み合わせることで、DAAのデータチームは一貫性、明確性、コントロールを維持しながら、より迅速にスケールアップすることができました。スピードとガバナンスが互いに競合するのではなく、強化し合うシステムが構築されたのです。