AI News HubLIVE
站内改写

Data Formulator 0.7:エンタープライズデータ向けAI搭載データ分析

Data Formulator 0.7は、データ接続、エージェントガイドによる探索、ビジュアライゼーションの改善を共有ワークスペースで統合した、エンタープライズデータ分析向けのオープンソースAIシステムです。

記事インテリジェンス

エンジニア上級

要点

  • エンタープライズデータ分析向けのオープンソースAIシステム
  • データコネクタ機能により、多様なデータソースへの管理・再利用可能な接続をサポート
  • コンテキスト認識エージェントがデータ準備、探索、可視化を支援
  • インタラクティブなワークスペースで反復分析とレポート生成を実現

重要な理由

このニュースが重要なのは、エンタープライズデータ分析向けのオープンソースAIシステムためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

エンタープライズチームは分析にAIシステムをますます活用していますが、エンタープライズデータのワークフローはストレージシステムやツール間で断片化されていることがよくあります。分析を開始する前に、チームは多くの場合、管理された接続の確立、メタデータの準備、権限の管理、複数システムにわたるデータの結合と再形成のためのワークフロー構築が必要です。

データ接続に加えて、分析自体もアナリストやドメインエキスパートにとって依然として困難であり、その多くは深いプログラミングスキルを欠いています。彼らはしばしば新しいメトリクスの計算、データ整理のさまざまな方法の比較、中間出力の検査、ニーズの変化に応じたビジュアライゼーションの洗練が必要です。これらのワークフローは、エンタープライズデータ、ワークフロー履歴、ビジュアライゼーションコンテキストへの永続的なアクセスを欠いた孤立したチャットインタラクション内では再現が困難です。

Microsoft Researchが発表した新しいData Formulator 0.7は、これらの課題に対処するために設計されました。これはオープンソースのAI駆動型データ分析システムであり、断片化されたエンタープライズデータと反復的な分析ワークフローを接続します。さまざまなデータソースへの軽量な接続手段、データ準備、探索、可視化を支援するコンテキスト認識エージェント、そしてユーザーが反復的に分析を洗練して共有できるインタラクティブなワークスペースを提供します。

**データコネクタでエンタープライズデータを接続** Data Formulatorは、チームがデータソースごとに同じ接続を再構築することなく、エンタープライズデータをAI対応ワークスペースに取り込むのに役立ちます。データコネクタ機能は、認証、永続的接続、プレビュー、メタデータをサポートし、データベース、データウェアハウス、BIシステム、オブジェクトストレージ、ローカルファイルにわたる統一ワークスペースモデルを提供します。これにより、プラットフォームチームの統合作業が削減され、ユーザーは手動ファイルアップロードの繰り返しに依存するのではなく、集中管理された再利用可能なデータ接続から作業できるようになります。

**コンテキスト認識エージェントによるデータ分析** コンテキスト認識AIエージェントがData Formulatorの中核を成します。単一のプロンプトとは異なり、Data Formulatorはエージェントに分析ワークスペース全体へのアクセス権を与えます。接続されたデータソース、ロードされたテーブル、以前のチャート、ユーザーの目標などです。エージェントはテキストのみではなく、ツールを通じて推論し行動します。単一のインタラクションで、エージェントはデータの検査、隔離された環境でのコードの作成と実行、チャート仕様の生成、中間ステップを示しながら結果の説明を行うことができます。要求が曖昧な場合、エージェントは進める前に明確化の質問をします。これにより、エージェントはより複雑な分析ワークフローを実行できます。ユーザーの目標に分析を合わせ、データを準備・変換し、フォローアップの質問を提案し、テーブルやチャートをバッチ生成し、すべての結果に対して検証可能で再現可能なコードを作成します。

**反復的なデータ分析のためのワークスペース** Data Formulatorはこれらのエージェントと、オープンエンドな分析ワークフロー向けに設計されたマルチモーダルインターフェースを組み合わせます。ユーザーはデータスレッド(Data Thread)を通じてエージェントと連携します。これは構造化されたチャットで、分析プロセス全体のすべての質問、中間発見、チャートを記録します。長時間のセッションもナビゲート可能で、ユーザーは以前のステップに戻ったり、代替分析に分岐したり、コンテキストを失うことなくそれらを並べて比較したりできます。インタラクティブキャンバスはデータスレッドを補完し、ユーザーが直接ビジュアライゼーションを編集できるようにします。ユーザーが探索からコミュニケーションに移行する際、キャンバス上で直接チャートを洗練したり、自然言語で変更を記述してエージェントにラベル、注釈、レイアウト、色、強調を調整させたりできます。アナリストはレポートを生成し、発見を他の人と共有することもできます。

詳細については、Data FormulatorのデモページまたはGitHubリポジトリをご覧ください。エンタープライズデータの分析ワークフローを開発しているチームは、このプロジェクトを基盤として、自社のシステムと要件にこれらの機能を適応させることができます。