AI News HubLIVE
站内改写2 分で読了

Show HN: ProData AI – 自動データサイエンスのための14のMCPツール

ProData AI は、Claudeのモデルコンテキストプロトコル(MCP)と統合されたプロフェッショナルグレードの自動データサイエンスプラットフォームです。生のCSVから、クリーンデータ、機械学習モデル、予測、異常検知、クラスタリング、相関分析、SQL生成、インタラクティブダッシュボード、AIによる説明までのエンドツーエンドのデータパイプラインを、1つのサーバー内の14のツールでコード不要で提供します。

ソースHacker News AI著者: varunwalekar

ProData AI は、Claudeのモデルコンテキストプロトコル(MCP)と統合されたプロフェッショナルグレードの自動データサイエンスプラットフォームです。このプラットフォームは、1つのサーバー内で14の強力なツールを提供し、生のCSVファイルからクリーンデータ、機械学習モデル、時系列予測、異常検知、クラスタリング、相関分析、SQL生成、インタラクティブダッシュボード、AIによる説明までの完全なデータパイプラインを構築します。コードは一切不要です。

主要なツールは以下の通りです。

  • analyze_dataset_tool:データセットの統計プロファイリング(平均、中央値、標準偏差、欠損値、重複、データ品質スコア)を実行。
  • train_automl_models_tool:6つのMLモデルを自動訓練・比較し、最良のモデルとR²または精度スコア、特徴量重要度を返す。
  • forecast_timeseries_tool:Prophetベースの時系列予測(信頼区間とMAPE検証スコア付き)。
  • get_feature_importance_tool:ランダムフォレストを使用してターゲット変数を駆動する上位特徴量を特定・ランク付け。
  • generate_report_tool:統計、ML結果、データ品質評価、推奨事項をまとめた包括的なレポートを作成。
  • clean_dataset_tool:欠損値、重複、空白、外れ値を自動処理し、クリーンなCSVと変更ログを返す。
  • detect_anomalies_tool:孤立フォレスト、Zスコア、IQRを使用して異常行をフラグ付けし、異常スコアと異常除去後のCSVを返す。
  • compare_datasets_tool:2つのCSVを並べて比較(スキーマ差分、統計的変化、分布変化、類似性判定)。
  • cluster_data_tool:K-Meansクラスタリングでセグメントプロファイル、サイズ、主要な識別特徴を返す(顧客セグメンテーションに最適)。
  • correlation_analysis_tool:完全な相関行列とp値、上位の相関ペア、多重共線性警告を計算。
  • explain_model_tool:Claude駆動の平易な英語によるML結果の説明(ビジネスインサイトと実行可能な推奨事項付き)。
  • generate_dashboard_tool:KPIカード、折れ線グラフ、棒グラフ、散布図、ドーナツグラフを含む自己完結型のインタラクティブHTMLダッシュボードを返す。
  • suggest_visualizations_tool:列タイプを分析し、最適なチャートタイプとその理由、列マッピングを推奨。
  • generate_sql_tool:Claudeを使用して自然言語をSQLクエリに変換。

典型的なユースケースとしては、サプライチェーンマネージャーがforecast_timeseries_toolで在庫需要を予測、不正アナリストがdetect_anomalies_toolで不審な取引を検出、マーケティングアナリストがcluster_data_toolで顧客をセグメント化、データエンジニアがclean_dataset_toolでパイプラインにデータをロード前のクレンジング、ビジネスアナリストがexplain_model_toolで取締役会向けのMLサマリーを作成、研究者がcompare_datasets_toolでデータドリフトを検出、開発者がgenerate_sql_toolで自然言語をSQLに変換、BIチームがgenerate_dashboard_toolでCSVから即座にダッシュボードを作成するなどがあります。

ProData AI は、カスタムMLパイプラインをゼロから構築することなく、プロフェッショナルグレードのデータサイエンス出力を必要とするデータアナリスト、ビジネスアナリスト、データエンジニア、ソフトウェア開発者、技術研究者向けに設計されています。データクレンジング、モデル訓練、トレンド予測、異常検知、顧客セグメンテーション、ダッシュボード生成など、ProData AI は1つのMCPサーバーで全パイプラインを処理します。Claude Desktop、Cursor、VS Code、Windsurf、およびMCP互換の任意のクライアントと互換性があります。