Show HN: ProData AI – 自動資料科學的14個MCP工具
ProData AI 是一個整合了Claude協議的專業級自動資料科學平臺,提供從原始CSV到清洗資料、機器學習模型、預測、異常檢測、聚類、相關性分析、SQL生成、互動式儀表盤和AI解釋的端到端資料管道,全部在一個伺服器中透過14個工具實現,無需編碼。
ProData AI 是一個專業級的自動資料科學平臺,深度整合了Claude的模型上下文協議(MCP)。該平臺在一個伺服器中提供了14個強大的工具,構建了一條完整的資料管道——從原始CSV檔案到清洗後的資料、機器學習模型、時間序列預測、異常檢測、聚類分析、相關性分析、SQL生成、互動式儀表盤以及AI驅動的解釋,整個過程無需編寫任何程式碼。
核心工具包括:
- analyze_dataset_tool:對資料集進行全面的統計分析,包括均值、中位數、標準差、缺失值、重複項及資料質量評分。
- train_automl_models_tool:自動訓練並比較6種機器學習模型,返回最佳模型及R²或準確率分數與特徵重要性。
- forecast_timeseries_tool:基於Prophet的時間序列預測,提供置信區間和MAPE驗證分數。
- get_feature_importance_tool:使用隨機森林識別並排序影響目標變數的關鍵特徵。
- generate_report_tool:整合統計、ML結果、資料質量評估和建議,生成綜合報告。
- clean_dataset_tool:自動處理缺失值、重複項、空白和異常值,返回清洗後的CSV及詳細更改日誌。
- detect_anomalies_tool:使用孤立森林、Z-score或IQR標記異常行,返回異常分數及去除異常的清潔CSV。
- compare_datasets_tool:對兩個CSV進行並排比較,包括模式差異、統計變化、分佈差異及總體相似度判定。
- cluster_data_tool:K-Means聚類,返回聚類概況、大小及主要區分特徵,適用於客戶細分。
- correlation_analysis_tool:計算完整相關矩陣與p值,識別最高相關對及多重共線性警告。
- explain_model_tool:由Claude驅動的通俗易懂的ML結果解釋,附帶商業建議和可操作建議。
- generate_dashboard_tool:生成獨立的互動式HTML儀表盤,包含KPI卡片、折線圖、柱狀圖、散點圖和環形圖。
- suggest_visualizations_tool:分析列型別並推薦最佳圖表型別及理由和列對映。
- generate_sql_tool:使用Claude將自然語言轉換為SQL查詢。
典型使用場景包括:供應鏈經理利用forecast_timeseries_tool預測庫存需求;欺詐分析師透過detect_anomalies_tool識別可疑交易;市場分析師使用cluster_data_tool進行客戶分群;資料工程師用clean_dataset_tool清理資料;業務分析師藉助explain_model_tool為董事會準備ML摘要;研究人員透過compare_datasets_tool檢測資料漂移;開發者用generate_sql_tool將語言問題轉化為SQL;BI團隊用generate_dashboard_tool快速建立儀表盤。
ProData AI 適合資料分析師、業務分析師、資料工程師、軟體開發人員和技術研究人員,他們需要專業級的資料科學輸出,而無需手動構建定製ML管道。無論是清洗資料、訓練模型、預測趨勢、檢測異常、細分客戶還是生成儀表盤,ProData AI 都在一個MCP伺服器中處理整個流程。該平臺與Claude Desktop、Cursor、VS Code、Windsurf及任何相容MCP的客戶端配合使用。