Show HN: ProData AI – 自動數據科學的14個MCP工具
ProData AI 是一個集成了Claude協議的專業級自動數據科學平台,提供從原始CSV到清洗數據、機器學習模型、預測、異常檢測、聚類、相關性分析、SQL生成、交互式儀表盤和AI解釋的端到端數據管道,全部在一個服務器中通過14個工具實現,無需編碼。
ProData AI 是一個專業級的自動數據科學平台,深度集成了Claude的模型上下文協議(MCP)。該平台在一個服務器中提供了14個強大的工具,構建了一條完整的數據管道——從原始CSV文件到清洗後的數據、機器學習模型、時間序列預測、異常檢測、聚類分析、相關性分析、SQL生成、交互式儀表盤以及AI驅動的解釋,整個過程無需編寫任何代碼。
核心工具包括:
- analyze_dataset_tool:對數據集進行全面的統計分析,包括均值、中位數、標準差、缺失值、重複項及數據質量評分。
- train_automl_models_tool:自動訓練並比較6種機器學習模型,返回最佳模型及R²或準確率分數與特徵重要性。
- forecast_timeseries_tool:基於Prophet的時間序列預測,提供置信區間和MAPE驗證分數。
- get_feature_importance_tool:使用隨機森林識別並排序影響目標變量的關鍵特徵。
- generate_report_tool:整合統計、ML結果、數據質量評估和建議,生成綜合報告。
- clean_dataset_tool:自動處理缺失值、重複項、空白和異常值,返回清洗後的CSV及詳細更改日誌。
- detect_anomalies_tool:使用孤立森林、Z-score或IQR標記異常行,返回異常分數及去除異常的清潔CSV。
- compare_datasets_tool:對兩個CSV進行並排比較,包括模式差異、統計變化、分佈差異及總體相似度判定。
- cluster_data_tool:K-Means聚類,返回聚類概況、大小及主要區分特徵,適用於客户細分。
- correlation_analysis_tool:計算完整相關矩陣與p值,識別最高相關對及多重共線性警告。
- explain_model_tool:由Claude驅動的通俗易懂的ML結果解釋,附帶商業建議和可操作建議。
- generate_dashboard_tool:生成獨立的交互式HTML儀表盤,包含KPI卡片、折線圖、柱狀圖、散點圖和環形圖。
- suggest_visualizations_tool:分析列類型並推薦最佳圖表類型及理由和列映射。
- generate_sql_tool:使用Claude將自然語言轉換為SQL查詢。
典型使用場景包括:供應鏈經理利用forecast_timeseries_tool預測庫存需求;欺詐分析師通過detect_anomalies_tool識別可疑交易;市場分析師使用cluster_data_tool進行客户分羣;數據工程師用clean_dataset_tool清理數據;業務分析師藉助explain_model_tool為董事會準備ML摘要;研究人員通過compare_datasets_tool檢測數據漂移;開發者用generate_sql_tool將語言問題轉化為SQL;BI團隊用generate_dashboard_tool快速創建儀表盤。
ProData AI 適合數據分析師、業務分析師、數據工程師、軟件開發人員和技術研究人員,他們需要專業級的數據科學輸出,而無需手動構建定製ML管道。無論是清洗數據、訓練模型、預測趨勢、檢測異常、細分客户還是生成儀表盤,ProData AI 都在一個MCP服務器中處理整個流程。該平台與Claude Desktop、Cursor、VS Code、Windsurf及任何兼容MCP的客户端配合使用。