Show HN: ProData AI – 自动数据科学的14个MCP工具
ProData AI 是一个集成了Claude协议的专业级自动数据科学平台,提供从原始CSV到清洗数据、机器学习模型、预测、异常检测、聚类、相关性分析、SQL生成、交互式仪表盘和AI解释的端到端数据管道,全部在一个服务器中通过14个工具实现,无需编码。
ProData AI 是一个专业级的自动数据科学平台,深度集成了Claude的模型上下文协议(MCP)。该平台在一个服务器中提供了14个强大的工具,构建了一条完整的数据管道——从原始CSV文件到清洗后的数据、机器学习模型、时间序列预测、异常检测、聚类分析、相关性分析、SQL生成、交互式仪表盘以及AI驱动的解释,整个过程无需编写任何代码。
核心工具包括:
- analyze_dataset_tool:对数据集进行全面的统计分析,包括均值、中位数、标准差、缺失值、重复项及数据质量评分。
- train_automl_models_tool:自动训练并比较6种机器学习模型,返回最佳模型及R²或准确率分数与特征重要性。
- forecast_timeseries_tool:基于Prophet的时间序列预测,提供置信区间和MAPE验证分数。
- get_feature_importance_tool:使用随机森林识别并排序影响目标变量的关键特征。
- generate_report_tool:整合统计、ML结果、数据质量评估和建议,生成综合报告。
- clean_dataset_tool:自动处理缺失值、重复项、空白和异常值,返回清洗后的CSV及详细更改日志。
- detect_anomalies_tool:使用孤立森林、Z-score或IQR标记异常行,返回异常分数及去除异常的清洁CSV。
- compare_datasets_tool:对两个CSV进行并排比较,包括模式差异、统计变化、分布差异及总体相似度判定。
- cluster_data_tool:K-Means聚类,返回聚类概况、大小及主要区分特征,适用于客户细分。
- correlation_analysis_tool:计算完整相关矩阵与p值,识别最高相关对及多重共线性警告。
- explain_model_tool:由Claude驱动的通俗易懂的ML结果解释,附带商业建议和可操作建议。
- generate_dashboard_tool:生成独立的交互式HTML仪表盘,包含KPI卡片、折线图、柱状图、散点图和环形图。
- suggest_visualizations_tool:分析列类型并推荐最佳图表类型及理由和列映射。
- generate_sql_tool:使用Claude将自然语言转换为SQL查询。
典型使用场景包括:供应链经理利用forecast_timeseries_tool预测库存需求;欺诈分析师通过detect_anomalies_tool识别可疑交易;市场分析师使用cluster_data_tool进行客户分群;数据工程师用clean_dataset_tool清理数据;业务分析师借助explain_model_tool为董事会准备ML摘要;研究人员通过compare_datasets_tool检测数据漂移;开发者用generate_sql_tool将语言问题转化为SQL;BI团队用generate_dashboard_tool快速创建仪表盘。
ProData AI 适合数据分析师、业务分析师、数据工程师、软件开发人员和技术研究人员,他们需要专业级的数据科学输出,而无需手动构建定制ML管道。无论是清洗数据、训练模型、预测趋势、检测异常、细分客户还是生成仪表盘,ProData AI 都在一个MCP服务器中处理整个流程。该平台与Claude Desktop、Cursor、VS Code、Windsurf及任何兼容MCP的客户端配合使用。