2026-05-31 17:35 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

AI加密货币价格预测模型基准测试

Coinsignal推出全新AI模型基准测试平台，对13个模型在加密货币价格预测上的表现进行排名。OpenAI的GPT-5.4以73.8%的平均准确率位居第一，近期准确率高达78.5%。基准测试涵盖方向、区间接近度和区间重叠三个准确性维度。

来源Hacker News AI作者: docuru

Coinsignal近日推出了一个全新的AI模型基准测试平台，专门用于评估不同AI模型在加密货币价格预测方面的表现。该平台目前跟踪了13个AI模型，覆盖了多个主流加密货币，包括ADA、AVAX、BNB、BTC、DOGE和ETH等。

根据最新的排名，OpenAI的GPT-5.4模型以73.8%的平均准确率位居榜首，并在近期表现中达到78.5%的准确率。该模型在超过1000次预测中展现了较高的稳定性和准确性。紧随其后的是MiniMax的m2.7模型，平均准确率为71.7%，以及Xiaomi的mimo-v2.5系列模型，平均准确率在71%左右。

基准测试采用多维度的评估体系，包括方向预测、区间接近度和区间重叠三个核心准确性指标。此外，还引入了命中率（评分至少70%的预测比例）、一致性（奖励低方差模型）、校准度（检查信心与实际结果匹配程度）和时效性（区分近期表现与历史表现）等辅助指标。

值得注意的是，排名靠前的模型在一致性和校准度上表现较好，而排名靠后的模型往往在这些方面有所欠缺。例如，OpenAI的GPT-5.4在一致性得分高达80.3%，校准度得分为-8.7%（负值表示略微过度自信）。而最后一名DeepSeek的v4-pro模型在一致性得分仅为79.4%，校准度得分+10.3%（表示过于保守）。

该平台还提供了每个模型的高置信度预测平均准确率，以及最近验证时间等详细信息。例如，GPT-5.4的高置信度预测平均准确率为57.4%，而DeepSeek v4-pro为42.3%。用户可以根据需要筛选和比较不同模型的性能。Coinsignal表示，该基准测试将持续更新，以反映AI模型在加密货币预测领域的最新进展。

从整体排名来看，OpenAI的模型表现突出，但其他模型如Xiaomi的mimo-v2.5-pro在近期准确率上达到了78.5%，与GPT-5.4持平，表明竞争依然激烈。此外，Google的Gemini 3 Flash预览版排名第11，平均准确率62.5%，显示出一定的潜力。该基准测试为投资者和研究人员提供了一个客观的参考工具，有助于在加密货币预测中做出更明智的模型选择。