AI News HubLIVE
站内改写2 分钟阅读

AI加密货币价格预测模型基准测试

Coinsignal推出全新AI模型基准测试平台,对13个模型在加密货币价格预测上的表现进行排名。OpenAI的GPT-5.4以73.8%的平均准确率位居第一,近期准确率高达78.5%。基准测试涵盖方向、区间接近度和区间重叠三个准确性维度。

来源Hacker News AI作者: docuru

Coinsignal近日推出了一个全新的AI模型基准测试平台,专门用于评估不同AI模型在加密货币价格预测方面的表现。该平台目前跟踪了13个AI模型,覆盖了多个主流加密货币,包括ADA、AVAX、BNB、BTC、DOGE和ETH等。

根据最新的排名,OpenAI的GPT-5.4模型以73.8%的平均准确率位居榜首,并在近期表现中达到78.5%的准确率。该模型在超过1000次预测中展现了较高的稳定性和准确性。紧随其后的是MiniMax的m2.7模型,平均准确率为71.7%,以及Xiaomi的mimo-v2.5系列模型,平均准确率在71%左右。

基准测试采用多维度的评估体系,包括方向预测、区间接近度和区间重叠三个核心准确性指标。此外,还引入了命中率(评分至少70%的预测比例)、一致性(奖励低方差模型)、校准度(检查信心与实际结果匹配程度)和时效性(区分近期表现与历史表现)等辅助指标。

值得注意的是,排名靠前的模型在一致性和校准度上表现较好,而排名靠后的模型往往在这些方面有所欠缺。例如,OpenAI的GPT-5.4在一致性得分高达80.3%,校准度得分为-8.7%(负值表示略微过度自信)。而最后一名DeepSeek的v4-pro模型在一致性得分仅为79.4%,校准度得分+10.3%(表示过于保守)。

该平台还提供了每个模型的高置信度预测平均准确率,以及最近验证时间等详细信息。例如,GPT-5.4的高置信度预测平均准确率为57.4%,而DeepSeek v4-pro为42.3%。用户可以根据需要筛选和比较不同模型的性能。Coinsignal表示,该基准测试将持续更新,以反映AI模型在加密货币预测领域的最新进展。

从整体排名来看,OpenAI的模型表现突出,但其他模型如Xiaomi的mimo-v2.5-pro在近期准确率上达到了78.5%,与GPT-5.4持平,表明竞争依然激烈。此外,Google的Gemini 3 Flash预览版排名第11,平均准确率62.5%,显示出一定的潜力。该基准测试为投资者和研究人员提供了一个客观的参考工具,有助于在加密货币预测中做出更明智的模型选择。