AI加密貨幣價格預測模型基準測試
Coinsignal推出全新AI模型基準測試平臺,對13個模型在加密貨幣價格預測上的表現進行排名。OpenAI的GPT-5.4以73.8%的平均準確率位居第一,近期準確率高達78.5%。基準測試涵蓋方向、區間接近度和區間重疊三個準確性維度。
Coinsignal近日推出了一個全新的AI模型基準測試平臺,專門用於評估不同AI模型在加密貨幣價格預測方面的表現。該平臺目前跟蹤了13個AI模型,覆蓋了多個主流加密貨幣,包括ADA、AVAX、BNB、BTC、DOGE和ETH等。
根據最新的排名,OpenAI的GPT-5.4模型以73.8%的平均準確率位居榜首,並在近期表現中達到78.5%的準確率。該模型在超過1000次預測中展現了較高的穩定性和準確性。緊隨其後的是MiniMax的m2.7模型,平均準確率為71.7%,以及Xiaomi的mimo-v2.5系列模型,平均準確率在71%左右。
基準測試採用多維度的評估體系,包括方向預測、區間接近度和區間重疊三個核心準確性指標。此外,還引入了命中率(評分至少70%的預測比例)、一致性(獎勵低方差模型)、校準度(檢查信心與實際結果匹配程度)和時效性(區分近期表現與歷史表現)等輔助指標。
值得注意的是,排名靠前的模型在一致性和校準度上表現較好,而排名靠後的模型往往在這些方面有所欠缺。例如,OpenAI的GPT-5.4在一致性得分高達80.3%,校準度得分為-8.7%(負值表示略微過度自信)。而最後一名DeepSeek的v4-pro模型在一致性得分僅為79.4%,校準度得分+10.3%(表示過於保守)。
該平臺還提供了每個模型的高置信度預測平均準確率,以及最近驗證時間等詳細資訊。例如,GPT-5.4的高置信度預測平均準確率為57.4%,而DeepSeek v4-pro為42.3%。使用者可以根據需要篩選和比較不同模型的效能。Coinsignal表示,該基準測試將持續更新,以反映AI模型在加密貨幣預測領域的最新進展。
從整體排名來看,OpenAI的模型表現突出,但其他模型如Xiaomi的mimo-v2.5-pro在近期準確率上達到了78.5%,與GPT-5.4持平,表明競爭依然激烈。此外,Google的Gemini 3 Flash預覽版排名第11,平均準確率62.5%,顯示出一定的潛力。該基準測試為投資者和研究人員提供了一個客觀的參考工具,有助於在加密貨幣預測中做出更明智的模型選擇。