2026-05-31 17:35 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

AI加密貨幣價格預測模型基準測試

Coinsignal推出全新AI模型基準測試平臺，對13個模型在加密貨幣價格預測上的表現進行排名。OpenAI的GPT-5.4以73.8%的平均準確率位居第一，近期準確率高達78.5%。基準測試涵蓋方向、區間接近度和區間重疊三個準確性維度。

來源Hacker News AI作者: docuru

Coinsignal近日推出了一個全新的AI模型基準測試平臺，專門用於評估不同AI模型在加密貨幣價格預測方面的表現。該平臺目前跟蹤了13個AI模型，覆蓋了多個主流加密貨幣，包括ADA、AVAX、BNB、BTC、DOGE和ETH等。

根據最新的排名，OpenAI的GPT-5.4模型以73.8%的平均準確率位居榜首，並在近期表現中達到78.5%的準確率。該模型在超過1000次預測中展現了較高的穩定性和準確性。緊隨其後的是MiniMax的m2.7模型，平均準確率為71.7%，以及Xiaomi的mimo-v2.5系列模型，平均準確率在71%左右。

基準測試採用多維度的評估體系，包括方向預測、區間接近度和區間重疊三個核心準確性指標。此外，還引入了命中率（評分至少70%的預測比例）、一致性（獎勵低方差模型）、校準度（檢查信心與實際結果匹配程度）和時效性（區分近期表現與歷史表現）等輔助指標。

值得注意的是，排名靠前的模型在一致性和校準度上表現較好，而排名靠後的模型往往在這些方面有所欠缺。例如，OpenAI的GPT-5.4在一致性得分高達80.3%，校準度得分為-8.7%（負值表示略微過度自信）。而最後一名DeepSeek的v4-pro模型在一致性得分僅為79.4%，校準度得分+10.3%（表示過於保守）。

該平臺還提供了每個模型的高置信度預測平均準確率，以及最近驗證時間等詳細資訊。例如，GPT-5.4的高置信度預測平均準確率為57.4%，而DeepSeek v4-pro為42.3%。使用者可以根據需要篩選和比較不同模型的效能。Coinsignal表示，該基準測試將持續更新，以反映AI模型在加密貨幣預測領域的最新進展。

從整體排名來看，OpenAI的模型表現突出，但其他模型如Xiaomi的mimo-v2.5-pro在近期準確率上達到了78.5%，與GPT-5.4持平，表明競爭依然激烈。此外，Google的Gemini 3 Flash預覽版排名第11，平均準確率62.5%，顯示出一定的潛力。該基準測試為投資者和研究人員提供了一個客觀的參考工具，有助於在加密貨幣預測中做出更明智的模型選擇。