AIMIPの紹介:AI気象・気候モデル相互比較プロジェクト
AIMIPは、AI気候モデルを評価するための新しいオープンベンチマークとデータセットであり、従来モデルと同等またはそれ以上の性能を一部の歴史的気候指標で示す一方、長期の温暖化傾向や未知の気候シナリオへの信頼性ある一般化には依然として課題があることを示しています。
- AIMIPは、AI気候モデルを比較するための共有ベンチマークとデータセットを提供します。
- AI気候モデルは、平均的な歴史的気候パターンにおいて競争力のある性能を示します。
Official Allen Institute for AI research feed; verify terms before displaying full body.
AIMIPは、AI気候モデルを評価するための新しいオープンベンチマークとデータセットであり、従来モデルと同等またはそれ以上の性能を一部の歴史的気候指標で示す一方、長期の温暖化傾向や未知の気候シナリオへの信頼性ある一般化には依然として課題があることを示しています。
Artificial Analysisは、多くのベンチマークが見逃す複雑なユーザー指示への追従能力を捉えるため、Ai2のオープンなIFBench評価を採用しています。このベンチマークは実際のユーザー会話に基づき、まだ飽和しておらず、モデルの実用的な性能を測定する重要なツールです。
EMOは、モジュール構造がデータから自動的に現れるように訓練された新しい混合エキスパートモデルです。ユーザーはタスクに特化した少数のエキスパートのみを選択でき、ほぼフルモデルの性能を維持できます。全エキスパートを使用すれば、強力な汎用モデルとしても機能します。
Ai2はNSF OMAIの計算リソースをオンライン化し、完全にオープンなAI研究エコシステムを実現。国家のインフラ投資を再利用可能なモデル、データ、手法、ツールに転換し、科学的発見を加速します。
MolmoAct 2 は完全にオープンなロボティクス基礎モデルであり、より高速で強力な3D動作推論を実現し、新たな両腕操作データセットとともに研究者が研究・再現・拡張できるように提供されます。
暫定CEOピーター・クラークが、急速なAI進歩の中でのAi2のオープンサイエンスへのコミットメント、主要プロジェクト、NSF OMAIイニシアチブ、そしてAIによる科学、身体化AI、環境AIへの将来の方向性について語ります。
AstaBenchの最新アップデートでは、GPT-5.5を含むフロンティアモデルの新たな結果が追加され、英国AISI、General Reasoning、Elicit、SciSpace、Distyl AI、EvoScientistなどからの採用が拡大していることを強調しています。
Ai2はMolmoPointとMolmoWebを発表し、Molmoファミリーを視覚理解から視覚行動へと拡張しました。MolmoPointは入力データを直接選択することで、より正確なポインティングを実現し、複数のベンチマークで最高性能を達成。MolmoWebはスクリーンショットのみでウェブを操作できるビジュアルエージェントで、多くのオープン・クローズドモデルを凌駕します。両方ともオープンソースです。
OlmPoolは26のモデルからなる制御されたスイートで、トレーニングデータと拡張レシピを一定に保っても、小さなアーキテクチャ選択が積み重なり長コンテキスト拡張をはるかに困難にすることを示しています。
OlmoEarth Studioは、OlmoEarth基盤モデルから埋め込みベクトルを計算・エクスポートできるようになりました。これらは類似性検索、少数ショットマッピング、変化検出、教師なし探索などのタスクに使用できます。
2026年のアースデイに、Ai2はEarthRanger、Skylight、OlmoEarthなどのツールを通じて地球保護のためのリアルタイム情報を提供してきた10年を祝います。野生生物の保護から違法漁業の取り締まりまで、これらのAI駆動型プラットフォームは世界中の保護活動を変革しています。
BAR(Branch-Adapt-Route)は、言語モデルの能力を段階的に学習する手法です。ドメインエキスパートを独立に訓練し、混合エキスパートモデルに統合し、他のエキスパートに影響を与えずに任意のエキスパートをアップグレードできます。
Ai2が開発した2つのベンチマーク(ScienceWorldとDiscoveryWorld)は、非常に強力なAI科学エージェントでも人間の科学者が日常的に解決する問題に苦戦することを明らかにしました。ScienceWorldは基本的な実験能力を、DiscoveryWorldはエンドツーエンドの科学的発見能力をテストします。現在のトップモデルはScienceWorldで約80%、DiscoveryWorldの困難なタスクでは約20%の成功率であり、人間の科学者は約70%です。
Ai2がWildDet3Dをリリース。これは単一のRGB画像からオープンボキャブラリーで3D物体検出を行うモデルで、テキスト、ポイント、ボックスプロンプトをサポートし、カメラや物体カテゴリを横断して汎化し、利用可能な場合は深度信号を統合します。同時に、100万枚以上の画像と370万の3Dアノテーション(13Kカテゴリ)を含むWildDet3D-Dataデータセットも公開。Omni3Dベンチマークで34.2 AP(テキストプロンプト)を達成し、複数のゼロショットデータセットで優れた性能を示しました。