AI News HubLIVE

ソース分布

  • Hacker News AI9
  • NVIDIA Blog7
  • MarkTechPost6
  • 量子位5
  • arXiv Robotics4
  • The Decoder3
  • AI Business2
  • Artificial Intelligence News2

トピック分布

  • チップ50
  • Agent26
  • 研究14
  • モデル12
  • 政策7
  • スタートアップ5

タイムライン

  • 2026-05-278
  • 2026-05-187
  • 2026-05-195
  • 2026-05-245
  • 2026-05-265
  • 2026-05-203
  • 2026-05-213
  • 2026-05-253

最新動向

NVIDIA Research、ロボット工学をシミュレーションから現実世界へ前進させる

ICRAで、NVIDIA Researchは28本の論文のうち8本を発表し、シミュレーションから現実への転送が、ロボットが動的で予測不能な環境で知覚、推論、計画、行動することを可能にする方法に焦点を当てました。ScheduleStream、COMPASS、Grasp-MPC、SPARRなどの手法は、マルチアーム協調、ナビゲーション、把持、組立タスクにおいて成功率とロバスト性を大幅に向上させます。

  • NVIDIAはICRAでシミュレーションから現実への転送に関する8本の論文を発表
  • マルチアーム協調、クロスロボットナビゲーション、新物体把持、精密組立、視覚言語行動モデルを含む手法
サイト内本文

Nvidia、AIインフラに台湾で年間1500億ドル投資へ

ジェンスン・フアン氏は、米国への5000億ドル投資を約束した後、台湾で年間1500億ドルをAIインフラに投じると発表。台湾がAIチップ製造とパッケージングの中心地であることが浮き彫りに。

  • Nvidiaは台湾でAIインフラに年間1500億ドルを投資する。
  • 5000億ドルの米国データセンター投資にもかかわらず、台湾が製造基盤の中心。
サイト内本文

清華大学に新しい先生:ジェンセン・フアン

NVIDIAのCEOジェンセン・フアンが清華大学経営管理学院の顧問委員会に加わることが明らかになった。委員会はアップルのティム・クックが議長を務め、イーロン・マスク、サティア・ナデラ、マーク・ザッカーバーグ、馬雲らが名を連ねる。フアンは先日、カーネギーメロン大学から名誉博士号を授与された。

  • ジェンセン・フアンが清華大学経営管理学院顧問委員会に参加
  • 委員会はクック議長、マスク、ナデラ、馬雲ら世界的リーダーで構成
サイト内本文

NVIDIA、Codex、Claude Code、Qwen Code向けGRPOトレーニングのためのトークン忠実型ロールアウトフレームワーク「Polar」を公開

NVIDIAの研究者は、エージェントハーネスを変更せずに強化学習で言語エージェントを訓練するロールアウトフレームワークPolarを発表した。Polarはハーネスと推論サーバーの間にモデルAPIプロキシを配置し、トークンレベルの相互作用を捕捉してトレーナー対応の軌跡を再構築する。Qwen3.5-4BベースモデルにGRPOを適用した結果、CodexハーネスでSWE-Bench Verified pass@1を22.6ポイント、Claude Codeで4.8ポイント、Piで6.2ポイント改善した。本フレームワークはNeMo Gym環境として登録され、ProRL Agent Serverリポジトリで公開されている。

  • PolarはモデルAPIプロキシを介して既存のエージェントハーネスを変更せずにRLトレーニングを可能にする
  • Qwen3.5-4BにGRPOを適用し、4つのコーディングハーネスでSWE-Bench Verifiedを最大22.6ポイント改善
サイト内本文

AIファクトリー:知能の新たなインフラストラクチャ

AIファクトリーは、電力をリアルタイムでトークン(知能の単位)に変換する新しいインフラです。エージェンティックAIの拡大に伴い、ワットあたりの性能とトークンあたりのコストが重要経済指標となります。本記事では、AIファクトリーの仕組み、アーキテクチャ最適化、NVIDIAの最新ハードウェアによる効率向上を解説します。

  • AIファクトリーは電力をトークンに変換し、知能を生産する「発電所」である。
  • 自律エージェントの台頭により、推論ワークロードはより深く複雑になり、リアルタイム調整が必要。
サイト内本文

AIは軍拡競争、米国はNVIDIAのスーパーチップに90億ドルを投じて追従する

米国政府は、CIAやNSAがAnthropicやOpenAIなどのAI大手に追いつくため、NVIDIAのGB10スーパーチップを90億ドルで秘密調達する申請を行った。この資金は議会の承認が必要で、国防予算から8億ドルがクラウドコンピューティングに振り向けられている。記事では、チップの仕様、コスト、そして激化するAIハードウェア競争について詳述する。

  • 米国政府はCIAとNSAのために、NVIDIA GB10スーパーチップを90億ドルで秘密調達する申請を行った。
  • GB10チップは消費電力140Wで1ペタフロップスのFP4性能を発揮し、700億パラメータのモデルを微調整できる。
サイト内本文

NVIDIA、台湾に1500億ドル投資の意向

NVIDIAの次期台湾本社の開所イベントで、ジェンスン・フアンCEOは同国をAI革命の「震源地」と称した。

  • NVIDIAのCEOが台湾をAI革命の震源地と発言
  • NVIDIAは台湾に約1500億ドルを投資する計画
サイト内本文

ジェンセン・フアン氏、CEOがAIを解雇の言い訳にするのは「怠惰」と批判

NvidiaのCEOジェンセン・フアン氏は、AIを人員削減の原因とするCEOの言説を「意味がない」「怠惰だ」と批判した。生成AIが実用化されたのは最近であり、多くは2年前から解雇が始まっていると指摘。業界に対し、AIの可能性と安全性の両方を考慮したバランスの取れた語りを求めた。また、トランプ大統領の北京訪問に急遽同行したエピソードも語った。

  • フアン氏はAIによる解雇を「怠惰な言い訳」とし、賢く見せようとする行為と非難。
  • AIが実用的になったのは最近で、以前の解雇との関連性は不合理と主張。
サイト内本文

確率的分離政策勾配による効率的なオン方策視覚強化学習

確率的分離政策勾配(SDPG)を提案。軽量な視覚強化学習手法であり、単一のNVIDIA RTX 4080 GPU上で数時間以内に多様な視覚運動制御ポリシーをエンドツーエンドで訓練可能。SDPGは軌道ロールアウトのランダム摂動により政策勾配を推定し、バッチレンダリング環境の数を大幅に削減、計算およびメモリオーバーヘッドを低減。視覚MuJoCoベンチマークにおいて、訓練時間、メモリ使用量、報酬でベースライン手法を一貫して上回る。さらに、器用な操作や挑戦的な locomotion をカバーする現実的な視覚ロボティクスベンチマーク群を導入し、実ハードウェア上でのシミュレーションから現実への転送を実証。

  • SDPGは単一RTX 4080 GPUで数時間のエンドツーエンド訓練を実現。
  • 軌道ロールアウトのランダム摂動による政策勾配推定で環境数を大幅削減。
サイト内本文

NightSight:イベントカメラを用いた暗闇での受動的ナビゲーション

NightSightは、単眼イベントカメラ、符号化開口レンズ、赤外線ドットプロジェクタを組み合わせた軽量な認識手法を提案し、小型飛行ロボットが完全な暗闇で自律航法できるようにする。符号化開口による深度依存のぼけ特徴をCNNで復号し、合成データのみで学習したモデルが実世界にゼロショットで汎化する。NVIDIA Jetson Orin Nano上で20Hzで動作し、2.5mまでの範囲で誤差7.0cm(2.80%)を達成。

  • イベントカメラ、符号化開口、赤外線投影を組み合わせた暗闇での受動的深度センシング
  • 合成データのみで学習したCNNが実世界の複雑なシーンにゼロショット汎化
サイト内本文

NVIDIA Vera CPU、競合に対して「強力なパンチ」を繰り出す

エージェンティックAIへの移行により、AIファクトリーには高速コア、大容量メモリ帯域幅、全コアアクティブ時の持続的高性能という新しいCPU要件が生じています。Phoronixが本日発表した初期ベンチマーク結果は、NVIDIA Vera CPUがこのニーズを満たすことを示しています。Veraは88個のカスタムOlympusコア、1.2TB/sのメモリ帯域幅を備え、効率的な電力範囲内でパフォーマンスを発揮します。テストでは、Veraはコードコンパイル、ファイル圧縮、ビデオトランスコーディングなどで前世代Grace比1.6倍の性能向上を達成し、最新のx86プロセッサをリードしました。LPDDR5Xメモリサブシステムは30ワット未満の消費電力でピーク帯域幅の90%を達成し、従来のx86と比較してコアあたり4倍以上のメモリ帯域幅を提供します。NVIDIAは主要なAI企業やクラウドプロバイダーに初期Vera CPUを出荷しており、パートナーからの提供は2025年下半期を予定しています。

  • Vera CPUはエージェンティックAIワークロード向けに設計され、88個のカスタムOlympusコアと1.2TB/sのメモリ帯域幅を搭載。
  • Phoronixのベンチマークでは、VeraはGrace比1.6倍の世代間性能向上を示し、多くのタスクで最新のx86プロセッサを上回る。
サイト内本文

電気通信におけるAI readiness

通信事業者の経営幹部の97%がAIを採用しているにもかかわらず、ほとんどのプロジェクトは「データ債務」、つまり断片的でガバナンスが効かず、セマンティックに不透明なデータによって停滞しています。NVIDIAのレポートによると、ボトルネックはモデルの品質ではなくデータの可用性です。Databricks Unity Catalogは、統一されたセマンティックレイヤーとガバナンスを通じてこの問題に対処し、システム間のデータ連携、きめ細かなアクセス制御、リッチなセマンティックコンテキストを提供して、AIをデモから本番へと移行させます。

  • 通信事業者の97%がAIを採用しているが、データ債務によりプロジェクトが停滞。
  • データの断片化とセマンティックコンテキストの欠如が主な障壁。
サイト内本文

Strands Agents、NVIDIA NIM、Amazon Bedrock AgentCoreを使用した高性能生成AIシステムの構築

NVIDIA NIMによるGPU高速化推論、Amazon Bedrock AgentCoreによるマネージドランタイム、Strands Agentsによるサーバーレスオーケストレーションを組み合わせたマルチエージェントキャンペーンレビューシステムの構築方法を学びます。並列推論、コンテキスト永続化、可観測性を実現します。

  • NVIDIA NIM、Amazon Bedrock AgentCore、Strands Agentsを組み合わせた高性能マルチエージェントAIシステム。
  • 並列推論、コンテキスト永続化、トレース可能な実行パスを実現。
サイト内本文

国産AIが自らAIを開発、世界初の快挙

面壁智能(ModelBest)が、AIによって完全に記述された世界初の本格的な大規模言語モデル事前学習フレームワーク「ForgeTrain」を発表。NVIDIAのMegatronより10%高速で、これを用いて訓練されたMiniCPM5-1Bは、1Bパラメータで従来の2B未満モデルを上回る知能密度を達成。

  • ForgeTrainはAIが完全に生成した初の本格的な事前学習フレームワーク。
  • NVIDIA Megatronより10%高速なトレーニングを実現。
サイト内本文

RED:環境ダイナミクス下でのロボット推論のための適応型リアルタイムDAGスケジューリング

REDは、リソース制約のあるロボットプラットフォーム向けのリアルタイムスケジューリングフレームワークであり、中間サブデッドラインの割り当て、MIMONetの重み共有の活用、計算グラフの再構築により、実行時の環境変化に適応する。NVIDIA JetsonおよびApple Mシリーズで実装され、スループット、デッドライン達成率、堅牢性、適応性、オーバーヘッドにおいて既存手法を上回る。

  • REDは中間サブデッドラインを割り当て、進化する計算グラフと非同期推論に対応する。
  • MIMONetの共有パラメータ特性を活用し、ワークロードの精緻化とグラフ再構築によりスケジューラビリティを向上させる。
サイト内本文

NVIDIA FLAREを使った非IID CIFAR-10でのFedAvgとFedProxの構築と比較ステップバイステップガイド

このチュートリアルでは、NVIDIA FLAREを使用して高度な連合学習実験を構築し、非IID CIFAR-10データセット上でFedAvgとFedProxを比較します。ディリクレ分布を使ってクライアントのラベル不均衡をシミュレートし、NVFlare Job APIで連合タスクを定義・起動、Client APIでローカルトレーニングとモデル交換を処理します。完全なコード実装と実験結果の可視化を提供します。

  • NVIDIA FLAREで連合学習実験を構築し、FedAvgとFedProxを比較。
  • ディリクレ分布(alpha=0.3)でCIFAR-10を3つの非IIDクライアントに分割。
サイト内本文

ServiceNowにおける人工知能

ServiceNowは米国のエンタープライズソフトウェア企業で、本社はカリフォルニア州サンタクララ、世界で29,000人以上の従業員を抱え、2025年第4四半期のサブスクリプション収益は35.7億ドルです。同社はAIと自動化に多額の投資を行い、Passage AIの買収、NVIDIAとの提携拡大、10億ドルのベンチャーキャピタル基金、カナダでの1.1億カナダドルの投資などを実施。記事では、ITSM/CSMワークフローに生成AIを埋め込み、解決記録の時間を約80%削減するNow Assistと、機械学習により顧客エスカレーションを予測し、プロアクティブエンゲージメント率を11%から68%に向上させる事例を紹介しています。

  • ServiceNowは買収、提携、ベンチャー投資を通じてAIに巨額投資しており、Now Assistでエージェントの文書作成時間を80%削減。
  • 予測モデルによりプロアクティブエンゲージメントが11%から68%に向上、誤検出率は約3%。
サイト内本文

PIMbot: マルチロボット強化学習の敵対的操作のための自己適応型攻撃フレームワーク

本論文では、報酬チャネルのインセンティブ操作とエージェント自身の行動のポリシー操作という2つの補完的な手段を通じてマルチロボット強化学習の結果を操作するフレームワークPIMbotを紹介する。適応型多目的コントローラがこれらの手段をオンラインでバランスさせる。GazeboシミュレーションとNVIDIA Jetson Orin Nano実機での実験により有効性を実証し、PIMbotはマルチロボット協調タスクの脆弱性を露呈するストレステストツールとして位置づけられる。

  • PIMbotは報酬チャネルのインセンティブ操作とポリシー操作という2つの操作手段を利用する。
  • 適応型多目的コントローラがオンラインで手段のバランスをとる。
サイト内本文

The Sequence Radar #865:先週のAI:Karpathy、Google、Colossus、そして迫るIPOの波

先週のAI業界は大きな転換点を迎えた:GoogleがGemini Omniとエージェント優先プラットフォームを発表、Andrej KarpathyがAnthropicに加入しClaudeを活用した事前学習の加速に着手、AnthropicはxAIのColossusと450億ドルの計算リース契約を締結、CerebrasのIPOで時価総額約950億ドルに、SpaceX、OpenAI、Anthropicが今後6ヶ月以内に上場を計画し、総評価額は3兆ドルを超える可能性がある。また、HRM-Text効率的事前学習、AIレビュアーの評価、NVIDIAの統合AR-拡散モデルなど、複数の最先端研究が発表された。

  • Google I/OでGemini Omniマルチモーダルモデルとエージェント優先プラットフォームAntigravityを発表、TPU 8iで垂直統合を実現。
  • Andrej KarpathyがAnthropicに加入し、Claudeを使って事前学習を加速するチームを結成、自己改善サイクルの実質的な進展を示す。
サイト内本文

OpenAIとNvidia、GoogleのSynthIDを利用してAIコンテンツに透かしを入れる

GoogleのSynthID透かしシステムは、OpenAI、Nvidia、ElevenLabs、Kakaoによって採用され、AIコンテンツ検出のための共有業界標準への移行を示しています。

  • SynthIDは透かしを直接ピクセルや音声波形に埋め込み、メタデータよりも除去が困難。
  • OpenAI、Nvidia、ElevenLabs、Kakaoが画像・動画・音声生成ツールにSynthIDを採用。
サイト内本文

Anthropic、ペンタゴンがサプライチェーンリスクと指摘するも、NSAへのクロード提供継続の可能性

ペンタゴンから「サプライチェーンリスク」と指摘されているにもかかわらず、AnthropicはNSAへのAIモデル提供を継続する見通し。情報機関はNvidiaの最新Grace Blackwellチップを入手できず、Anthropicの「Mythos」モデルも古いハードウェアで動作しているとされる。以前の交渉を頓挫させた「あらゆる合法的な使用」条項は今回の契約には含まれていない。

  • Anthropicはペンタゴンからサプライチェーンリスクと指摘されても、NSAへのAIモデル提供を継続する見込み。
  • 情報機関はNvidiaの最新Grace Blackwellチップを欠いている。
サイト内本文

NVIDIA AI、Deltaルールにおける消去と書き込みを分離する線形注意機構「Gated DeltaNet-2」を公開

NVIDIAのGated DeltaNet-2は、線形注意機構においてメモリ更新時の消去と書き込みをチャネル単位のゲートに分離したモデルです。1.3Bパラメータ、100B FineWeb-Eduトークンでトレーニングされ、言語モデリング、常識推論、長文脈検索でMamba-2、Gated DeltaNet、KDA、Mamba-3を上回り、特にRULERベンチマークで大きな向上を示しました。

  • Gated DeltaNet-2はスカラーゲートをチャネル単位の消去ゲート(キー軸)と書き込みゲート(値軸)に分解し、古いコンテンツの消去と新しいコンテンツの書き込みを独立して制御します。
  • 1.3Bパラメータ、100B FineWeb-Eduトークンでトレーニングされ、ベースラインと比較してベンチマーク全体で最高の平均性能を達成。
サイト内本文

MetaのClaudeonomicsリーダーボード

Metaは社内向けAIリーダーボード「Claudeonomics」を導入し、従業員のトークン消費量を追跡したが、データ漏洩により閉鎖した。業界ではAI利用の追跡が広がり、NvidiaのJensen HuangはAIトークンを報酬に含めるよう提案している。

  • Metaの社内AIリーダーボード「Claudeonomics」は、トークン消費量に基づいて従業員をランク付けし、バッジを付与していた。
  • 内部データが外部に漏洩したため、リーダーボードは閉鎖された。
サイト内本文

Nemotron-Labs 拡散言語モデルによる光速に迫るテキスト生成

NVIDIA が Nemotron-Labs 拡散言語モデルシリーズを発表。トークンを並列生成し反復的に洗練する手法により、従来の自己回帰モデルと比較して最大 6.4 倍の推論速度向上と高い精度を実現。8B モデルは Qwen3 8B を精度で 1.2% 上回る。

  • 3つの生成モード(自己回帰、拡散、自己推測)をサポート。
  • 8B モデルは拡散モードで 2.6 倍、自己推測モードで最大 6.4 倍の速度向上。
サイト内本文

Mahjax: JAXで強化学習のためのGPU加速麻雀シミュレータ

Mahjaxは、JAXで実装された完全ベクトル化された立直麻雀環境であり、GPUで大規模ロールアウト並列化を可能にします。8基のNVIDIA A100 GPU上で、無赤ルールで毎秒200万ステップ、赤ルールで毎秒100万ステップのスループットを達成。ゼロからの強化学習(tabula rasa)をサポートし、可視化ツールも提供。実験では、エージェントがベースラインポリシーに対してランクを向上させられることを確認。

  • MahjaxはJAXベースの完全ベクトル化立直麻雀シミュレータで、GPU並列化に対応。
  • 8基のNVIDIA A100 GPUで最大毎秒200万ステップ(無赤ルール)を実現。
サイト内本文

NVIDIA GTC 台北 at COMPUTEX: AIの次なる展開をライブ更新

COMPUTEXのNVIDIA GTC台北では、世界中の開発者、研究者、業界リーダーが集結し、AIファクトリーやスケーリングインフラからエージェンティックAI、フィジカルAIに至るまで、あらゆる業界を形作る最新のブレークスルーを探求します。NVIDIAの創業者兼CEOであるジェンスン・フアン氏は、6月1日午前11時(台北時間)に基調講演を行います。本記事では、NVIDIA Vera Rubin NVL72、Jetson Thor、AlpamayoがCOMPUTEX 2026ベストチョイスアワードを受賞した詳細を含む最新情報を提供します。

  • NVIDIAはCOMPUTEX 2026ベストチョイスアワードで、AIファクトリー、ロボティクス、自動運転の分野で複数の賞を受賞。
  • Vera Rubin NVL72は、ワットあたりの推論性能が10倍、トークンあたりのコストが10分の1に。
サイト内本文

オープンソースソフトウェアがロボットの思考を支援し始める

オープンソース運動がAIのブレークスルーをロボティクスに持ち込み、参入障壁を低減している。ROSフレームワークからNVIDIA、Hugging Face、Alibabaのモデルまで、ロボットの推論、決定、行動の能力がより多くの人々に利用可能になりつつある。しかし、商業的インセンティブと学術的理想の間の緊張が新たな課題を生んでいる。

  • オープンソースロボティクスソフトウェアは数十年にわたり発展し、ROSがインフラを確立。現在はオープンソースAIモデルがロボットの「頭脳」の進化を推進している。
  • NVIDIA、Hugging Face、Alibabaなどの企業がオープンソースのロボットAIツールとモデルを公開し、参入障壁を大幅に低下させた。
サイト内本文

NVIDIAのVeraチップ:ジェンスン・フアン氏が軽視してほしくない2000億ドルの賭け

NVIDIAのCEOジェンスン・フアン氏は、Vera CPUが2000億ドルの市場を切り開き、今年度の収益が200億ドルに達するとの見通しを示した。第1四半期の好決算にもかかわらず、供給制約と競合のカスタムチップが課題となっている。

  • NVIDIAのVeraチップはAI推論をターゲットにし、2000億ドルの市場を開拓。
  • Veraは今年度の収益貢献第2位となり、200億ドルを見込む。
サイト内本文

アリババ、新AIチップとモデルで自立を目指す

アリババは新たなAIチップとモデルを発表し、Nvidiaチップへの依存を減らし、フルスタックAI戦略を推進する。

  • アリババが新AIチップを公開、フルスタックAI戦略を強調
  • Nvidia AIチップへの依存脱却を目指す
サイト内本文

NVIDIA、Nemotron-Labs-Diffusionを発表:Qwen3-8B比6倍のトークン/フォワードを実現するトリモード言語モデル

NVIDIAの研究者が、3つのデコードモードを1つのアーキテクチャに統合したNemotron-Labs-Diffusionモデルファミリーを公開。自己回帰(AR)デコード、拡散ベース並列デコード、自己推測デコードをサポート。3B、8B、14Bのパラメータサイズに加え、ベース、インストラクト、ビジョン言語バリアントを提供。自己推測モードでは、Qwen3-8B比6倍のトークン/フォワードを達成しつつ、高精度を維持。

  • Nemotron-Labs-DiffusionはAR、拡散、自己推測の3つのデコードモードを単一モデルで統合。推論時のアテンションパターン変更のみでモード切替が可能。
  • 8Bスケールの線形自己推測モードで5.99×トークン/フォワード、精度62.81%を達成。Qwen3-8Bをスループットと精度で上回る。
サイト内本文

GPUテレメトリー異常:A100のアイドル時消費電力146W(ホワイトペーパー)

ホワイトペーパーにより、NVIDIA A100 GPUが使用率0%を報告しながら最大146.66ワットを消費することが明らかになり、GPUテレメトリーの重大な盲点が露呈した。著者は新しいエネルギー効率ベンチマーク(CEI)と、そのような「ゴースト」異常を検出するオープンソース最適化ツールを提案している。

  • 報告されたGPU使用率が0%でも実際の消費電力は146Wを超え、隠れたエネルギー浪費を引き起こす。
  • NVIDIAのMIGプロファイリング制限により、マルチテナントクラウド環境で観測可能性のギャップが生じる。
サイト内本文

NVIDIAとGoogle Cloud、次世代AIビルダーを支援

今年のGoogle I/Oカンファレンスで、NVIDIAとGoogle Cloudは共同開発者コミュニティの10万人以上の開発者の作業を加速し、厳選された学習パス、ハンズオンラボ、イベントを提供しています。新たにJAXライブラリの学習パス、NVIDIA Dynamo codelab、毎月の開発者ライブストリームが追加されました。両社はJAX、NVIDIA Dynamo on GKEなどのオープンフレームワークで緊密に連携し、Google DeepMindのGemmaやNVIDIA Nemotronモデルを統合しています。また、NVIDIAは初めてGoogle DeepMindのSynthID透かし技術をNVIDIA Cosmosモデルに適用し、コンテンツの整合性を確保しています。

  • NVIDIAとGoogle Cloudの共同開発者コミュニティは10万人を超え、AIスキル向上のリソースを提供。
  • JAX on NVIDIA GPUの学習パス、NVIDIA Dynamo codelab、毎月の開発者ライブストリームが新登場。
サイト内本文

NVIDIAのVera CPUが主要AIラボに到着、エージェンティックAI需要の高まりに対応

2026年5月19日、NVIDIAのスタンドアロンCPU「Vera」がAnthropic、OpenAI、Oracle Cloud Infrastructure、SpaceXAIに初めて納入されました。VeraはエージェンティックAIワークロード向けに設計され、88個のカスタムOlympusコア、1.2 TB/sのメモリ帯域幅、50%向上したコアあたりの性能を備えています。Oracleは2026年から数十万基のVera CPUを展開する計画です。

  • NVIDIA Vera CPUがAnthropic、OpenAI、Oracle Cloud Infrastructure、SpaceXAIに納入。
  • Veraは88個のカスタムOlympusコア、1.2 TB/sのメモリ帯域幅、50%高速なコア性能を実現。
サイト内本文

Nvidia H200中国取引はトランプ・習近平首脳会談を生き延びたが、誰も予想しなかった形で

トランプ大統領が北京に飛び、最後の瞬間にジェンセン・ファン氏を連れて2日後に去り、チップ輸出について「何かが起きるかもしれない」と記者団に語った。しかし何も起きなかった。2025年12月にトランプ氏が販売を承認して以来、Nvidia H200チップは1つも中国に出荷されておらず、米通商代表部のジェイミーソン・グリア氏はBloombergに対し、半導体規制は二国間議題にすら載っていなかったと述べた。

  • トランプ・習近平会談後もH200中国輸出は凍結されたまま。
  • 米国は輸出を承認したが、北京が自国企業の受領を阻止。
サイト内本文

Apple M3 Ultraにおけるリアルタイム拡散モデル推論の系統的最適化

本研究は、Apple M3 Ultra(60コアGPU、512 GBユニファイドメモリ)を対象に10フェーズの包括的な最適化実験を実施し、リアルタイムカメラimg2img変換を目指しました。蒸留特化モデルSDXS-512のCoreML変換と3スレッドカメラパイプラインを組み合わせることで、512x512解像度で22.7 FPSを達成しました。CUDAの最適化知見がApple Siliconのユニファイドメモリアーキテクチャには有効でないこと、量子化による高速化がないこと、並列推論が非効率であること、ニューラルエンジンが大規模モデルに不適切であることを明らかにし、Apple Silicon向けの拡散モデル推論の実践的ガイドラインを提供します。

  • Apple M3 Ultra上でCoreML変換、量子化、Token Merging、ニューラルエンジンなどの手法を用いた10フェーズの系統的最適化。
  • CoreML変換したSDXS-512と3スレッドパイプラインにより512x512で22.7 FPSのリアルタイムimg2imgを達成。
サイト内本文

SuperInfer:LLM推論のためのSLO認識型ロータリースケジューリングとメモリ管理

SuperInferは、NVIDIA GH200などのスーパーチップ向けの高性能LLM推論システムです。SLO認識型のプロアクティブなロータリースケジューラRotaSchedと、全二重メモリ転送エンジンDuplexKVを導入し、TTFT SLO達成率を最大74.7%向上させつつ、TBTとスループットを維持します。

  • 初のプロアクティブなSLO認識型ロータリースケジューラRotaSchedを提案。リクエストをHBMとDRAM間で遅延緊急度に応じてローテーション。
  • DuplexKVエンジンはNVLink-C2Cを介した全二重KVキャッシュ転送を実現し、PCIeの帯域幅制限を克服。
サイト内本文

NVIDIA CEOジェンスン・フアン、Dell Technologies Worldで「需要は放物線的に、完全に放物線的に拡大している」

Dell Technologies Worldで、DellとNVIDIAは、NVIDIA Vera Rubin NVL72を搭載したDell PowerEdge XE9812を含む新しいAIインフラを発表し、エージェンティックAI推論のトークンあたりコストを最大10分の1に削減します。Dell CEOのマイケル・デルは、世界のAIインフラ支出が2030年までに3~4兆ドルに達し、トークン消費量が3400%増加する可能性があると予測しました。NVIDIA CEOのジェンスン・フアンは、需要が「完全に放物線的に」拡大していると強調しました。エンタープライズAIはパイロットからエージェンティックAIと大規模推論へと移行しています。Dell AI Factory with NVIDIAは、机上周辺からデータセンターまで、機密計算とオープンモデルのサポートを含むエンドツーエンドのソリューションを提供します。

  • DellとNVIDIAがVera Rubin NVL72搭載の新サーバーを発表、推論コストを10分の1に。
  • Dell CEOは2030年までにAIインフラ支出が数兆ドルに達すると予測。
サイト内本文

Vera 到来:エヌビディア初のエージェント向けCPUがトップAIラボに到着

エヌビディアのIan Buck氏が初のVera CPUシステムをAnthropic、OpenAI、SpaceXAI、Oracle Cloud Infrastructureに直接納入。VeraはエージェンティックAIワークロード向けに設計され、88のカスタムコア、1.2 TB/sのメモリ帯域幅、50%向上したコア性能を備える。

  • エヌビディア初のカスタムCPU「Vera」がエージェンティックAI向けに開発され、主要AIラボに納入された。
  • Ian Buck氏が自らAnthropic、OpenAI、SpaceXAI、Oracleにシステムを届けた。
サイト内本文

LoRA/DoRAを用いたNVIDIA Cosmos Predict 2.5のファインチューニングによるロボット動画生成

本記事では、LoRAおよびDoRAというパラメータ効率的なファインチューニング手法を用いて、NVIDIA Cosmos Predict 2.5世界モデルを単一GPUでロボット動画生成に適応させる方法を解説します。データ準備、アダプター初期化、訓練ループ、推論方法、評価指標について詳述します。

  • LoRAとDoRAは、凍結されたベースモデルに小型の学習可能アダプターを注入することで、メモリ要件を削減し、破滅的忘却を防ぎつつ効率的なファインチューニングを可能にします。
  • 訓練には92個のロボット操作ビデオデータセットを使用し、rectified flow損失とMSE損失で最適化します。
サイト内本文

NVIDIA、NVFP4を用いた4ビット事前学習手法を発表—12BハイブリッドMamba-Transformerで10Tトークン規模で検証

NVIDIAは、Blackwell Tensor Coreでネイティブサポートされる4ビットマイクロスケーリングフォーマットNVFP4を基盤とした事前学習手法を発表。120億パラメータのハイブリッドMamba-Transformerを10兆トークンで訓練し、MMLU-ProでFP8ベースラインの62.62%に対し62.58%とほぼ同等の精度を達成。線形層のGEMMのみをNVFP4で量子化し、その他はBF16/FP32を維持。選択的高精度層、ランダムアダマール変換、2Dウェイトスケーリング、確率的丸めの4手法で収束を実現。MXFP4と比較して同トークン数で低損失、GB300でFP8比3倍のスループット向上。

  • NVFP4はBlackwell Tensor Coreネイティブの4ビットマイクロスケーリング形式で、線形層GEMMのみを4ビット量子化。
  • 12BハイブリッドMamba-Transformerを10Tトークンで訓練し、MMLU-Pro 62.58% vs FP8 62.62%とほぼ無損失。
サイト内本文

ジェンセン・ファン北京グルメ巡りを全部試してみた!後海のバーオーナー「毎年来てくれる約束をした」

本記事は、NVIDIA CEOのジェンセン・ファンが北京で半日の街歩き(Citywalk)をしたルートを辿り、尹三豆汁、鼓楼饅頭、黄瓦増福財神廟、ミクスアイス、紫光園ヨーグルト、方磚廠炸醤麺、稲香村、おもちゃ屋、後海のバー、慶雲楼飯荘、潮府林苑などを訪問。店主やファンとの交流エピソードを記録し、オープンソースのルートガイドも作成した。

  • ジェンセン・ファンが北京で半日の街歩きをし、複数の名所やグルメ店を巡った。
  • 豆汁を飲んだリアクション、ミクスアイスを飲んだこと、財神廟で参拝したことなどが話題に。
サイト内本文

Yum Brands、Nvidiaと提携し500店舗に新AIを導入

Yum BrandsはNvidiaと提携し、AI開発を加速。2025年第2四半期に、ピザハット、タコベル、KFC、ハビットバーガーの約500店舗にAIツールを展開します。対象は音声AI、コンピュータビジョン(労働監視を含む)、レストラン分析です。

  • Yum BrandsはNvidia初のレストランパートナー。
  • 2025年第2四半期に約500店舗でAI展開。
サイト内本文

ロボット犬がNVIDIAの計算王座を覆す

Blue Technologyが発表したBabyAlpha A3は、独自のヘテロジニアスコンピューティングクラスターを搭載し、NVIDIAのエコシステムから脱却。10倍の効率、デバイス上の70億パラメータモデル、人間を超える認識能力を実現し、家庭向け具現化AIを目指す。

  • 6600万画素カメラ、HDR140db、223.2万点群/秒で人間の視覚を超越
  • 独自の6チップヘテロジニアスクラスター(22コア)でNVIDIA路線を回避
サイト内本文

NVIDIA、SANA-WMを発表:2.6Bパラメータのオープンソース世界モデル、単一GPUで720p動画を分単位生成

NVIDIAのSANA-WMはオープンソースの世界モデルで、1枚の画像とカメラ軌跡から60秒の720p動画を生成。訓練は64基のH100 GPUで行い、推論は単一GPUで実行可能。蒸留版は単一のRTX 5090で34秒で60秒の720p動画を生成する。

  • SANA-WMは1枚の画像と6自由度カメラ軌跡から60秒の720p動画を生成。
  • ハイブリッド線形注意機構(Gated DeltaNet)と二重分岐カメラ制御により、効率的な長系列生成を実現。
サイト内本文

自律システム時代におけるAIとデータ主権の確立

生成AIが日常業務に浸透し、エージェント型AIが進化する中、企業はサードパーティのAIモデルにデータを提供するリスクを再評価している。EDBの調査で経営幹部の70%が主権型AIプラットフォームの必要性を認識。NVIDIAのジェンスン・フアンCEOは各国が自国の言語と文化を活かしたAIインフラ構築を提唱。

  • クラウドベースのAIモデル利用によるIP喪失と競争力低下への懸念
  • 70%の経営幹部が主権的データ・AIプラットフォームを必須と認識
サイト内本文

NVIDIA、ジェンセン・フアンの子供たちの給与を引き上げ――年収100万ドル、「能力に基づき、身分ではない」

NVIDIAがCEOジェンセン・フアンの子供たち、マディソンとスペンサーの最新報酬を開示。それぞれ123万2000ドル、132万ドルで前年から増加。会社は昇給がフアンとは無関係であり、実力で評価されたと説明。

  • マディソン・フアン(Omniverse部門シニアディレクター)年収123.2万ドル、スペンサー・フアン(ロボティクス部門プロダクトマネジメントディレクター)年収132万ドル。
  • NVIDIAは昇給決定にジェンセン・フアンは関与しておらず、2人はフアンに直接報告しないと発表。
サイト内本文

バイトダンスを含む中国企業10社、米国のAIチップ購入許可を得るも受け取り不可

米国はアリババ、テンセント、バイトダンスを含む約10の中国企業に対し、Nvidia H200チップを各社最大75,000個購入する許可を与えた。しかし、まだ1個も出荷されていない。商務長官ラットニック氏によると、北京は国内チップ産業を保護するため購入を阻止している。

  • 米国が10社の中国企業にNvidia H200チップの購入許可(最大75,000個/社)を発行。
  • しかし、まだ出荷はなく、中国が国内産業保護のため阻止。
サイト内本文

AIでより良い量子回路を設計する

理論物理学者ハンス・ブリーゲル率いる研究チームがNVIDIAと協力し、量子コンピュータを実用的にするための重要なボトルネックである効率的な量子回路を自動生成するAI手法を開発した。

  • 研究チームがNVIDIAと協力し、AIで量子回路を自動生成
  • 効率的な量子回路は量子コンピュータ実用化の鍵
サイト内本文

企業ナビゲーション