NVIDIA AI ニュース

ソース分布

Hacker News AI16
MarkTechPost9
NVIDIA Blog9
SiliconANGLE AI3
Artificial Intelligence News2
AWS Machine Learning Blog2
Hugging Face Blog2
LangChain Blog2

トピック分布

チップ50
Agent35
モデル16
研究6
スタートアップ5
政策2
ロボット1

タイムライン

2026-07-099
2026-07-017
2026-07-086
2026-07-055
2026-07-075
2026-07-105
2026-07-024
2026-07-033

最新動向

テクノロジー大手、AIデータセンター競争のため3500億ドルの負債を積み上げ

2026-07-12 13:49 UTC+9

過去5年間で、Alphabet、Amazon、Meta、Microsoft、Oracleの5大テクノロジー企業はAIデータセンターへの投資資金として約3500億ドルの負債を追加し、借入額は倍増した。投資家の支援は続いているが、Amazonの250億ドルの債券発行には冷ややかな反応があり、市場の限界を示唆。OracleはAI支出増加でS&Pから格下げされ、Intelの債務問題は警告事例となっている。ハイパースケーラーは今年最大7250億ドルをデータセンターとNVIDIAチップに投入する計画だ。

5大テクノロジー企業の負債が5年で倍増、3500億ドル増加
Amazonの250億ドル債券発行に投資家が慎重姿勢

NVIDIAのタイルベースGPUプログラミングコーディングガイド：cuTileおよびTritonカーネルからFlash Attentionまで

2026-07-12 09:01 UTC+9

このチュートリアルでは、TileGymを使用してNVIDIAのタイルベースGPUプログラミングを探求し、異なるハードウェアで動作するColabワークフローを構築します。CUDA環境を調査し、実際のcuTileバックエンドを試し、標準のColab GPUにcuTileスタックがない場合はTritonにフォールバックします。コアとなるタイルの考え方を学びます：単一スレッドではなくデータタイル全体を操作し、ロード、計算、ストアを行います。ベクトル加算、融合GELU、行方向ソフトマックス、タイル化行列乗算、フラッシュアテンションを実装し、それぞれをPyTorchと比較します。

NVIDIAのタイルプログラミングモデルを紹介し、個々のスレッドではなくデータブロックを操作します。
cuTileとTritonの両方のバックエンドで動作する実行可能なColabスクリプトを提供します。

今週のAI：チップ、規制、そして変化する仕事

2026-07-11 01:04 UTC+9

今週のAIニュース：IBMが0.7ナノメートルチップ技術を発表、OpenAIとBroadcomが推論専用チップJalapeñoを公開、NVIDIAが全液冷AI工場設計を披露。政府の監視強化：Anthropicがモデルへのアクセスを再開、OpenAIが米政府への株式譲渡を提案。職種の進化：フォワードデプロイエンジニア、SAPの外部採用とIKEAの内部再教育に焦点。

IBMが0.7nmチップを発表、性能50%向上、消費電力70%削減。
OpenAIとBroadcomがLLM推論専用チップJalapeñoを発表。

Amazon SageMaker AI サーバーレスモデルカスタマイゼーションで NVIDIA Nemotron 3 モデルを微調整

2026-07-11 00:35 UTC+9

この記事では、NVIDIA Nemotron 3 モデルの独自のアーキテクチャ（Mamba-Transformer MoE ハイブリッド、最大 1M トークンのコンテキスト長対応）を探り、利用可能な微調整手法（SFT、RLVR、RLAIF）を説明し、SageMaker Studio を使用したサーバーレスカスタマイゼーションのステップバイステップガイドを提供します。

NVIDIA Nemotron 3 は Mamba-Transformer ハイブリッド MoE アーキテクチャを採用し、パラメータの一部のみを活性化して効率的に動作します。
Amazon SageMaker AI は Nemotron 3 Nano および Super 向けにサーバーレスモデルカスタマイゼーションを提供し、インフラ管理は不要です。

チームを縮小せずにトークン予算を削減する方法

2026-07-10 18:34 UTC+9

NVIDIAのCEO、ジェンスン・フアン氏は、エンジニアの価値を評価するテストを提案している。年間のAIトークン消費額が給与の半分に満たない場合、「深く憂慮する」と述べ、NVIDIAは年間20億ドルのトークン費用を目指している。多くの企業がAI投資のために人員削減を行っているが、Gartnerの調査によれば約80％が投資利益率の向上を実現できていない。プロンプトキャッシング、モデルルーティング、RAGなどの最適化手法により、トークンコストを大幅に削減できる。長期的な成功のためには、ジュニアエンジニアの維持と育成が不可欠である。

フアン氏は、エンジニアのAIトークン使用量は給与の50％以上であるべきと示唆。
企業はAIトークン費用を捻出するため人員削減を行っているが、効果は限定的。

AIは3兆ドルの問題に答えられるか？

2026-07-10 15:22 UTC+9

3年前、SequoiaのパートナーであるDavid Cahn氏は、シリコンバレーのAIインフラへの巨額投資がもたらす財務的影響を初めて定量化しました。NvidiaのGPU年間収益500億ドルから、先行投資を回収するには2000億ドルの収益が必要だと計算しました。

David Cahn氏が3年前にAIインフラ投資のROI要件を初めて計算
Nvidiaの年収益500億ドルから2000億ドルの収益閾値を導出

Nemotron Labs 3 Puzzle 75B A9Bの紹介：2.03倍のサーバースループットを実現する圧縮ハイブリッドMoE LLM

2026-07-10 04:31 UTC+9

NVIDIAは、Nemotron-3-Superの圧縮版であるNemotron-Labs-3-Puzzle-75B-A9Bをリリースしました。反復型Puzzle圧縮技術により、総パラメータ数を120.7Bから75.3Bに、アクティブパラメータを12.8Bから9.3Bに削減。単一の8xB200ノードで2.03倍のスループット（100 tok/s/ユーザー）、単一H100で1Mトークンの同時実行数を1から8に向上。多くのベンチマークで高い精度を維持しつつ、指示追従とエージェント評価で軽微な低下が見られます。

NVIDIAが圧縮MoEモデルNemotron-Labs-3-Puzzle-75B-A9Bを公開、パラメータ数約38%削減、アクティブパラメータ27%削減。
8xB200で2.03倍のスループット向上、単一H100で1Mコンテキストの同時実行数8倍。

高速トークン生成が差別化要因として浮上、異種推論が普及へ

2026-07-10 04:14 UTC+9

エージェント型AIのユースケースが増加し、リアルタイムのインタラクティブ性が求められる中、推論インフラは根本から再設計されている。d-Matrix社はNVIDIAと協業し、DRAMとロジックを積層したCorsairアクセラレータを提供。メモリ帯域幅を大幅に向上させ、低遅延の高速トークン生成を実現し、プレミアム料金を課す新たな収益源を生み出している。

高速トークン生成がAI推論の重要差別化要因となり、従来の10倍の価格で取引されている。
d-MatrixのCorsairはDRAMとロジックを3D積層し、HBM比で数倍のメモリ帯域幅を低消費電力で実現。

DDN、AIデータインフラを成否のカギとしてGPU効率化に照準

2026-07-10 03:56 UTC+9

DDNのCEO Alex Bouzari氏はRAISEサミットで、AIデータインフラがGPU投資の成否を左右すると述べ、組織はGPUを効率的に活用するグループと資本を浪費するグループに二分されつつあると指摘。DDNは12の主権AIプロジェクトに関与し、SalesforceのGPU生産性を70%向上させ、NVIDIAが8年間内部で使用している。DDNのInfinidatプラットフォームは、分散エッジデータセンター、大規模データセンター、マルチクラウド環境を接続する課題に取り組む。

AIデータインフラがGPU投資のリターンを決定し、組織はGPU利用効率で二分される。
データ主権が各国に自国のAI工場建設を促し、DDNは12の主権AIプロジェクトに関与。

DeepSeek、自社AIチップ開発へ

2026-07-09 23:42 UTC+9

杭州に拠点を置くAIスタートアップDeepSeekが、NVIDIAとHuaweiへの依存を減らすため、自社推論チップの設計を進めている。コスト最適化と協調設計の強みを活かし、米国の輸出規制に対応する動きであり、AI価格競争を激化させる可能性がある。

DeepSeekは学習ではなく推論に特化したチップを開発中。
チップによりサービングコストを削減し、NVIDIAとHuaweiへの依存を低減。

NVIDIA、Nemotron-Labs-3-Puzzle-75B-A9Bをリリース：圧縮ハイブリッドMoE LLM、同一ユーザースループットでサーバースループット2.03倍を実現

2026-07-09 17:47 UTC+9

NVIDIAはNemotron-3-Superの圧縮版であるNemotron-Labs-3-Puzzle-75B-A9Bをリリースした。反復的Puzzle圧縮により、モデルパラメータは総数1207億/アクティブ128億から753億/アクティブ93億に削減。単一8xB200ノードでユーザー每秒100トークン時に総スループット2.03倍を達成し、単一H100では1Mトークン同時実行数が1から8に増加。

パラメータ圧縮：総数1207億→753億、アクティブ128億→93億。
スループット向上：8xB200ノードで同一ユーザースループット時に1.60～2.14倍。

1億3000万ドルのシリーズA、オープンな超知能スタック構築へ

2026-07-09 16:48 UTC+9

Prime Intellect は、Radical Ventures がリードする1億3000万ドルのシリーズAラウンドを発表。NVIDIA Ventures、Intel Capital、Dell Technologies Capital などが参加し、総調達額は1億5000万ドルを超える。強化学習（RL）を活用し、企業が自社のモデル最適化ループを所有できるオープンな超知能スタックを構築。すでに6000以上の顧客を擁し、年換算収益は1億ドルを突破。Ramp などの企業がクローズドな最先端モデルを凌駕する成果を上げている。今後は長期間エージェント、再帰的言語モデル、自動化研究、継続学習に注力する。

Prime Intellect が1億3000万ドルのシリーズAを調達、総額1億5000万ドル超。
オープンな超知能スタックにより、企業がRLによるモデル最適化を自社で実行可能に。

OpenClaw財団設立

2026-07-09 15:10 UTC+9

OpenClawは、週末プロジェクトから世界的なムーブメントへと成長し、毎週450万の新しい「爪」が生まれ、GitHub史上最速で成長するリポジトリとなりました。本日、非営利財団の設立を発表し、プロジェクトをオープンかつ独立したものとして管理します。財団はガバナンス、安定した資金提供、フルタイムチームを提供します。OpenAI、NVIDIA、Microsoft、ミシガン大学などとのパートナーシップにより、パーソナルAIエージェントの進化を目指します。

OpenClawは個人プロジェクトから世界的なオープンソース運動へと進化し、毎週数百万のユーザーを獲得。
新しい501(c)(3)非営利財団が長期的な開放性と独立性を保証。

NvidiaとHugging Face、オープンソースロボットモデルで協力

2026-07-09 04:35 UTC+9

この動きは、物理AIのアクセシビリティと展開を支援し、Nvidiaのこの分野での既に強い存在感をさらに高めるものと見られている。

NvidiaとHugging Faceが、オープンソースのロボットモデル開発で協力することを発表。
この協力は、物理AIのアクセシビリティと展開を促進することを目的としている。

エージェントのためのデータ

2026-07-09 02:16 UTC+9

NVIDIAは、エージェントAIの構築におけるオープンデータと合成データの重要性を強調し、データの検査可能性、品質、信頼を重視しています。Nemotronデータセット、Prompt Atlas可視化ツール、地域的多様性のための合成ペルソナについて詳細に説明しています。

合成データは、独自シグナルを保護しながらエージェントAIをスケールするために重要です。
NVIDIAのNemotronオープンデータセットは、10兆以上の事前学習トークンと数百万の事後学習サンプルを含みます。

LangChainとNVIDIA、NemoClaw Deep Agents Blueprintを発表

2026-07-09 00:04 UTC+9

LangChainとNVIDIAが協業し、LangChain Deep Agents Code、NVIDIA Nemotron 3 Ultra、OpenShellを組み合わせた、オープンでガバナンスが効くエンタープライズエージェント向けブループリント「NemoClaw」を発表。評価では、リーディングパフォーマンスを約10分の1の推論コストで実現。

NemoClawブループリントは、LangChainのエージェントフレームワーク、NVIDIAのオープンモデルNemotron 3 Ultra、セキュアなランタイムOpenShellを統合。
LangChainのエージェント評価スイートでスコア0.86、コスト4.48ドルを達成。競合モデルの43.48ドルに対し、推論コストを約10分の1に削減。

NVIDIA Nemotron、LangChain Deep Agents Harnessでベンチマーク首位を達成

2026-07-09 00:00 UTC+9

NVIDIA Nemotron 3 Ultraは、最も広く採用されているAIエージェントオーケストレーションプラットフォームにおいて、トップクローズドモデルよりも低コストでリーディングパフォーマンスを提供。LangChainがNemotron 3 Ultra向けにDeep Agentsハーネスをチューニングした結果、オープンモデルで最高の精度を達成し、より多くのタスクを高いスループットで完了、実行あたりの推論コストは主要クローズドモデルの10分の1に抑えられました。

LangChainがNVIDIA Nemotron 3 Ultra向けにチューニングしたDeep Agentsハーネスは、オープンモデルで最高精度を達成。推論コストはクローズドモデルの10分の1。
パフォーマンス向上は全てモデル周辺環境のエンジニアリングによるもので、モデルの再トレーニングは不要。

NVIDIA NemoClaw 上の Deep Agents Code：最も機密性の高いコードのためのガバナンスブループリント

2026-07-09 00:00 UTC+9

Deep Agents Code が NVIDIA NemoClaw のガバナンスブループリントとして利用可能に。デフォルト拒否ネットワーク、人間による承認、監査ログにより、機密コードのモダナイゼーションを安全に実行。

Deep Agents Code (dcode) は NemoClaw ブループリントとして、オープンモデル Nemotron 3 Ultra を搭載し、ソース、モデル、監査証跡を完全に制御。
デフォルト拒否ネットワーク、人間による承認、完全な監査証跡により、規制対象チームに必要な管理機能を提供。

ZML、AIチップ間の推論を高速化する無料製品をリリース

2026-07-08 17:18 UTC+9

チューリング賞受賞者のYann LeCun氏が支援するフランスのAIスタートアップZMLは、Nvidia、AMD、Google TPU、Apple Metal、Intel Arcを含む複数のチップ上で多様なオープンソース大規模言語モデルを実行可能にする無料の推論パフォーマンスソフトウェアをリリースしました。

ZMLがLeCun氏の支援を受け、無料推論ソフトを発表
多様なAIチップをサポートし、Nvidiaの独占に挑戦

NVIDIAのCosmos-Frameworkチュートリアル：オムニモーダル混合トランスフォーマーでCosmos 3ワールドモデルのColab対応ミニチュアを設計する

2026-07-08 16:15 UTC+9

このチュートリアルでは、実用的なColabの観点からNVIDIAのCosmosフレームワークを探求し、実際のCosmos 3チェックポイントに必要なハードウェアを正直に評価します。フレームワークの実際の構造、CLIサーフェス、入力スキーマを使用して、コンパクトなオムニモーダル混合トランスフォーマーワールドモデルを構築してトレーニングします。合成物理世界データと自己回帰ロールアウトを使用して、テキスト、ビジョン、アクションのモダリティにわたって将来の潜在状態を予測する方法を示します。

ハードウェアのプロービングから始め、標準Colabでは完全なCosmos 3 16B+モデルを実行できない理由を説明
実際のNVIDIA cosmos-frameworkに基づいて、約400万パラメータの小型オムニモーダル混合トランスフォーマーを構築

GPU不足は忘れろ：本当のAIボトルネックは2007年に診断されていた

2026-07-08 12:13 UTC+9

本記事は、AIの真のボトルネックはGPU計算能力ではなくメモリ帯域幅であると主張し、2007年のUlrich Drepperによるメモリウォールに関する論文を引用している。AMD、Qualcomm、Nvidiaの最近の動きはこれを反映している。FlashAttentionや小規模言語モデルなどのソリューションは、データの局所性を最適化する回避策である。

AIのメモリボトルネックは2007年の論文で特定されていた。
GPUの計算能力はメモリ帯域幅を上回っており、データ移動が真の制約となっている。

[AINews] Lilian WengがRSIのためのハーネス工学に関する35本の論文を要約

2026-07-08 11:20 UTC+9

このAINews号は2026年7月6日から7日までの幅広いAI開発をカバーしています。ハイライトには、Lilian Wengによる再帰的自己改善のためのハーネス工学への深掘り、MetaのMuse ImageとMuse Videoの発表（エージェント生成ループを備える）、Anthropic、LangChain、Googleによるエージェントプラットフォームの主要製品アップデートが含まれます。その他注目点：NVIDIAのAudexオーディオモデル、Cohereのアラビア語ASR、Hugging FaceとNVIDIAとのロボティクス統合、Liquid AIのAntidoom（推論ループ失敗削減）、Anthropicの論争を呼んだJ-space解釈可能性研究。また、エージェントと法律AIのベンチマーク、研究自動化、推論効率の進歩もカバーしています。

Lilian Wengのブログ記事は、再帰的自己改善を直接の重み変更ではなくハーネス工学的アプローチに焦点を当て直し、目標と文脈の指定にハーネス工学が重要であると強調。
MetaのMuse ImageとMuse Videoは、計画、ツール使用、自己改善を伴うエージェント生成を示し、公開リーダーボードで急速に上位にランクイン。

NVIDIAがAudex（Nemotron-Labs-Audex-30B-A3B）を公開：テキスト知能を保持する統合音声テキストLLM

2026-07-08 09:50 UTC+9

NVIDIAはAudexを公開しました。MoEアーキテクチャ（総パラメータ30B、活性化3B）に基づく統合音声テキストLLMで、音声理解、音声認識、翻訳、TTS、音声生成を処理します。Nemotron-Cascade-2バックボーンのテキスト知能を多段階SFTとテキスト専用RLで保持。音声認識でオープンモデルをリード（OpenASR WER 6.82）、汎用音声生成も可能。非商用ライセンスで公開。

Audexは単一のMoEモデルで音声理解、ASR、翻訳、TTS、音声生成を統合し、テキスト性能の劣化を最小限に抑えます。
総パラメータ30B、トークンあたり3B活性化、Megatron-LMやvLLMと互換性があります。

AIイノベーターがNVIDIA Veraを採用——大規模な最大シングルスレッドCPUが重要な理由

2026-07-08 00:00 UTC+9

NVIDIA Veraは、エージェントAI時代のために設計された新しいタイプのCPUで、大規模な最大シングルスレッド性能を重視しています。自社開発のOlympusコアを搭載し、従来のGraceと比較してIPCが50%向上し、最大1.2TB/sのメモリ帯域幅を備えています。エージェントワークロードでは、x86と比較して1.8倍の持続的なコアあたり性能を実現し、実際のテストでは1.5～1.9倍の速度向上を示しました。Veraはツール呼び出しからデータ処理までを統合し、AIファクトリーのGPU活用を最大化します。

NVIDIA VeraはエージェントAI向けに設計された大規模最大シングルスレッドCPU。
OlympusコアはGrace比50%高いIPCを持ち、最大1.2TB/sのメモリ帯域幅をサポート。

Nvidia GPU債務バックストップがAIプロジェクトの三位一体を解き放つ：資本、オフテイク

2026-07-07 16:55 UTC+9

NvidiaはGPUレンタルのバックストッププログラムを開始し、AI計算の資金調達ボトルネックに対処、市場の多様化を促進する。最低収益保証をネオクラウドに提供することで、債務融資を容易にし、短期レンタルを可能にし、バイヤーベースを拡大する。本記事はAIキャペックスと債務融資の成長を予測し、NVIDIAの戦略的動きがGPU市場構造を変革することを分析する。

NvidiaがGPUレンタルのバックストッププログラムを開始し、ネオクラウドに収益保証を提供、資金調達を容易にする。
AIプロジェクトには資本、オフテイク、データセンターが必要であり、Nvidiaのバックストップはこの三位一体の構築を支援する。

NVIDIAとHugging Face、オープンロボティクスコミュニティ向けに新モデルとフレームワークをLeRobotへ提供

2026-07-07 15:00 UTC+9

NVIDIAとHugging Faceは、ヒューマノイドロボット向けのNVIDIA Isaac GR00T 1.7モデルとIsaac TeleopフレームワークをLeRobotに統合し、さらにNVIDIA Cosmos 3の追加も計画しています。これらの統合により、開発者はロボット開発のためのよりアクセスしやすく標準化されたパスを得られ、オープンロボティクスコミュニティの革新を促進します。

NVIDIAとHugging Faceが、Isaac GR00T 1.7モデルとIsaac TeleopフレームワークをLeRobotに提供。
LeRobotがデータ収集、モデルトレーニング、シミュレーションのためのNVIDIA物理AI機能を獲得。

主権AI診断がプライムタイムに登場

2026-07-07 03:34 UTC+9

PalantirのCEOアレックス・カープはCNBCでAI業界を「非常識だ」と激しく非難し、OpenAIやAnthropicが「アメリカ企業に対する富裕税」を課していると非難した。しかし、その劇的な発言の背後には、顧客が自らのコンピュート、モデル、データを管理したいという主権AIの核心があった。PalantirとNvidiaは、安全な隔離環境でNvidiaのNemotronモデルを展開できる主権AI OS参照アーキテクチャを発表し、株価は9%上昇した。

アレックス・カープがCNBCでAI業界を「非常識」と非難し、AI企業がアメリカ企業に「富裕税」を課していると主張。
カープは顧客が自らのコンピュート、モデル、データを管理する必要性を強調（主権AIの考え方）。

オープンモデルがAI研究を推進する方法

2026-07-07 01:00 UTC+9

ICML 2026では、2000以上の論文がNVIDIA GPUを引用し、Nemotron、Cosmos、BioNeMoなどのオープンモデルがロボティクス、ライフサイエンス、合成データ生成にわたるAI研究の基盤となっています。NVIDIAは74の論文が採択され、ビジョン、強化学習、エージェントトレーニングのトレンドが浮き彫りになりました。

オープンフロンティアモデルとインフラストラクチャがAI研究の基盤となっている。
NVIDIAのNemotronファミリーは、推論、データキュレーション、安全な推論のための研究スタックとして使用されている。

各国が戦略的優先事項のためにAIをどのように展開しているか

2026-07-07 00:00 UTC+9

各国は、生成AIとエージェント型AIによって、国内のAIインフラ、地域データで訓練された基盤モデル、人材育成に投資し、AIを地域のニーズに合わせてカスタマイズしています。欧州、アジア、ラテンアメリカの事例が社会的利益を示しています。

AIは経済と社会を再形成し、各国に国内AI能力の構築を促している。
AIファクトリー（次世代データセンター）がAI生産の重要なインフラとして台頭している。

AIデータセンター

2026-07-06 22:42 UTC+9

Epoch AIの独立データベースは世界の67の大規模AIデータセンターをカバーし、衛星画像や許可証から建設タイムラインを追跡。最大施設はSpaceXAIのColossus 2（メンフィス）で、946 MWのIT電力、111.2万H100相当の計算能力。米国、特にテキサス州とオハイオ州に集中。総IT電力容量10.8 GW、施設電力約14 GW。ハードウェアはNVIDIA GPUが主流で、GoogleとAmazonはカスタムチップを採用。

Epoch AIデータベースは67のAIデータセンターを収録、最大はSpaceXAIのColossus 2。
米国が大半の大規模センターを保有、テキサス州やオハイオ州に集中。

美団、NVIDIA GPUなしで1.6兆パラメータのAIモデルを訓練

2026-07-05 13:59 UTC+9

美団は1.6兆パラメータのMixture-of-ExpertsモデルLongCat-2.0を発表。訓練と推論を完全に国産AI ASICスーパーポッドで行い、NVIDIA GPUを一切使用していない。モデルはOwl Alphaという匿名名でOpenRouterに登場し、高い利用量を記録。性能面では最強ではないが、国産コンピュートで大規模モデルをゼロから訓練する実現可能性を示した。

LongCat-2.0は1.6兆総パラメータ、トークンあたり約480億活性化パラメータのMoEモデル。
訓練とデプロイは国産AI ASICスーパーポッドで実施（推定約5万枚のHuawei Ascend 910C）。

中国のLongCat-2.0、Nvidiaチップを使用しない最大のAIモデルに

2026-07-05 13:58 UTC+9

米国企業MeituanがLongCat-2.0を発表。1.6兆パラメータのオープンソース大規模言語モデルで、完全に国産ハードウェアで訓練・推論を行い、中国のAI自給自足への大きな一歩を示す。

LongCat-2.0は、国産チップで訓練と推論の両方を完了した初の1兆パラメータモデル。
一部のベンチマークでGemini 3.1 Proを上回るが、GPT-5.5やOpus 4.8には及ばない。

Nvidiaが静かにAIブームの背後にある銀行となる

2026-07-05 08:59 UTC+9

NvidiaはGPUを購入するネオクラウド企業に融資を提供し、遊休容量をリースバックしてクラウド収益の一部を受け取ることで、ハードウェア企業から金融機関へと変貌しつつある。

NvidiaがGPU購入のための融資をネオクラウドに提供
Nvidiaは遊休容量をリースバックし、クラウド収益を共有する権利を持つ

Anthropic、Claude Scienceベータ版を公開：再現可能なゲノミクス、プロテオミクス、ケモインフォマティクスパイプラインのためのマルチエージェントAIワークベンチ

2026-07-05 01:21 UTC+9

Anthropicは2026年6月30日、Claude Scienceのベータ版をリリースしました。このアプリは既存のClaudeモデル上で動作します。コーディネートエージェントがドメインスペシャリストにタスクを委任し、レビューエージェントが引用や数値をチェックして修正し、すべての図には正確なコード、環境、完全なメッセージ履歴が付属します。ローカルマシン、SSH経由のHPC、Modalで計算を管理し、60以上のデータベースとNVIDIA BioNeMoスキルに接続します。

Claude Scienceは科学者向けのAIワークベンチで、多段階研究を実行し、各結果の生成過程を記録します。
マルチエージェントアーキテクチャを採用：コーディネーター、ドメインスペシャリスト、レビューエージェントが連携します。

NVIDIA HORIZON：Gitワークツリーを進化させ、RTLベンチマークで100%達成率を記録するハンズフリーエージェント

2026-07-05 01:04 UTC+9

NVIDIA ResearchはHORIZONを発表。ハンズフリーエージェントフレームワークにより、ハードウェア設計をGitワークツリー上のリポジトリレベルのコード進化として扱い、評価されたすべてのRTLベンチマークで100%の合格率を達成。ただし、エージェントベースのハードウェア設計はまだ解決されていないと述べている。

HORIZONは設計問題をバージョン管理されたGitリポジトリとしてホストし、反復的にコードを進化させる。
構造化されたMarkdownハーネス（目標、方向、評価器、受入述語）を使用。

NVIDIA AIがASPIREを発表：自己改善型ロボティクスフレームワーク、LIBERO-Pro長期タスクで31%のゼロショット達成

2026-07-04 15:32 UTC+9

NVIDIAのASPIREはロボット制御プログラムを作成・改良し、検証済みの修正を再利用可能なスキルライブラリに抽出します。LIBERO-Proで最大77ポイント向上し、未見の長期タスクにゼロショット転移します。

ASPIREはプリミティブ単位のマルチモーダルトレースで故障を特定し、粗いタスクレベルフィードバックに頼らない
検証済み修正を再利用可能スキルとして保存し、タスク横断的な知識蓄積を実現

NVCF：GPUアクセラレーションAIワークロードを大規模にデプロイ・ルーティング

2026-07-03 17:18 UTC+9

NVIDIA Cloud Functions (NVCF) は、GPUアクセラレーションワークロードを大規模にデプロイ、管理、実行するためのオープンソースプラットフォームです。長時間実行される関数と非同期タスクをサポートし、Kubernetesによるオーケストレーションを活用、統合コントロールプレーン、負荷分散ルーティング、マルチクラスターオートスケーリングなどを提供します。この記事では、NVCFのアーキテクチャ、ワークロードタイプ、コア機能、Bazelを使ったビルド方法について説明します。

NVCFはNVIDIAによるGPUワークロード向けオープンソースプラットフォームで、推論、ストリーミング、バッチ処理をサポート。
アーキテクチャはコントロールプレーン、呼び出しプレーン、コンピュートプレーンで構成され、Kubernetesで管理。

DGX Stationと「フロンティア」モデル：答えを求める旅

2026-07-03 12:48 UTC+9

NVIDIA DGX Stationの実際の能力を調査。748GBコヒーレントメモリのうち高速HBM3eは252GBのみで残りは低速LPDDR5X。CornellやSnowflakeの使用例、GLM-5.2などのベンチマークを通じて、ローカルフロンティア推論の可能性を探る。

DGX Stationは748GBコヒーレントメモリを搭載するが、高速HBM3e（7.1TB/s）は252GBのみ、残り496GBは低速LPDDR5X（396GB/s）。NVLink-C2Cの実測値は公称900GB/sに達せず。
価格は約10万ドルで、マルチGPU RTX PRO 6000、クラウド推論、Mac Studioなどと競合。購入者は投資に見合うかを判断する必要がある。

Show HN: AIインフラストラクチャナレッジベース

2026-07-03 02:11 UTC+9

物理データセンター、InfiniBandファブリックからKubernetes、Slurm、Ray、分散トレーニング、強化学習後トレーニング、大規模LLM推論サービスまで、GPUクラスターのデプロイ、運用、最適化のための実用的で引用可能なナレッジベース。NVIDIA全製品（Ampere、Hopper、BlackwellデータセンターGPU、RTXコンシューマー/ワークステーションカード、DGXシステム（DGX Spark含む））をカバーし、現在はBlackwell Ultra（B300/GB300 NVL72）世代に焦点を当てています。2026年半ばまで最新情報に対応。

GPUクラスターを運用するエンジニア向けの実用的なリファレンス。
ハードウェア、構築、オーケストレーション、トレーニング、推論、運用をカバー。

NVIDIA BioNeMoがAnthropic Claude Scienceを加速

2026-07-02 23:38 UTC+9

AnthropicはClaude Scienceのパブリックベータ版を発表し、NVIDIA BioNeMo Agent Toolkitを統合。科学者は自然言語でデジタルエージェントと対話し、エンドツーエンドの研究ワークフローを実行できるようになり、計算生命科学研究が加速される。

Claude ScienceがNVIDIA BioNeMo Agent Toolkitと統合。
科学者は自然言語で研究ワークフローを実行可能。

[AINews] 今日はあまり何も起こらなかった

2026-07-02 16:10 UTC+9

今号では、AnthropicのFable 5がセーフティフォールバック付きで再開され、エコシステムがマルチモデルオーケストレーションに移行していることを取り上げます。オープンモデルではGLM-5.2がZCodeやベンチマークで進展。エージェント基盤はWikiメモリと構造化コンポジションパターンを導入し、Devin Security Swarmがエージェントベースの脆弱性発見を実証。NVIDIA TwoTowerやオンデバイス推論の進歩などのアーキテクチャの発展も含まれます。

AnthropicがFable 5をセーフティフォールバック付きで再開、ツールエコシステムが統合し、マルチモデルオーケストレーションが主流に。
Z.aiがGLM-5.2向けZCode IDEを発表、ベンチマークでオープンモデルのコードギャップ縮小、推論最適化が加速。

NVIDIA、AIコンピュートを大規模に解放——資本パートナーを招きAIインフラ構築を支援

2026-07-02 12:34 UTC+9

AIがモデル開発から本番推論へと移行する中、コンピュート需要は加速し、継続的に稼働するAIファクトリーへとシフトしています。NVIDIAは、収益分配モデルを通じて新興企業やモデル構築者などに大規模アクセラレーテッドコンピュートへのアクセスを提供する新戦略を発表。Sharon AIやFirmusが先行して展開しています。

AIコンピュート需要が開発から推論へ移行、大規模マルチテナント環境が必要
NVIDIAが収益分配モデルでコンピュートアクセスを開放、資本障壁を低減

AWS GovCloud (US) で Amazon Bedrock 上で NVIDIA Nemotron と OpenAI GPT OSS モデルを実行する

2026-07-02 03:14 UTC+9

AWS GovCloud (US) リージョンでは、Amazon Bedrock を通じて OpenAI のオープンウェイト GPT OSS モデル（120B、20B）および NVIDIA Nemotron モデル（Nano 9B v2、Nano 12B v2、Nano 30B、Super 120B）をサポートするようになりました。推論はすべて米国内で米国市民が運営するインフラ上で実行され、FedRAMP、DoD SRG などのコンプライアンス要件を満たします。

Amazon Bedrock が AWS GovCloud (US) で OpenAI GPT OSS（120B/20B）と NVIDIA Nemotron（複数サイズ）モデルを追加。
すべての推論は AWS GovCloud (US) 境界内に留まり、データは米国から出ない。

NVIDIAとパートナーがアメリカで、アメリカのために建設

2026-07-01 22:00 UTC+9

NVIDIAとそのパートナーは、アメリカの製造業、サプライチェーン、エネルギーグリッド、熟練労働者に投資しており、米国がより良い医療、画期的な科学的発見、強力な産業生産性、世界的な技術リーダーシップに必要なインフラを生産できるようにしています。

NVIDIAとパートナーは43州にわたりAIインフラを構築し、米国で最大5000億ドルのAIインフラを生産する計画。
2026年だけでも、NVIDIA主導のAI需要は米国GDPに4850億ドル貢献し、10万人以上の雇用を支援。

NVIDIA、Nemotron-Labs-TwoTowerを公開：凍結された自己回帰バックボーン上に構築されたオープンウェイト拡散言語モデル

2026-07-01 17:10 UTC+9

NVIDIAは、2つのタワーアーキテクチャを採用した拡散言語モデルNemotron-Labs-TwoTowerを公開しました。凍結された自己回帰バックボーンにトレーニング済みのデノイザーを追加し、ベンチマーク品質の98.7%を維持しながら2.42倍の生成スループットを実現します。オープンウェイトで提供され、拡散、模擬自己回帰、自己回帰の3つの復号モードをサポートします。

TwoTowerは拡散を凍結されたARコンテキストタワーとトレーニング済みデノイザータワーに分割。
デフォルト設定で品質98.7%、スループット2.42倍を達成。

Jetsonでデュラブルストリームを介したローカルAIの提供

2026-07-01 10:00 UTC+9

著者はNVIDIA Jetson Orin Nano SuperとKokoro-82Mモデルを使用してローカルテキスト読み上げアプリStreamTTSを構築し、従来のリクエスト・レスポンスではなくデュラブルストリーム（S2）を採用することで、共有可能でリアルタイム更新可能な音声生成を実現し、遅い推論、公平なスケジューリング、重複排除に対処しました。

Jetson Orin Nano SuperとKokoro-82MモデルでTTSをセルフホスティング。
S2デュラブルストリームを使用し、永続的でリプレイ可能な出力を実現。

Hugging Face と Cerebras、Gemma 4 をリアルタイム音声AIに導入

2026-07-01 09:00 UTC+9

Hugging Face と Cerebras は、Gemma 4 を活用したリアルタイム音声AIシステムを発表。オープンなモジュラーアーキテクチャによりレイテンシを大幅に削減し、自然な対話を実現する。Nvidia の音声認識、Cerebras の高速推論、Alibaba の音声合成を統合し、9,000台以上の Reachy Mini ロボットに導入されている。

Hugging Face と Cerebras が Gemma 4 ベースのリアルタイム音声AIデモを公開、超低レイテンシを達成。
システムはオープンなカスケード型アーキテクチャを採用：音声入力→ASR→モデル推論→TTS→音声出力。

NVIDIA BioNeMo Agent ToolkitがClaude Scienceで生命科学研究者に加速AIを提供

2026-07-01 02:00 UTC+9

NVIDIAはBioNeMo Agent Toolkitを発表し、AnthropicのClaude Scienceと統合することで、科学者が自然言語を用いて創薬、ゲノミクスなどの加速AIワークフローを実行できるようにしました。このツールキットにはParabricks、RAPIDS-singlecell、nvMolKitなどのGPU加速ツールが含まれ、世界のトップ20製薬企業のうち18社がNVIDIA BioNeMoを利用しています。Claude Scienceは現在パブリックベータ版です。

NVIDIA BioNeMo Agent ToolkitがClaude Scienceと統合し、自然言語による研究を実現
Parabricks（ゲノミクス）、RAPIDS-singlecell（単一細胞解析）、nvMolKit（ケモインフォマティクス）などの高速ツールを搭載

Anthropic、科学研究向けAIワークベンチ「Claude Science」を発表

2026-07-01 02:00 UTC+9

Anthropicは火曜日、科学者向けの新たなアプリケーション「Claude Science」を発表しました。macOSとLinuxでローカルに、またはリモートマシン上で動作します。このツールは、研究者が日常的に使用するPubMed、Jupyter、R、ターミナルなどのデータベースやツールを統合し、ワンストップの研究環境を提供します。現在ベータ版で、主にライフサイエンスを対象としていますが、将来的な拡大が計画されています。Claude Scienceは標準のClaudeモデルに基づき、60以上のデータベースにアクセス可能なコーディネーションエージェントを介して動作し、NvidiaのBioNeMo Agent Toolkitを活用して専門的な生命科学モデルに接続します。また、3Dタンパク質構造などのビジュアルを生成し、HPCやModalアカウントと連携して大規模計算を実行できます。

AnthropicがAIワークベンチ「Claude Science」をベータ版としてリリース。
macOSとLinuxで利用可能で、Claudeの有料プラン（Pro、Max、Team、Enterprise）で使用できる。

NVIDIAの推論ソフトウェアスタックがどのように最低トークンコストを実現するか

2026-07-01 00:00 UTC+9

NVIDIAの推論ソフトウェアスタックは、GPU、CPU、ネットワーキング、システムと共同設計され、オープンソースエコシステムによって強化され、ハードウェアのパフォーマンスを継続的に向上させています。Blackwellプラットフォームでは、このソフトウェアスタックがわずか1か月でDeepSeek V4モデルのトークンコストを最大5倍削減しました。この記事では、ソフトウェアの最適化が運用、アプリケーションアクセラレーション、インフラアクセスの3つの層を通じてどのようにシステムレベルのパフォーマンス向上をもたらし、トークンあたりのコストを削減するかを詳しく説明しています。

NVIDIAのフルスタック推論ソフトウェアは、Blackwell上でDeepSeek V4のトークンコストを1か月で5倍削減。
Baseten、Cognition、Deep Infra、Together AIなどの企業がTensorRT-LLMやDynamoを活用して大幅な改善を達成。

NVIDIA

ソース分布

トピック分布

タイムライン

最新動向

テクノロジー大手、AIデータセンター競争のため3500億ドルの負債を積み上げ

NVIDIAのタイルベースGPUプログラミングコーディングガイド：cuTileおよびTritonカーネルからFlash Attentionまで

今週のAI：チップ、規制、そして変化する仕事

Amazon SageMaker AI サーバーレスモデルカスタマイゼーションで NVIDIA Nemotron 3 モデルを微調整

チームを縮小せずにトークン予算を削減する方法

AIは3兆ドルの問題に答えられるか？

Nemotron Labs 3 Puzzle 75B A9Bの紹介：2.03倍のサーバースループットを実現する圧縮ハイブリッドMoE LLM

高速トークン生成が差別化要因として浮上、異種推論が普及へ

DDN、AIデータインフラを成否のカギとしてGPU効率化に照準

DeepSeek、自社AIチップ開発へ

NVIDIA、Nemotron-Labs-3-Puzzle-75B-A9Bをリリース：圧縮ハイブリッドMoE LLM、同一ユーザースループットでサーバースループット2.03倍を実現

1億3000万ドルのシリーズA、オープンな超知能スタック構築へ

OpenClaw財団設立

NvidiaとHugging Face、オープンソースロボットモデルで協力

エージェントのためのデータ

LangChainとNVIDIA、NemoClaw Deep Agents Blueprintを発表

NVIDIA Nemotron、LangChain Deep Agents Harnessでベンチマーク首位を達成

NVIDIA NemoClaw 上の Deep Agents Code：最も機密性の高いコードのためのガバナンスブループリント

ZML、AIチップ間の推論を高速化する無料製品をリリース

NVIDIAのCosmos-Frameworkチュートリアル：オムニモーダル混合トランスフォーマーでCosmos 3ワールドモデルのColab対応ミニチュアを設計する

GPU不足は忘れろ：本当のAIボトルネックは2007年に診断されていた

[AINews] Lilian WengがRSIのためのハーネス工学に関する35本の論文を要約

NVIDIAがAudex（Nemotron-Labs-Audex-30B-A3B）を公開：テキスト知能を保持する統合音声テキストLLM

AIイノベーターがNVIDIA Veraを採用——大規模な最大シングルスレッドCPUが重要な理由

Nvidia GPU債務バックストップがAIプロジェクトの三位一体を解き放つ：資本、オフテイク

NVIDIAとHugging Face、オープンロボティクスコミュニティ向けに新モデルとフレームワークをLeRobotへ提供

主権AI診断がプライムタイムに登場

オープンモデルがAI研究を推進する方法

各国が戦略的優先事項のためにAIをどのように展開しているか

AIデータセンター

美団、NVIDIA GPUなしで1.6兆パラメータのAIモデルを訓練

中国のLongCat-2.0、Nvidiaチップを使用しない最大のAIモデルに

Nvidiaが静かにAIブームの背後にある銀行となる

Anthropic、Claude Scienceベータ版を公開：再現可能なゲノミクス、プロテオミクス、ケモインフォマティクスパイプラインのためのマルチエージェントAIワークベンチ

NVIDIA HORIZON：Gitワークツリーを進化させ、RTLベンチマークで100%達成率を記録するハンズフリーエージェント

NVIDIA AIがASPIREを発表：自己改善型ロボティクスフレームワーク、LIBERO-Pro長期タスクで31%のゼロショット達成

NVCF：GPUアクセラレーションAIワークロードを大規模にデプロイ・ルーティング

DGX Stationと「フロンティア」モデル：答えを求める旅

Show HN: AIインフラストラクチャナレッジベース

NVIDIA BioNeMoがAnthropic Claude Scienceを加速

[AINews] 今日はあまり何も起こらなかった

NVIDIA、AIコンピュートを大規模に解放——資本パートナーを招きAIインフラ構築を支援

AWS GovCloud (US) で Amazon Bedrock 上で NVIDIA Nemotron と OpenAI GPT OSS モデルを実行する

NVIDIAとパートナーがアメリカで、アメリカのために建設

NVIDIA、Nemotron-Labs-TwoTowerを公開：凍結された自己回帰バックボーン上に構築されたオープンウェイト拡散言語モデル

Jetsonでデュラブルストリームを介したローカルAIの提供

Hugging Face と Cerebras、Gemma 4 をリアルタイム音声AIに導入

NVIDIA BioNeMo Agent ToolkitがClaude Scienceで生命科学研究者に加速AIを提供

Anthropic、科学研究向けAIワークベンチ「Claude Science」を発表

NVIDIAの推論ソフトウェアスタックがどのように最低トークンコストを実現するか

企業ナビゲーション

OpenAI

Anthropic

DeepSeek

Google

Meta

Microsoft

NVIDIA

Mistral

Hugging Face

LangChain