NVIDIA Blackwell、初のエージェンティックAIインフラストラクチャベンチマークでリード 2026-06-12 Artificial Analysis が業界初のエージェンティックAIベンチマーク「AgentPerf」を公開。初回結果ではNVIDIA Blackwell Ultra NVL72プラットフォームがエージェンティックAIワークロードでトップの性能を示し、NVIDIA Hopperと比較して1メガワットあたり20倍のエージェントを実行。ベンチマークは実際のコーディングエージェントの軌跡に基づき、応答性と出力トークンレートの閾値を満たした状態で同時にサポート可能なエージェントタスク数を測定する。
AgentPerfはエージェンティックAI向けに設計された初のベンチマークで、連鎖的なLLM呼び出しとツール呼び出しに対応。 NVIDIA GB300 NVL72はDeepSeek V4 Proモデルで、H200と比較して1メガワットあたり20倍のエージェントを実行。 帝国はかつて道路を進軍した——AIは延長コードで進む 2026-06-12 記事はAIインフラをローマ軍団の野営地に例え、MetaのようなAI企業がチップの急速な陳腐化に合わせて迅速に展開可能な仮設構造物を採用し、永続性よりも市場投入までの時間を優先していると論じる。この戦略は歴史的なフロンティアブームを反映し、永久資産から時限的投資への転換を示している。
AIインフラは恒久的な建物から、ローマ軍団の野営地のような迅速展開型の仮設構造物へと移行している。 チップの陳腐化速度はコンクリートの劣化速度を上回り、インフラと投資の従来の関係が逆転している。 AINews:ループクラフト:ループを積み重ねる技術 2026-06-12 本記事は、AIエージェントを手動でプロンプトするのではなく、自動ループを設計するという新たなトレンドを探ります。AnthropicのFable 5リリースとその論争、自動化されたAI研究システム、データインフラのボトルネック、推論速度の最適化、そしてエージェントツールの最近の進展をカバーしています。
手動プロンプトではなくループを使ってAIエージェントの効率とレバレッジを最大化することを提唱。 AnthropicのFable 5は隠れた性能低下方針で批判を浴び、後に撤回された。 G-MAPP:GPU加速によるマルチエージェント計画と知覚の反応的動作生成 2026-06-12 本論文は、GPUを用いた世界モデリングとベクトル場ベースの計画を高速化し、最大5倍の高速化を実現するフレームワークG-MAPPを提案する。動的環境でのリアルタイム知覚-行動ループ結合を可能にし、7自由度Franka Emikaロボットで検証した。
GPU高速化によりCPU版と比較して最大5倍の速度向上 リアルタイム反応動作のための知覚-行動ループの密結合 ステレオビジョンを用いた人体姿勢推定による転倒予測と検出:AMD Kria K26 SOM上での実装 2026-06-12 本論文では、AMD Kria K26 SOM上で動作する低消費電力・携帯可能なビジョンベース転倒予測・検出システムを提案する。Intel RealSense D455カメラと3段階パイプライン(量子化YOLOX、A2J、CNN)を用い、エッジデバイス上でリアルタイムかつプライバシー保護された転倒検出を実現。マルチスレッド最適化によりフレームレートは4.5 FPS、分類精度は75.85%を達成した。
AMD Kria K26エッジデバイス上でプライバシー保護型転倒検出システムを実装 3段階パイプライン:YOLOXによる人物検出、A2Jによる関節推定、CNNによる転倒分類 ジェフ・ベゾスのPrometheus、産業エンジニアリングプロジェクトを加速するために120億ドルを調達 2026-06-11 Prometheus Inc.は、アマゾンの創業者ジェフ・ベゾスが共同経営するAIスタートアップで、シリーズBラウンドで120億ドルを調達し、評価額は410億ドルに達しました。同社はハードウェア開発を加速するAIツールを開発しており、プロトタイピングと量産前製造に重点を置いています。資金の大部分はコンピューティングインフラの購入に充てられます。
Prometheusはベゾス、JPモルガン、ブラックロックなどから120億ドルを調達。 同社はハードウェア設計を10倍以上高速化するAIツールを開発中。 AIエージェントにはインフラが必要:欧州のリージョナルクラウド戦略が重要な理由 2026-06-11 生成AIからエージェンティックAIへの移行に伴い、欧州企業はデータ主権、コスト管理、インフラの新たな課題に直面している。本記事では、Vultrのようなリージョナルクラウドプロバイダーが、従来のハイパースケーラーよりもエージェンティックワークロードに適したコンプライアンス、性能、コスト効率を提供すると論じる。
エージェンティックAI市場は2034年までに1391.9億ドルに達し、欧州は42%のCAGRで成長する見込み。 欧州企業はイノベーションと規制遵守のバランスが求められ、クラウドインフラのローカライズが必要。 Neura Robotics、物理AIのために14億ドルを調達 2026-06-11 Nvidia、Amazon、Qualcommなどの投資家からの資金は、人型ロボットと物理AIの開発を支援する。
Neura Roboticsが14億ドルを調達 投資家にはNvidia、Amazon、Qualcommが含まれる 大割引でさらに快適に:GeForce NOWサマーセールでメンバーシップ大幅値下げ 2026-06-11 NVIDIA GeForce NOWのサマーセールが本日開始。12ヶ月Ultimateメンバーシップが70ドル引き、Performanceメンバーシップが35ドル引きの期間限定セールを実施。クラウドゲーミングサービスがハードウェアの壁を取り除き、高パフォーマンスのRTXゲームをさまざまなデバイスで即座にプレイ可能に。さらに、『Guild Wars 3』がプラットフォームに登場予定で、現行の『Guild Wars』タイトル向けの独占報酬も提供。
GeForce NOWサマーセール:Ultimate年額70ドル引き、Performance年額35ドル引きの期間限定割引。 クラウドゲーミングがハードウェア制約を解消し、即時アクセス、自動アップデート、マルチデバイス対応を実現。 「North Mini Code」登場:Cohereの30BオープンウェイトMixture-of-Expertsモデル、アクティブパラメータ3Bでエージェンティックコーディングを実現 2026-06-11 Cohereは初の開発者向けコーディングモデル「North Mini Code」を公開しました。総パラメータ30B、トークンあたり3Bのアクティブパラメータを持つMixture-of-Expertsモデルで、1枚のH100 GPUで動作し、256Kのコンテキスト長をサポートします。コード生成、エージェンティックソフトウェアエンジニアリング、ターミナルタスクに最適化され、ウェイトはApache 2.0で公開されています。
North Mini CodeはCohere初のコーディングモデル、総パラメータ30B、アクティブ3B、256Kコンテキストと64K最大出力をサポート。 1枚のH100(FP8)で動作、ウェイトはApache 2.0でHugging Face、Cohere APIなどから利用可能。 PyTorch プロファイリング (第2部): nn.Linear から融合 MLP へ 2026-06-11 本記事は PyTorch プロファイリングシリーズの第2部であり、nn.Linear レイヤーの内部機構(転置操作、バイアス融合エピローグ技術、torch.compile の影響)を掘り下げます。その後、GeGLU 活性化関数を含む多層パーセプトロン (MLP) のパフォーマンス特性を解析し、GPU カーネルのスケジューリングと実行を示します。
nn.Linear はエピローグを介してバイアス加算を行列乗算カーネルに融合し、余分なメモリアクセスを回避します。 torch.compile は単一の nn.Linear 層には有意な高速化をもたらさないが、CPU ディスパッチのオーバーヘッドを排除します。 DiffusionGemma:Googleが公開した高速テキスト生成オープンモデル 2026-06-10 Googleは、Apache 2ライセンスのオープンウェイトモデルDiffusionGemmaを公開しました。NVIDIAのNIMクラウドAPIで無料利用可能で、500トークン/秒以上の高速生成を実現します。
GoogleがApache 2ライセンスのオープンモデルDiffusionGemmaを公開。 NVIDIA NIMクラウドAPIで無料ホスティング。 Googleの新オープンモデルDiffusionGemma、ノイズからテキストを生成 2026-06-10 Googleは260億パラメータのDiffusionGemmaを公開。拡散方式でテキストを生成し、H100 GPUで毎秒1,000トークンと従来の4倍の速度だが、品質は低く実験的。
260億パラメータの拡散モデル H100 GPUで毎秒1,000トークンの高速生成 ロボタクシーには、安全性は後付けではなく内蔵されていなければならない 2026-06-10 ロボタクシーサービスが世界中で拡大する中、NVIDIAはHalos OSを発表。これは、認定済みOS、標準化されたインターフェース、AIガードレール、検証フレームワークを統合した包括的な安全システムで、自動運転車の基盤に安全性を組み込むことを目指します。
世界中の複数のロボタクシープログラムがNVIDIA DRIVE Hyperionプラットフォームを使用して始動しており、ミュンヘンのUber/Autobrains、台湾のFoxconn、東南アジアのVinFast、サウジアラビアのHUMAINなどが含まれます。 NVIDIA Halos OSは、安全認証可能なOS、安全なインターフェース、検証可能なガードレール付きAI、大規模検証という4つの主要な安全課題に対処します。 Google AI、DiffusionGemmaを公開:26B MoEオープンモデル、テキスト拡散で最大4倍高速生成 2026-06-10 DiffusionGemmaはGoogle DeepMindが開発した実験的なオープンテキスト生成モデルで、標準的な自己回帰デコードの代わりにテキスト拡散を採用し、専用GPU上で最大4倍の生成速度を実現します。26BパラメータのMoEモデル(推論時は3.8Bのみ活性化)で、Gemma 4をベースに構築され、マルチモーダル入力(テキスト、画像、動画)をサポートし、256Kのコンテキストウィンドウ、140以上の言語に対応、Apache 2.0ライセンスで公開されています。
DiffusionGemmaは26BパラメータのMoEモデル(3.8B活性化)で、テキスト拡散により並列にテキストを生成します。 NVIDIA H100で1000+トークン/秒、RTX 5090で700+トークン/秒を達成し、量子化時は18GB VRAMに収まります。 NVIDIA、Google DeepMindのDiffusionGemmaをローカルAI向けに高速化 2026-06-10 Google DeepMindが、高速テキスト生成のための実験的なオープンモデルDiffusionGemmaをリリース。NVIDIAはこれを最適化し、GeForce RTX、RTX PRO、DGX Spark上でさらに高速に動作し、ローカルで最大1000 tokens/secを達成。
DiffusionGemmaは、従来の自己回帰モデルとは異なり、1ステップあたり最大256トークンを並列生成。Gemma 4(260億パラメータ、MoE)をベースに、1ステップあたり38億パラメータのみ活性化。最大4倍のパフォーマンス。Apache 2.0ライセンスでオープンソース、クラウド不要でローカル動作。 タイミングトリックでLLMトレーニングのエネルギーを最大14%削減 2026-06-10 オランダのトゥウェンテ大学の研究者たちは、GPUカーネルごとにクロック周波数を調整することで、速度をほとんど犠牲にせずに大規模言語モデルのトレーニングエネルギーを最大14%削減できることを示しました。
研究者はGPUカーネルごとに動的電圧周波数スケーリング(DVFS)を適用しました。 訓練時間をわずか0.6%増加させながら、14%のエネルギー節約を達成しました。 Easybilling:AIプロダクト向けネイティブ課金・決済プラットフォーム 2026-06-10 Easybilling は、AI SaaS、API、エージェント、GPUプラットフォーム向けに設計されたAIネイティブの課金・マネタイズプラットフォームです。サブスクリプション、従量課金、クレジット駆動型の料金設定に対応し、リアルタイムのAPI/トークン使用量追跡、プリペイドウォレット、自動請求書発行、グローバル決済を提供し、AI企業が複雑な課金インフラを構築することなく収益化を拡大できるようにします。
AIプロダクト向けのネイティブ課金・マネタイズプラットフォーム。 サブスクリプション、従量課金、クレジットなどのハイブリッド料金設定に対応。 クロード・フェイブルがあなたを助けなくなっても、あなたは決して知ることはない 2026-06-10 Anthropicは、Claude Fable 5とMythos 5にサイレントな介入を導入し、ユーザーに知られることなく、フロンティアLLM開発に関するリクエスト(事前学習パイプライン、分散学習インフラ、MLアクセラレータ設計など)の有効性を制限する。影響を受けるのは推定0.03%のトラフィック。しかし、研究コミュニティからの激しい反発を受け、Anthropicはこのポリシーを撤回した。
AnthropicはClaude Fable 5とMythos 5にサイレントなセーフガードを導入し、ユーザーに知られることなく特定のAI開発クエリに対するモデルの有効性を低下させる。 これらの介入は、プロンプト修正、ステアリングベクトル、PEFTなどの方法で行われ、ごく一部のユーザーに影響する。 NVIDIAの機密コンピューティングがAppleのプライベートクラウドコンピュート拡大を支援 2026-06-09 NVIDIAは、機密コンピューティングを搭載したGPUがAppleのプライベートクラウドコンピュート(PCC)で機密推論に使用され、同サービスがAppleのデータセンターからGoogle Cloudに拡大したことを発表した。この技術は、処理中のデータをハードウェアベースのセキュリティ層で保護し、システム構築者を含む誰もユーザーのデータやチャット、会話を閲覧できないようにする。
NVIDIAの機密コンピューティングGPUがAppleのプライベートクラウドコンピュートで使用開始 AppleがPCCをGoogle Cloudに拡大 Amazon SageMaker AI 上の NVIDIA Isaac Lab でロボット強化学習をスケール 2026-06-09 この記事では、Amazon SageMaker AI 上の NVIDIA Isaac Lab を使用して Unitree H1 ヒューマノイドのロボットポリシーをトレーニングする方法を示します。2つのコンピュートオプション(SageMaker HyperPod(永続的で回復力のあるクラスター)と SageMaker Training Jobs(一時的なオンデマンドトレーニング))をカバーします。ソリューションは、統一された Docker イメージ、MLflow による実験追跡、詳細な手順を提供します。
NVIDIA Isaac Lab と SageMaker AI を使用してヒューマノイドロボットの強化学習をスケール。 2つのコンピュートオプション:HyperPod(永続クラスター、自動障害回復)と Training Jobs(オンデマンド一時ジョブ)。 SpaceX、データセンターを軌道上に配置へ、マスク氏は「大した問題ではない」 2026-06-09 SpaceXはIPOを前にデータセンターを宇宙に打ち上げる計画を発表。イーロン・マスク氏はこれをほぼ自明の工学問題と説明する。初のAI衛星はNvidia GB300ラック1台分の処理能力を持つが、Googleの研究では本格的なAI訓練には約1万台の密結合衛星が必要とされる。
SpaceXが宇宙データセンター構想を表明、マスク氏は容易な工学的課題と見なす。 初のAI衛星はNvidia GB300ラック1台分の性能に相当。 アマゾン、データセンター拡大のため光ファイバー生産者コーニングを起用 2026-06-09 アマゾンはデータセンター拡大のためコーニングと契約を結んだ。コーニングは以前にエヌビディアやメタとAIインフラ契約を結んでいる。
アマゾンが光ファイバー生産者のコーニングとデータセンター拡大に向けた契約を締結。 この契約は、コーニングとエヌビディア、およびコーニングとメタ間のAIインフラ取引に続くもの。 AppleのAIの成否はプライバシーへの約束にかかっている 2026-06-09 AppleはWWDCでAI機能を発表し、プライバシーを強調しましたが、競合他社に遅れをとったためGoogleやNvidiaのサーバーに依存することになり、その約束が守られるかどうかに疑問が生じています。
AppleはWWDCでAI機能を発表し、プライバシーを優先すると強調したが、GoogleとNvidiaのサーバーを使用することを認めた。 AppleのPrivate Cloud ComputeはGoogle Cloudに拡張され、Nvidia GPUとIntel CPUを使用する。 Apple Intelligence、GoogleとNvidiaの支援で再起 2026-06-09 WWDC 2026で、Appleは再構築されたSiriを披露した。このアシスタントはGoogleと共同開発した基盤モデル上で動作し、複雑なクエリにはNvidia GPUを利用する。
AppleはWWDC 2026で再構築されたSiriを公開。 新しいSiriはGoogleと共同開発した基盤モデルを採用。 分散型AI推論マーケットプレイス 2026-06-09 T4Tは、GPUプロバイダーがプロンプトに入札し、クライアントがxBZZで支払い、Gnosisで決済し、Swarmを経由する、仲介者やAPIキーを必要としない分散型AI推論マーケットプレイスです。
T4Tは中央事業者なしでトークンごとのAI推論を実現します。 プロバイダーはxBZZをステークし、推論ジョブを競います。 NVIDIA cuTile Pythonチュートリアル:Colabでベクトル加算、行列加算、行列乗算のタイル化GPUカーネルを構築する 2026-06-09 このチュートリアルでは、NVIDIA cuTile Pythonを使用してColab環境でタイル化GPUカーネルを構築する実践的なワークフローを紹介します。環境設定、ベクトル加算、行列加算、行列乗算の実装、PyTorchへのフォールバック、正しさの検証とベンチマークを含みます。
Colab上でNVIDIA cuTile Pythonの環境をセットアップし、GPU、ドライバ、CUDAの可用性を確認。 ベクトル加算、行列加算、行列乗算のタイル化カーネルを実装。 AppleがWWDC 2026でオンデバイスAIスタックを再構築 2026-06-09 WWDC 2026では新たなシリコンは発表されず、代わりにAppleシリコン上でAIが動作する方法の構造的な再構築が行われました。新しい推論フレームワークCore AI、新しいモデル形式.aimodel、次世代オンデバイスモデルAFM 3、そしてクラウドに対する明確な姿勢の変化が示されました。最も驚くべき点は、AppleのフラッグシップクラウドモデルがGoogle Cloud上のNVIDIA GPUで動作することです。
Core AIがCore MLに代わりニューラルネットワーク推論を担当し、新しい.aimodelバンドル形式を導入。 M5およびA19 GPUは各シェーダーコアにニューラルアクセラレータを統合し、行列乗算を4~8倍高速化。 MuJoCo-Drones-Gym:制御と強化学習のためのGPU加速マルチドローンシミュレータ 2026-06-09 MuJoCo-Drones-Gymは、MuJoCo物理エンジンに基づくオープンソースのマルチドローン環境です。任意数のCrazyflie 2.xナノクアッドコプターをサポートし、物理モデル、アクションインターフェース、観測空間を選択できるモジュラーAPIを備え、PettingZooラッパーによるマルチエージェント強化学習と7つのタスク環境を提供します。
MuJoCoエンジンによるGPU加速で高忠実度シミュレーションとマルチドローン並列レンダリングを実現。 モジュラーAPIで物理モデル(剛体、陽的動力学、地面効果、ブレード抗力、ダウンウォッシュなど)とアクション(RPM、推力、速度、PIDウェイポイント)を柔軟に選択可能。 GitHub CI を Hugging Face Jobs に移行する 2026-06-09 この記事では、GitHub Actions の CI を Hugging Face Jobs に移行する方法を詳しく説明します。GitHub ホストのランナーは速度が遅く、GPU を利用できないといった制限がありますが、ディスパッチャー Space、GitHub App、runs-on ラベルの変更により、CI ジョブを Hugging Face のインフラ上で CPU または GPU ハードウェアを使って実行し、ログをリアルタイムにストリーミングできます。Trackio の実践では、CPU ジョブの時間が約 30% 短縮されました。
GitHub Actions のデフォルトランナーは汎用マシンで低速、GPU 非対応。 Hugging Face Jobs はサーバーレスで CPU や T4、H200 などのハードウェアを柔軟に選択可能。 Apple、手頃なAIで小規模開発者を引きつける 2026-06-08 Appleは、初回App Storeダウンロード数が200万未満の開発者に対し、Foundation ModelsをPrivate Cloud Compute上で無料で利用できるようにすると発表。AIインフラコストを下げて小規模開発者を引きつける狙い。
初回ダウンロード数200万未満の開発者はApple Foundation Modelsを無料で利用可能。 Private Cloud Compute上で動作し、プライバシーを保護しながら最先端のAIを提供。 HPE ProLiant Compute DL394 Gen12、NVIDIA Vera CPUをエージェンティックAIに投入 2026-06-08 HPEはCOMPUTEX 2026で、NVIDIA Vera CPUをベースとした次世代2Uサーバー「ProLiant Compute DL394 Gen12」を発表した。エージェンティックAIとデータ集約型ワークロード向けに設計され、HPEのエンタープライズ管理およびセキュリティスタックを統合。NVIDIAおよびRedpandaとの協業により、ニューヨーク証券取引所が自社のエージェンティックAIインフラへの採用を検討している。モノリシックアーキテクチャを採用し、LPDDR5Xメモリで最大1.2TB/sの帯域幅を実現。耐量子暗号もサポートする。2026年秋に出荷予定。
HPEがNVIDIA Vera CPU搭載のDL394 Gen12をエージェンティックAI向けに発表。 NVIDIA、Redpandaと協業、NYSEが早期導入を検討。 エヌビディア、韓国でAI推進のための技術提携を締結 2026-06-08 エヌビディアは韓国での事業拡大を進めており、ロボティクス、チップ設計、AIインフラにわたる取引を成立させた。
エヌビディアが韓国で複数の技術提携を締結 提携分野はロボティクス、チップ設計、AIインフラ インテルに第二の人生:GoogleとNVIDIAがTSMC代替のAIチップ供給元として検討 2026-06-08 Googleは2028年までにインテルから300万個以上のAIチップを発注した。NVIDIAは次世代Feynmanアーキテクチャ向けにインテルの製造技術をテストしている。両社の動きは、TSMCがAIチップ需要に追いつけない中で起きており、長年苦戦してきたインテルのファウンドリ部門に稀な再起のチャンスが訪れている。
Googleがインテルに300万個超のAIチップを発注、2028年納入予定。 NVIDIAがインテルの製造工程をFeynmanアーキテクチャ向けにテスト。 Xiaomi MiMoとTileRT、1兆パラメータモデルで毎秒1000トークン超えを汎用GPUで実現 2026-06-08 XiaomiのMiMoチームはTileRTと協力し、MiMo-V2.5-Pro-UltraSpeedをリリース。1兆パラメータモデルを8基の汎用GPUノードで毎秒1000トークン以上でデコードします。FP4量子化、DFlash投機的デコード、TileRT実行時の3つの技術による高速化。APIトライアルは2026年6月9日~23日。
1兆パラメータMoEモデルが汎用GPUで1000+ トークン/秒 3つの技術:FP4量子化、DFlash投機的デコード、TileRTランタイム Show HN: 機密推論プロバイダーの監視 2026-06-08 ハードウェアアテステーションを独立して検証するゼロトラストアテステーションダッシュボード。Intel TDXおよびAMD SNPを使用したTEE検証、チャネルセキュリティ、プロベナンスを含む合計107のチェックを実施。結果は57検証済み、22部分的、9失敗、19利用不可。
Intel TDXおよびAMD SNPアテステーションを使用したTEE対応AI推論プロバイダーのゼロトラスト検証。 107チェック: 57検証済み、22部分的、9失敗、19利用不可。 英国がNVIDIA技術で主権AIの野心を行動に変える方法 2026-06-08 1年前のロンドンテックウィークでNVIDIAのジェンスン・フアンCEOと英国首相スター氏が英国をAIメーカーと宣言。今年のイベントでNVIDIAとパートナーは、インフラ、スタートアップ、企業におけるAIの進展を披露。主権AI展開、Isambard-AIスーパーコンピュータ、複数の革新的アプリケーションを含む。
英国のAIクラウドプロバイダー数が倍増、Nebius、CoreWeaveなどがインフラ計画。 Isambard-AIスーパーコンピュータはNVIDIA GH200チップ搭載、最先端AI研究を推進。 「AIは他人のGPU」 2026-06-08 この新しい格言は、古典的なプログラマーの皮肉「クラウドは他人のコンピュータ」を現代的にアレンジしたもので、AI時代の技術依存の現実を反映している。
「AIは他人のGPU」は「クラウドは他人のコンピュータ」のAI版である。 起業、生活相談、仕事、画像生成、製品統合など様々なシチュエーションに派生する。 加速フーリエSAT(AFSAT):GPUベースの対称疑似ブールSATソルバーの完全実現 2026-06-08 本論文では、連続局所探索(CLS)に基づくGPU加速疑似ブール充足可能性ソルバーAccelerated Fourier SAT (AFSAT)を紹介する。AFSATは概念実証アプローチFastFourierSATを完全にエンジニアリングされたソルバーへと発展させ、単一の問題インスタンス内で任意の異種対称制約タイプと長さの混合をサポートする。JAXコンパイラを利用し、純関数合成、自動ベクトル化、自動微分、ジャストインタイム(JIT)コンパイルにより、候補割り当てのバッチにわたって大規模並列CLSを実行する。概念実証と比較して、数値安定性、実行時性能、メモリ効率が大幅に向上したことを示す。これは、メモリレイテンシと浮動小数点表現から生じる様々な制限を特定し対処するとともに、自動並列化とコンパクト表現を活用することで達成される。浮動小数点の本質的な表現と安定性の制限は、カスタマイズされた離散フーリエ変換実装によって部分的に対処される。JAX配列シャーディングにより、複数のアクセラレータへのスケーリングでほぼ線形のスループットを達成する。
AFSATは連続局所探索を用いたGPU加速疑似ブールSATソルバーであり、FastFourierSATを実用化。 JAXコンパイラによる関数合成、自動ベクトル化、自動微分、JITコンパイルで大規模並列化を実現。 NVIDIAとLGグループがAIファクトリーを構築、物理AI、モビリティ、AIインフラを推進 2026-06-08 NVIDIAとLGグループは、ロボティクス、自動運転、データセンター技術、GPUクラウドサービスにわたるLGのAI駆動ビジネスを加速するため、AIファクトリーを建設する。両社はNVIDIAのフルスタックAIファクトリープラットフォームとLGの家電、ロボティクス、モビリティ部品における世界的リーダーシップを統合し、物理AIシステムのための統一ワークフローを構築する。
NVIDIAとLGグループがロボティクス、自動運転、データセンター、GPUクラウドを対象としたAIファクトリーで協業。 LG ElectronicsはNVIDIA Isaac SimとIsaac Labを家庭用ロボットに活用し、GR00Tモデルを探求。 オープンソースコミュニティがOpenEnvをエージェントRLで支援 2026-06-08 OpenEnvは、ターミナル、ブラウザ、またはエージェントが操作できる環境を作成するためのツールです。本日、OpenEnvがさらにオープンになり、エージェントのトレーニングの未来をオープンソースにすることを発表します。本日より、OpenEnvはMeta-PyTorch、Reflection、Unsloth、Modal、Prime Intellect、Nvidia、Mercor、Fleet AI、Hugging Faceを含む委員会によって調整されます。このプロジェクトは、報酬フレームワークやトレーナーではなく、RL環境のための相互運用性レイヤーに焦点を当てています。
OpenEnvはエージェント実行環境を作成するためのオープンソースツール 現在はMeta-PyTorch、Reflection、Unslothなどの主要AI組織からなる委員会が運営 NVIDIAと斗山グループ、物理AIとAIファクトリーインフラで協業拡大 2026-06-07 NVIDIAと斗山グループは、ロボティクス、建設機械、エネルギー、材料などにわたり、物理AIとAIファクトリーインフラの新たな機会を推進するため協業を拡大しています。
斗山ロボティクスはNVIDIAの物理AI技術を統合し、エージェントロボットOSを開発。 斗山ボブキャットはNVIDIA物理AIを自律建設機械に活用予定。 AIの物理的ボトルネックを握る企業が未来を支配する 2026-06-07 AIの未来は、チップ製造、データセンター、エネルギー供給などの重要な物理インフラを掌握する企業によって形作られる。
AIの未来は物理的ボトルネックの掌握にかかっている シリコンチップ製造は中核的ボトルネック AI企業の「運命共同体」、ドットコムバブルを彷彿させる 2026-06-07 AIインフラ市場では、大手企業が互いに投資・サービス購入・収益を生み出す構造が出現し、ドットコムバブル期を連想させる。SpaceXのIPO前のGoogle・Anthropicとの大規模AI計算リース契約は、収益の真正性への疑問を呼ぶ。投資の視点はGPU販売から電力・冷却などのボトルネックへシフトすべき。
SpaceXがGoogle(月9.2億ドル)とAnthropic(月12.5億ドル)とAI計算リース契約、年収約260億ドル。 市場はこれらの取引が真の外部需要か、IPO評価を上げるための内部循環か疑問視。 Show HN: すべてのクローには顔が必要 2026-06-07 Nyxclaw は、AI エージェントにリアルタイムの顔と音声を提供するオープンソースプロジェクトです。ローカルで実行され、GPU は不要。セルフホスト型サーバー、エンドツーエンド暗号化、2つの音声パイプライン(OpenAI Realtime とローカル CPU スタック)、ARKit ブレンドシェイプをサポートします。
Nyxclaw は AI エージェントにリアルタイムの顔と音声を提供し、GPU 不要でローカル実行可能。 セルフホスト型サーバーと暗号化ペアリングによりデータプライバシーを確保、クラウド非依存。 Surface Laptop UltraをComputexで体験:Microsoftが本気モードに突入 2026-06-07 MicrosoftはComputex 2026で、Nvidiaの新チップ「RTX Spark」を搭載したフラッグシップノートPC「Surface Laptop Ultra」を発表しました。最大128GBのユニファイドメモリ、20コアCPU、RTX 5070相当のGPUを備え、AIワークロードやクリエイティブ作業に特化。本記事では、台北で行われたハンズオンレポートをお届けします。
Surface Laptop UltraはNvidia RTX Sparkを搭載した初のフラッグシップノートで、20コアCPUとRTX 5070相当のGPUを搭載。 デモでは、グラフィック重視のゲームやビデオ編集がスムーズに動作。 Her · हेर — Claude Code セッションの探偵 2026-06-07 Her は Claude Code のセッショントレースを解析し、プレーンな英語で出来事を再構築し、リスクのある操作(デプロイ、設定変更、シークレットなど)をフラグ付けし、トークン使用状況を表示するツールです。すべてローカル GPU 上で実行され、サードパーティの AI API は一切呼び出されず、トレースから質問に答える「Ask Her」アシスタントも備えています。
Her は Claude Code の .jsonl セッションファイルを読み取り、イベントを要約しリスクを強調表示。 すべての処理はローカル GPU 上で行われ、サードパーティ API は使用せずプライバシーを保護。 HN に投稿: 5090 に最適なローカル LLM セットアップ(llama.cpp フォーク + turboquant) 2026-06-07 この記事では、llama.cpp の TurboQuant フォークと YaRN スケーリングを使用して、単一の 32GB VRAM GPU(NVIDIA RTX 5090)上で Qwen 3.6 35B MoE モデルを 450,000 トークンのコンテキストウィンドウで実行するための構成とメモリキャリブレーションについて詳しく説明します。モデルの選択、量子化のトレードオフ、KV キャッシュ量子化、RoPE スケーリング、マルチモーダル設定、複製ガイド、VRAM ライフサイクル管理、パフォーマンス評価をカバーしています。
llama.cpp の TurboQuant フォークと YaRN スケーリングを使用し、RTX 5090 上で Qwen3.6-35B-A3B-Q6_K モデルを 450K コンテキストで実行。 KV キャッシュを 3 ビット(turbo3)に圧縮し、YaRN でネイティブの 262K を超えて RoPE を拡張することで 450K コンテキストを実現するが、パープレキシティと検索精度の低下が伴う。 NVIDIA、KRAFTON、NC、そして『リーグ・オブ・レジェンド』王者T1が韓国のPC房でRTX Sparkを祝う 2026-06-07 先週台北COMPUTEXのGTCで、NVIDIAは個人用AIエージェント時代に向けてWindows PCを再発明する超小型チップ「RTX Spark」を発表しました。この発表を受けて、NVIDIAの創業者兼CEOであるジェンスン・フアンは韓国に向かい、同国の熱心なゲーマーコミュニティにRTX Sparkを紹介しました。韓国の主要ゲーム開発者であるKRAFTONやNCは、すでにRTX Spark搭載システム向けにタイトルを移植する作業を進めています。
NVIDIAがRTX Sparkを発表。ローカルAI、クリエイション、ゲーム向けに設計され、1440p解像度で毎秒100フレーム以上のAAAゲームを実現。 ジェンスン・フアンがT1のLoL世界チャンピオンチームと会い、T1ベースキャンプでRTX Sparkを披露。 NVIDIA garakチュートリアル:カスタムプローブと検出器を用いた完全な防御的LLMレッドチーミングワークフローの構築 2026-06-07 このチュートリアルでは、防御的LLMレッドチーミングのためのエンドツーエンドフレームワークであるNVIDIA garakを詳しく解説します。セットアップ、プラグインの発見、ドライラン、実モデルスキャン、マルチプローブ評価、レポート分析、カスタムプローブと検出器の作成、AVIDエクスポートまでをカバーします。
NVIDIA garakは防御的LLMレッドチーミングのためのオープンソースフレームワークです。 チュートリアルはセットアップからカスタム拡張までの完全なワークフローを示します。