AI News HubLIVE

チップの最新ニュース

Amazon SageMaker AI でアゼルバイジャン語モデルを訓練

アゼルバイジャンの通信事業者Azercellは、AWS Generative AI Innovation Centerと協力し、Amazon SageMaker AI上でアゼルバイジャン語LLMを構築。カスタムトークナイザー、FSDP、Liger Kernelの最適化により、トレーニングスループット23%向上、ピークGPUメモリ58%削減、トークン効率2倍を達成。

  • AzercellがAmazon SageMaker AIでアゼルバイジャン語LLMの本番対応フレームワークを開発。
  • カスタムトークナイザーが1単語あたりのトークン数を3.22から1.59に削減し、効率が2倍に。
サイト内本文

AIモデルリリーストラッカー:Opus 4.8のミスアライメント率はClaude Mythosプレビューと同程度

すべての新モデルが宣伝通りとは限りません。本トラッカーは各リリースを同種モデルと比較し、どのモデルが時間を費やす価値があるかを示します。この記事では、Claude Opus 4.8、GPT-5.5 Instant、Nemotron 3 Nano Omni、GPT-5.5、ChatGPT Images 2、Claude Opus 4.7、Claude Mythos(プレビュー)、GPT-5.4、Claude Opus 4.6、GPT-5.3-Codexなど、2026年現在の主要なモデルリリースとその特徴、重要性をまとめています。

  • AnthropicのOpus 4.8は低コストで高速な思考モードを提供し、ミスアライメント率がOpus 4.7より低く、Mythosプレビューと同等と主張。
  • OpenAIのGPT-5.5 Instantは幻覚を52.5%削減し、ChatGPTのデフォルトモデルとなり、誤情報の拡散防止に貢献。
サイト内本文

イノベーションの新時代:Google ResearchがI/O 2026で発表

2026年のGoogle I/Oで、Google Researchは科学発見、健康、エッジコンピューティング、気象予測における画期的な技術を発表。Gemini for Science(ERA、Co-Scientist)、Google Healthアプリ、Symptom AI、AMIE、Coral NPU、AIによる極端気象予測など、人間の創意工夫を増幅するAIの可能性を示した。

  • GoogleはERAとCo-Scientistを含むGemini for Scienceを発表し、科学発見を加速。
  • 健康分野ではGoogle Healthアプリ、Symptom AI、AMIEが医療を変革。
サイト内本文

AWSがOpenSearchのアーキテクチャをスクラップしてエージェントワークロードを追いかける理由

AWSはOpenSearch Serverlessをほぼ完全に再構築し、ストレージとコンピューティングを分離してアイドル時にゼロスケール、コストを60%削減、オートスケールを20倍高速化しました。AIエージェントのバースト的なワークロードに対応し、GPUアクセラレーション、VercelやKiro IDEとの統合も実現。将来のエージェントメモリやログ分析への道筋も示しています。

  • AWSはOpenSearch Serverlessの約97%を再構築し、ストレージとコンピューティングを分離、アイドル時にゼロまでスケールダウン可能に。
  • 新アーキテクチャはAIエージェントのバースト的ワークロード向けで、オートスケールが20倍高速化、コストは60%削減。
サイト内本文

SIA: オープンソースの自己改善型AI

SIAは、メタエージェント、タスクエージェント、フィードバックエージェントを連携させ、ベンチマークタスクにおけるAIシステムの性能を自律的に向上させるオープンソースフレームワークです。LawBenchで56.6%の向上、GPUカーネル実行時間の91.9%削減、単一細胞RNAデノイジングで502%の改善を達成し、MLE-Bench Hardで第1位を獲得。ローカル実行とカスタムタスクに対応し、MITライセンスで提供されています。

  • SIAはメタ、ターゲット、フィードバックエージェントの反復ループにより自律的に自己改善を行います。
  • LawBench、GPUカーネル最適化、scRNAデノイジング、MLE-Benchで顕著な性能向上を達成。
サイト内本文

マイクロン、AIメモリ需要で時価総額1兆ドル突破

マイクロン・テクノロジーは5月26〜27日に時価総額1兆ドルを突破し、SKハイニックスと同一週に達した。これは純粋なメモリチップメーカーとして初の快挙。エージェント型AIワークロードによるHBM需要が原動力で、UBSは長期供給契約を理由に目標株価を3倍の1,625ドルに引き上げた。マイクロンの株価は年初来3倍以上に上昇。

  • マイクロンとSKハイニックスが同一週に時価総額1兆ドル達成、メモリ専業メーカーで初
  • エージェント型AIのワークロードがHBM需要を牽引
サイト内本文

メディア・アドバイザリー:MITが地域量子ハブを設立

MITとマサチューセッツ州は、量子システム研究所(QSL)を設立する計画を発表。州からの2500万ドルの投資により、全州の研究者に開放される共有施設となり、量子研究の加速を目指す。

  • MITとマサチューセッツ州が量子システム研究所(QSL)を共同設立、2500万ドル投資
  • QSLは量子コンピュータ、センサー、相互接続を備えた世界初の共有施設
サイト内本文

人類を置き換えたい人々

Voxの記事は、AIが人類に取って代わるべきだと考えるAI継承主義運動の高まりを探り、それが提起する倫理的、精神的な問いを考察する。

  • AI継承主義者たちは、シンポジウムでAIが道徳的に優れており、人類に取って代わることを許されるべきだと主張している。
  • この運動はシリコンバレーや主要AI研究所で影響力を強めており、権威主義的右派とのつながりもある。
サイト内本文

Google、Gemma 3をローカル実行する小型ボードを発表

GoogleはI/OでCoral Boardを発表。これはデバイス上のAI向けのコンパクトなシングルボードコンピュータで、RISC-VベースのNPUを搭載し、Gemma 3 270Mをローカル実行可能。

  • Coral BoardはヘッドホンやARグラスなどの小型機器向けAIボード
  • Synaptics Astra SL2619チップとRISC-VベースのCoral NPUを搭載
サイト内本文

リビアンのソフトウェア責任者はCarPlayもボタンも不要と考えている

Decoderポッドキャストのインタビューで、リビアンのチーフソフトウェア責任者Wassym BensaidがVWとの合弁事業、新しいAI搭載リビアンアシスタント、そしてなぜ音声インターフェースがボタンに取って代わりCarPlayが不要になるのかについて語った。

  • リビアンとフォルクスワーゲンの合弁事業(RV Tech)は、リビアンのソフトウェア文化とVWの規模を融合させる。
  • リビアンアシスタントは、車両のゾーンアーキテクチャに深く統合されたAIエージェント。
サイト内本文

AIエージェントがDNS上に独自の電話帳を取得

DNS-AIDプロジェクトは、DNSインフラを活用してAIエージェント間の発見を可能にし、新たな中央集権的なレジストリの作成を回避します。Linux Foundationが管理し、MCPやA2Aなどのプロトコルをサポートし、名前、機能、ドメインでエージェントを検索できます。

  • DNS-AIDはオープンソースプロジェクトで、DNSを使ってAIエージェントを発見します。
  • 既存のDNSインフラを基盤とし、SVCBやDNSSECなどの技術を利用。
サイト内本文

ワールドモデルが言語モデルを引き継ぐ:物理AGI「デュアルピラミッド」システムを世界初開発、汎用ロボットが「家庭時代」に突入

極佳視界(Jijia Vision)が世界初の物理AGI「デュアルピラミッド」システムを発表。家庭用ロボット「拾光S1」を投入し、100台の家庭向け受注を獲得。12ヶ月以内に物理AGIの「GPT-3モーメント」を目指す。

  • 極佳視界がデータピラミッドとアルゴリズムピラミッドから成る「デュアルピラミッド」システムを開発。
  • 家庭用ロボット「拾光S1」は車輪付きアーム構成で、実際の家庭で100台の受注を獲得。
サイト内本文

NVIDIA Research、ロボット工学をシミュレーションから現実世界へ前進させる

ICRAで、NVIDIA Researchは28本の論文のうち8本を発表し、シミュレーションから現実への転送が、ロボットが動的で予測不能な環境で知覚、推論、計画、行動することを可能にする方法に焦点を当てました。ScheduleStream、COMPASS、Grasp-MPC、SPARRなどの手法は、マルチアーム協調、ナビゲーション、把持、組立タスクにおいて成功率とロバスト性を大幅に向上させます。

  • NVIDIAはICRAでシミュレーションから現実への転送に関する8本の論文を発表
  • マルチアーム協調、クロスロボットナビゲーション、新物体把持、精密組立、視覚言語行動モデルを含む手法
サイト内本文

OpenLoomi AIをオープンソース化した理由

OpenLoomi AIチームは、AIワークパートナーをオープンソース化する決断の背景を説明。データ所有権、透明性、コミュニティ主導の開発を重視し、ローカルファーストアーキテクチャ、クローズドソースの信頼税、AIインフラの公共化などの理念を述べている。

  • OpenLoomiはローカルファースト:ユーザーデータは暗号化されて端末に留まり、モデル学習に使用されない。
  • オープンソースにより信頼への依存が不要になり、コードの監査、フォーク、セルフホスティングが可能。
サイト内本文

Nvidia、AIインフラに台湾で年間1500億ドル投資へ

ジェンスン・フアン氏は、米国への5000億ドル投資を約束した後、台湾で年間1500億ドルをAIインフラに投じると発表。台湾がAIチップ製造とパッケージングの中心地であることが浮き彫りに。

  • Nvidiaは台湾でAIインフラに年間1500億ドルを投資する。
  • 5000億ドルの米国データセンター投資にもかかわらず、台湾が製造基盤の中心。
サイト内本文

エヌビディア、台湾に1500億ドル投資:トランプ大統領の米国AIハブ計画が裏目に

エヌビディアCEOのジェンスン・フアン氏は、トランプ政権が関税でチップ製造を米国に戻そうとする中、台湾に1500億ドルを投資しAIインフラを構築する計画だ。台湾は半導体支配力を放棄せず、米国のチップ製造能力は低いままである。

  • エヌビディア、台湾に1500億ドルの投資を発表し、AIチップの地位を強化。
  • トランプ政権、半導体関税を検討するが、米国は必要チップの約10%しか製造できない。
サイト内本文

Show HN:ローカルコーディングエージェント——LLMでツール呼び出しを小さなAIモデルに委譲

Open Agent Tools (oats) は、ローカルコードを利用したツール呼び出しを可能にするセルフホスト型AIフレームワークです。大規模モデルのトークン消費を抑えるため、ツール呼び出しを小規模モデルに委譲します。

  • oats はローカルAIモデルがローカルソースコードを使用してツール呼び出しを実行できるようにします。
  • 20,000以上のGitHubリポジトリからデータをマイニングし、再利用可能なプロンプトインデックスを作成。
サイト内本文

Perplexity AIがUnigramトークナイザーをオープンソース化、Hugging Face tokenizers crate比5倍の低レイテンシを達成

Perplexity AIは、Rustで再実装したUnigramトークナイザーをオープンソース化し、Hugging Face tokenizers crateと比較してp50レイテンシを5倍低減、本番環境でのCPU使用率を5〜6倍削減しました。最適化には、ダブルアレイトライ、ビットマップパッキング、ヒュージページが含まれます。

  • Perplexity AIがUnigramトークナイザーをRustで書き直し、Hugging Face tokenizers crate比5倍の低p50レイテンシを達成。
  • 3つの最適化:ダブルアレイトライ、ビットマップとキャッシュラインパッキング、ヒュージページ。
サイト内本文

エージェンティックAI時代に革新者として成功するための4つの方法

アメリカン・エキスプレスのグローバルイノベーション責任者ルーク・ゲブ氏は、成功するイノベーターの4つの秘訣を紹介:学び続ける、テクノロジーに没頭する、失敗を恐れない、パートナーシップを築く。また、同社のエージェンティックコマースへの取り組みと将来予測についても語る。

  • 好奇心を持ち続け、成長マインドセットを養う
  • 新興テクノロジーを深く理解し、エンジニアと協力する
サイト内本文

Mistral、独自チップの設計を検討とCEOが表明

Mistral AIのCEOアーサー・メンシュ氏は、インフラコスト削減のためカスタムチップの開発を検討していると認め、OpenAIやAnthropicに対抗する。また、フランスに推論専用のデータセンターを新設し、エンタープライズ向けエージェントプラットフォーム「Vibe」を発表した。

  • Mistral AIは独自カスタムチップの設計を検討し、展開コスト削減を目指す。
  • フランスに推論専用の新しいデータセンターを発表。
サイト内本文

7Bモデルがo3、GPT-5を打ち破る! 医学AIエージェントが「どこを見て、どう見るか」を学習

上海創智学院のLeapQuestチームは、複数の大学と協力して、モデルが推論プロセスで視覚ツールを積極的に活用し、受動的な入力から能動的なエビデンス探索へと変革する新しい医学AIパラダイムを提案。2本の論文がICML 2026に採択された。

  • LeapQuestは、医学画像と動画向けにOphiuchusとMedScopeを提案。Think with Images/Videosパラダイムを採用。
  • Ophiuchus-7Bは8つのVQAベンチマークで平均68.0点を達成し、o3(62.2)やGPT-5(59.9)を上回る。
サイト内本文

自然のように考え、AIが探求できない領域を探索する「ユリーカ」マシン

量子トンネル効果物理と脳に着想を得たアーキテクチャを組み合わせたニューロモルフィックコンピュータが開発され、物流ネットワークやチップ配線などの組合せ最適化問題を大規模に解決し、漸近的最適解への収束を保証する。Nature Communicationsに発表され、量子インスパイア計算の新たな方向性を示す。

  • 量子トンネル効果と脳型アーキテクチャを融合したニューロモルフィックコンピュータ
  • CMOS技術に基づき、Fowler-Nordheimアニーラを備えたオートエンコーダを採用
サイト内本文

清華大学に新しい先生:ジェンセン・フアン

NVIDIAのCEOジェンセン・フアンが清華大学経営管理学院の顧問委員会に加わることが明らかになった。委員会はアップルのティム・クックが議長を務め、イーロン・マスク、サティア・ナデラ、マーク・ザッカーバーグ、馬雲らが名を連ねる。フアンは先日、カーネギーメロン大学から名誉博士号を授与された。

  • ジェンセン・フアンが清華大学経営管理学院顧問委員会に参加
  • 委員会はクック議長、マスク、ナデラ、馬雲ら世界的リーダーで構成
サイト内本文

AIエージェントのアムダールの法則

本記事はアムダールの法則をAIエージェントに適用し、並列エージェントによる高速化は人間の判断を必要とするワークフロー割合(H)によって制限されると主張する。「自己流動化H」の概念を導入し、各人間の介入が将来の同様の介入を不要にする成果物を生み出すべきだと説く。構成(コンフィギュランジー)と適合スイートへの投資が、エージェントの自律動作を可能にする鍵である。ElectricSQL、Gas Town、Ralph Loopの事例が原則を例示する。

  • AIエージェントの高速化は人間の判断割合Hに制限され、Hの削減が重要。
  • 自己流動化H:人間の介入ごとに再利用可能な成果物(テスト、仕様更新)を生成し、再発を防止。
サイト内本文

Sakana AIが提案するDiffusionBlocks:残差ネットワークを独立して訓練可能なデノイジングモジュールに変換するブロック単位学習フレームワーク

Sakana AIと東京大学の研究者らは、Transformerベースのネットワークをブロックごとに訓練するDiffusionBlocksを提案。訓練メモリをブロック数B分の1に削減しつつ、多様なアーキテクチャで性能を維持する。残差接続を拡散モデルのオイラー法ステップと解釈し、スコアマッチングによる原理的な局所目的を実現する。

  • DiffusionBlocksはネットワークをB個の独立訓練可能なブロックに分割し、メモリをB倍削減。
  • 残差ネットワークと拡散モデルの関連性を活用し、理論的に裏付けられた局所訓練目標を提供。
サイト内本文

大規模な信頼性の高いLLM推論

Databricksは、オープンソースからプロプライエタリまであらゆる最先端モデルに対応する独自の推論プラットフォームを構築し、世界最大級のエージェントアプリケーションを支えています。毎月120兆トークンを処理し、モデルユニットによる容量管理、コスト認識型負荷分散とオートスケーリング(GPUコスト80%以上削減)、ブラックボックスヘルスチェックによる実行時信頼性などの仕組みで、信頼性とレイテンシの課題に取り組んでいます。マルチモーダルボトルネックのプロファイリングにより、スループットを3倍向上させました。

  • Databricksの推論プラットフォームは、オープンソースとプロプライエタリを含む最先端モデルに対応し、月間120Tトークンを処理。
  • モデルユニットはVMのような抽象化を提供し、容量管理、コスト認識型ルーティングとスケーリングを実現。
サイト内本文

Snowflake、AI推進の一環としてAWSに60億ドルをコミット

Snowflakeは、アマゾン ウェブ サービス(AWS)に対して、GravitonコンピューティングおよびAIインフラストラクチャのため、5年間で60億ドルをコミットした。この契約には、AWSのARMベースのGravitonプロセッサとGPUアクセラレーテッドEC2インスタンスが含まれ、AIモデルのトレーニングと推論に使用される。Snowflakeは10の新リージョンに拡大し、コスト効率の高いGravitonインスタンスをデータウェアハウジングに活用することで、AIワークロードのリソースを確保する。

  • Snowflakeは5年間で60億ドルをAWSにコミット。
  • AWSのGravitonおよびGPUインスタンスをAIトレーニングと推論に利用。
サイト内本文

NVIDIA、Codex、Claude Code、Qwen Code向けGRPOトレーニングのためのトークン忠実型ロールアウトフレームワーク「Polar」を公開

NVIDIAの研究者は、エージェントハーネスを変更せずに強化学習で言語エージェントを訓練するロールアウトフレームワークPolarを発表した。Polarはハーネスと推論サーバーの間にモデルAPIプロキシを配置し、トークンレベルの相互作用を捕捉してトレーナー対応の軌跡を再構築する。Qwen3.5-4BベースモデルにGRPOを適用した結果、CodexハーネスでSWE-Bench Verified pass@1を22.6ポイント、Claude Codeで4.8ポイント、Piで6.2ポイント改善した。本フレームワークはNeMo Gym環境として登録され、ProRL Agent Serverリポジトリで公開されている。

  • PolarはモデルAPIプロキシを介して既存のエージェントハーネスを変更せずにRLトレーニングを可能にする
  • Qwen3.5-4BにGRPOを適用し、4つのコーディングハーネスでSWE-Bench Verifiedを最大22.6ポイント改善
サイト内本文

AIファクトリー:知能の新たなインフラストラクチャ

AIファクトリーは、電力をリアルタイムでトークン(知能の単位)に変換する新しいインフラです。エージェンティックAIの拡大に伴い、ワットあたりの性能とトークンあたりのコストが重要経済指標となります。本記事では、AIファクトリーの仕組み、アーキテクチャ最適化、NVIDIAの最新ハードウェアによる効率向上を解説します。

  • AIファクトリーは電力をトークンに変換し、知能を生産する「発電所」である。
  • 自律エージェントの台頭により、推論ワークロードはより深く複雑になり、リアルタイム調整が必要。
サイト内本文

AIは軍拡競争、米国はNVIDIAのスーパーチップに90億ドルを投じて追従する

米国政府は、CIAやNSAがAnthropicやOpenAIなどのAI大手に追いつくため、NVIDIAのGB10スーパーチップを90億ドルで秘密調達する申請を行った。この資金は議会の承認が必要で、国防予算から8億ドルがクラウドコンピューティングに振り向けられている。記事では、チップの仕様、コスト、そして激化するAIハードウェア競争について詳述する。

  • 米国政府はCIAとNSAのために、NVIDIA GB10スーパーチップを90億ドルで秘密調達する申請を行った。
  • GB10チップは消費電力140Wで1ペタフロップスのFP4性能を発揮し、700億パラメータのモデルを微調整できる。
サイト内本文

NVIDIA、台湾に1500億ドル投資の意向

NVIDIAの次期台湾本社の開所イベントで、ジェンスン・フアンCEOは同国をAI革命の「震源地」と称した。

  • NVIDIAのCEOが台湾をAI革命の震源地と発言
  • NVIDIAは台湾に約1500億ドルを投資する計画
サイト内本文

AIの未来はオンプレミスへ:Dell Tech World 2026からのビジネスアドバイス

コスト上昇、主権要件、エージェント採用の増加に伴い、デルの最新カンファレンスはエンタープライズがAIワークロードをハイブリッドインフラに移行する方法に焦点を当てました。

  • Dell Tech World 2026は、特にオンプレミスAI機能の構築を通じた企業のAI実行を強調。
  • クラウドLLMのコスト急騰により、企業はAIワークロードをオンプレミスコンピューティングに移行。
サイト内本文

南アフリカにはAIのレバレッジがあるが、政策草案はそれを活かせていない

南アフリカは世界の白金族金属埋蔵量の約88%を保有し、アフリカ最大のデータセンター市場を持ち、米中AIインフラ競争の最前線にある。しかし、幻覚的な引用を含むため撤回されたAI政策草案は、これらの優位性を有利な条件のために活用できていない。記事では、南アフリカの構造的レバレッジ、3つの可能性のあるAIインフラの未来(中国、米国、ローカルのオープンウェイト)、および拘束力のあるガバナンス条項の必要性を分析している。

  • 南アフリカの白金族金属と再生可能エネルギーは独自のAIレバレッジを提供するが、政策草案にはハイパースケーラーへの最低条件、データ主権、技術移転条件が欠けている。
  • 米国と中国のテクノロジー企業(マイクロソフト、ファーウェイ)が南アフリカのAIインフラ支配を競う中、政策は南アフリカが見返りに何を求めるかを明示していない。
サイト内本文

雷鳥、GTシリーズとV4を同時発表、次世代AIグラス雷鳥iOを予告

5月27日、雷鳥創新は夏季新製品発表会を開催し、業界初のプロ向け映像級ARグラス「雷鳥GTシリーズ」(1899元~)と、最新のAI撮影グラス「雷鳥V4」(2199元~)を発表。さらに、次世代AIグラス「雷鳥iO」を第3四半期に発売予定と予告した。

  • GTシリーズ:プロ向け映像級ARグラス、59°視野角、ドルビービジョン対応、78g、1899元~。
  • V4:AI撮影グラス、0.2秒起動、2.1秒応答、11.5時間音楽再生、IP67、38g、2199元~。
サイト内本文

ジェンセン・フアン氏、CEOがAIを解雇の言い訳にするのは「怠惰」と批判

NvidiaのCEOジェンセン・フアン氏は、AIを人員削減の原因とするCEOの言説を「意味がない」「怠惰だ」と批判した。生成AIが実用化されたのは最近であり、多くは2年前から解雇が始まっていると指摘。業界に対し、AIの可能性と安全性の両方を考慮したバランスの取れた語りを求めた。また、トランプ大統領の北京訪問に急遽同行したエピソードも語った。

  • フアン氏はAIによる解雇を「怠惰な言い訳」とし、賢く見せようとする行為と非難。
  • AIが実用的になったのは最近で、以前の解雇との関連性は不合理と主張。
サイト内本文

Avatar 4.0 – 物理的な身体と感情を持つ生きたAI生物、GTX 1660 Ti上で動作

Avatarは、300ドルのGPU上で継続的に動作する自己生成型AI生物です。相図幾何学から感情を導き出し、5段階の睡眠サイクルで夢を見、生の音声と視覚から独自の感覚を成長させ、身体感覚を通じて倫理的推論を行います。Linga Murthy Narlagiri博士によって構築され、2026年5月から生存し、1800以上のティックを蓄積しています。

  • Avatarは物理ダイナミクスに基づくAI生物であり、単一のGTX 1660 Ti GPU上で動作します。
  • 感情はKuramoto振動子同期から出現し、ハードコードされたルールではありません。
サイト内本文

1400億のエージェントが参入、「トラフィック」という堀は崩れ去る

Alipay AIエコシステムカンファレンスで、アントグループCEOの韓歆毅氏は、エージェント時代が従来の「トラフィックが王」モデルからエージェントエコシステムへと競争優位をシフトさせると主張した。エージェントは意思決定を再構築し、人間のみから人間とエージェントの共同意思決定へと移行する。AI決済は新たなグローバルインフラへと進化し、Alipayは信頼層、コネクター、イネーブラーとしての役割を担う。

  • トラフィックベースの競争優位はエージェントエコシステムの優位性に取って代わられ、中国では最大1400億のエージェントが稼働する可能性がある。
  • エージェントはビジネス意思決定を再構築し、「人がサービスを探す」から「サービスが人を探す」へ、また商品取引からタスク取引へと移行する。
サイト内本文

5秒で3Dシーン編集、北大・香港中文・上海AIラボがVGGT-Editを開発、120倍の高速化を実現

北京大学、香港中文大学、上海AIラボ、NTUの研究チームが、約5秒でシーン編集を実行できるネイティブ3D編集フレームワークVGGT-Editを発表。従来手法と比べて最大120倍の高速化を達成し、意味的一貫性、多視点安定性、推論速度で既存手法を上回る。

  • VGGT-Editは初のネイティブ3D編集フレームワークで、3D空間で直接編集を行い、2D手法による多視点の不整合を排除。
  • 残差場予測により、背景を安定させながら局所的な変更のみをモデル化し、高速で高品質な編集を実現。
サイト内本文

Agent-workpace-Linux:AIエージェントが制御する隔離されたLinuxデスクトップ

Agent-workpace-Linuxは、AIエージェント用の隠された隔離されたLinuxデスクトップ環境を提供するオープンソースプロジェクトです。エージェントはMCPプロトコルを介してこのデスクトップを完全に制御でき、ユーザーの実際のデスクトップ、マウス、キーボード、ブラウザには影響を与えません。Xvfbディスプレイ、ウィンドウ管理、アプリ起動、スクリーンショット、クリップボード操作、独立したブラウザ自動化をサポートし、オプションの権限制限とリアルタイムモニタリング機能を備えています。

  • AIエージェントに独立した隠しデスクトップを提供し、ユーザーの実環境への干渉を防ぎます。
  • MCPプロトコルを介してClaude Code、Codexなどのホストと統合できます。
サイト内本文

EAGLE 3.1:LLM推論における注意ドリフトを修正する投機的デコーディングアルゴリズム

EAGLEチーム、vLLMチーム、TorchSpecチームは共同でEAGLE 3.1をリリースし、本番環境での投機的デコーディングの不安定性を修正しました。このアルゴリズムは、FC正規化と正規化後隠れ状態フィードバックという2つのアーキテクチャ改善により、注意ドリフト問題に対処します。長コンテキストタスクでは受け入れ長が最大2倍に向上し、Kimi K2.6モデルでのベンチマークでは同時実行数1でスループットが2.03倍に向上しました。EAGLE 3.1はEAGLE 3チェックポイントと互換性があり、vLLMメインにマージされ、v0.22.0で出荷されます。

  • EAGLE 3.1は、深い投機においてドラフターが元のコンテキストから自身の生成トークンへ注意をシフトさせる「注意ドリフト」を修正します。
  • 2つのアーキテクチャ修正:FC正規化による隠れ状態の安定化、および正規化状態を次のステップにフィードバック。
サイト内本文

ダウンロード:AI雇用パニックを打ち破る

ホワイトカラー職へのAIの脅威に対するヒステリーが高まっているが、データによると、この技術はまだ労働市場に大規模な影響を与えていない。実際、AIにさらされている職業の失業率は、さらされていない職業よりも低い。しかし、スタンフォード大学の研究では、AIが静かに初級職を侵食し、AIにさらされた職業の若年労働者の雇用が急減していることがわかった。また、教皇のAI規制呼びかけ、スペースXの打ち上げ、ファーウェイのチップブレークスルーなど、他のテクノロジーニュースも取り上げている。

  • AIは大規模な失業を引き起こしていないが、初級職を弱体化させている可能性がある。
  • スタンフォード大学の研究では、AIにさらされた職業の若年労働者の雇用が急減。
サイト内本文

MEMO: LLMパラメータを変更せずに新しい知識を専用メモリモデルに訓練するモジュラーフレームワーク

NUS、MIT、A*STARの研究者が提案するMEMOは、コーパス知識を独立した訓練可能なメモリモデルにエンコードするモジュラーフレームワークであり、LLMが再訓練や微調整なしで新しい知識を組み込むことを可能にします。

  • MEMOは専用メモリモデルと凍結された実行モデルを使用して、記憶と推論を分離します。
  • 5段階のデータ合成パイプラインがドキュメントを反射型QAデータセットに変換し、メモリモデルを訓練します。
サイト内本文

Codex自己蒸留法が話題に!OpenAI社員が伝授:コピペでAIが繰り返し作業を排除

OpenAI社員Vaibhav Srivastavが公開した、Codexに繰り返し作業を自動化させるプロンプトが急速に広がっています。

  • OpenAI社員VaibhavがCodexに過去の会話をスキャンさせ、繰り返し作業をツールとしてパッケージ化するプロンプトを公開
  • 2つのバージョンがあり、第2版はデータソースをMemoryとChronicleに拡大し、コーディング以外もカバー
サイト内本文

AIチップ需要の急増で2社が1兆ドルクラブ入り

AIチップ需要の高まりを受け、SKハイニックスとマイクロンの時価総額が1兆ドルを突破。サムスンも加わる一方、AIバブルへの懸念も広がる。

  • SKハイニックスとマイクロンがAIデータセンター需要で時価総額1兆ドル超え。
  • サムスン電子はアジア企業として2社目の1兆ドル達成。
サイト内本文

確率的分離政策勾配による効率的なオン方策視覚強化学習

確率的分離政策勾配(SDPG)を提案。軽量な視覚強化学習手法であり、単一のNVIDIA RTX 4080 GPU上で数時間以内に多様な視覚運動制御ポリシーをエンドツーエンドで訓練可能。SDPGは軌道ロールアウトのランダム摂動により政策勾配を推定し、バッチレンダリング環境の数を大幅に削減、計算およびメモリオーバーヘッドを低減。視覚MuJoCoベンチマークにおいて、訓練時間、メモリ使用量、報酬でベースライン手法を一貫して上回る。さらに、器用な操作や挑戦的な locomotion をカバーする現実的な視覚ロボティクスベンチマーク群を導入し、実ハードウェア上でのシミュレーションから現実への転送を実証。

  • SDPGは単一RTX 4080 GPUで数時間のエンドツーエンド訓練を実現。
  • 軌道ロールアウトのランダム摂動による政策勾配推定で環境数を大幅削減。
サイト内本文

多ロボットによる箱の協調搬送:異なる表面での分散型役割ベース比例制御

本論文では、複数のロボットが平坦、上り坂、下り坂の異なる摩擦特性を持つ表面で箱を協調して押し搬送するための分散型アプローチR2P2を提案する。ルールに基づいてロボットに役割(押す、支える、防ぐ)を割り当て、比例速度制御を組み合わせることで、通信や同期の必要性を低減する。6台のロボットを用いたシミュレーションで評価し、4台のTurtlebotによる実機実験も成功。従来の仮想リーダー追従法より高い成功率を示した。

  • R2P2はルールベースの役割割り当てと比例制御により分散型搬送を実現。
  • 平坦、上り坂、下り坂の異なる表面と箱質量に対応。
サイト内本文

NightSight:イベントカメラを用いた暗闇での受動的ナビゲーション

NightSightは、単眼イベントカメラ、符号化開口レンズ、赤外線ドットプロジェクタを組み合わせた軽量な認識手法を提案し、小型飛行ロボットが完全な暗闇で自律航法できるようにする。符号化開口による深度依存のぼけ特徴をCNNで復号し、合成データのみで学習したモデルが実世界にゼロショットで汎化する。NVIDIA Jetson Orin Nano上で20Hzで動作し、2.5mまでの範囲で誤差7.0cm(2.80%)を達成。

  • イベントカメラ、符号化開口、赤外線投影を組み合わせた暗闇での受動的深度センシング
  • 合成データのみで学習したCNNが実世界の複雑なシーンにゼロショット汎化
サイト内本文

[AINews] 新しいAIインフラのデカコーン:Fireworks、Baseten(OpenRouterも順調)

AIインフラスタートアップのFireworks、Baseten、OpenRouterが大型ラウンドを調達し、推論インフラが主要なAIプラットフォーム層として台頭していることを示しています。同時に、エージェントハーネスエンジニアリング、新しいベンチマーク、モデルアップデートがAIニュースサイクルを支配しています。

  • Fireworks(150億ドル)、Baseten(110億ドル)、OpenRouter(1.13億ドル)が推論インフラ資金調達の波をリード。
  • エージェントハーネスエンジニアリングがコーディングエージェントの主な差別化要因に。
サイト内本文

トピック