AI News HubLIVE
公開記事 39収集記事 40信頼度 82更新頻度 720 分
稼働状態 正常ソース種別 研究全文利用権限 サイト内リライト最終取り込み 2026-06-26ID the-sequence状態 有効

AI research and engineering newsletter; summary-only unless authorization is obtained.

最新公開記事

セルフドライビングラボ:次の実験を選択する研究室

セルフドライビングラボは、AIと自動化された実験装置を組み合わせ、実験結果に基づいてシステム自身が次の実験を自律的に選択する。単なる自動化とは異なり、学習しながら方向性を調整する。

  • セルフドライビングラボはAIと自動化機器を連携させ、実験のループを自律化する。
  • 自動化がスクリプト実行であるのに対し、自律性はリアルタイムの結果に基づいて意思決定を行う。
サイト内本文

AI週間第883回:Qwenがロボティクスに進出

アリババのQwenモデルファミリーがロボットスイートを発表。知覚と行動のギャップを埋める3つの新モデルを提供し、物理動作のトークン化が鍵とされる。

  • Qwenモデルはこれまでソフトウェア内に閉じられ、物理的操作ができなかった。
  • アリババがQwen-Robot Suiteを発表。3つの専用モデルを含む。
サイト内本文

シークエンス知識#882:蒸留に関する新しいシリーズ

現代AIで最も重要な技術の一つである蒸留と、それが大規模モデルのコスト、展開、専門化の課題にどのように対処するかについての深掘り。

  • 蒸留技術はAIモデルをより効率的で展開可能にし、規模によって生じる課題に対処する。
  • 規模はAIの進歩を促進したが、高価で遅く、専門化が難しいモデルをもたらした。
サイト内本文

The Sequence Special #881:AIモデルのサッカーワールドカップ

LayerLens は Stratix Cup を開始。トップAIモデルがシミュレーション環境でエージェントとしてサッカー対決し、計画、適応、マルチエージェント連携をテストする。

  • LayerLens が Stratix Cup を発表。AIモデルのサッカートーナメント。
  • 競技はエージェント能力をテスト:試合前戦略、リアルタイムプレイ、ハーフタイム適応。
サイト内本文

シークエンスレーダー #880: 先週のAIニュース——600億ドルのCursor契約、Googleの人材流出、Midjourneyのボディスキャナー

AI市場における予想外の展開が相次いだ一週間:SpaceXが600億ドルでCursorを買収、主要研究者がGoogleを離れ、Midjourneyが全身医用スキャナーを発表。

  • 1. SpaceXが600億ドルの株式でCursorを買収、AIツールがロケット打ち上げ能力と同等の戦略的インフラに。
  • 2. Noam ShazeerとJohn JumperがGoogleを去り、AIフロンティアにおける人材獲得競争の激化を浮き彫りに。
サイト内本文

今週のAIシーケンス #878: Google DeepMind、次トークン生成における初の本格的な突破口

Google DeepMindがDiffusionGemmaをリリース。これは、従来のTransformerアーキテクチャに挑戦するテキスト拡散モデルであり、左から右へ逐次的にトークンを生成する方法に依存しない。

  • DiffusionGemmaはGoogle DeepMindによるテキスト拡散モデル。
  • 従来のTransformerアーキテクチャに挑戦する。
サイト内本文

シーケンス知識 #878:Transformerを超えて:学んだこと

本記事はTransformerの代替アーキテクチャに関するシリーズの要約であり、4つのファミリー(回帰/線形回帰モデル、状態空間モデル、テキスト拡散モデル、液体/連続時間モデル)をカバーします。また、知識蒸留に関する新シリーズの開始を発表します。

  • 自己注意機構は長いシーケンスに対して二次計算量とメモリコストがかかる。
  • 4つの代替方向:回帰(定数メモリ)、状態空間(線形スケーリング)、テキスト拡散(並列生成)、液体(連続時間ダイナミクス)。
サイト内本文

The Sequence Radar #877: 先週のAI — Anthropic出荷、Apple借用、Musk上場、Bezos構築

先週のAI業界は大きな動きがあった。AnthropicがClaude Fable 5とMythos 5を発表、AppleがSiri AIを公開、SpaceXが史上最大のIPOを実施、BezosのPrometheusが120億ドルを調達。これらの出来事は、AIがチャットウィンドウを超えて拡大していることを示している。

  • AnthropicがClaude Fable 5とMythos 5をリリース、能力とアクセスを分離
  • Appleが1.2兆パラメータのGeminiモデルを搭載したSiri AIを発表、個人コンテキストを活用
サイト内本文

The Sequence意見:記録システム対行動システム

エージェント時代の新しいビジネスソフトウェアパラダイム。

  • 従来のエンタープライズソフトウェアは人間をアクターとしていた。
  • エージェントAIは記録システムから行動システムへ焦点を移す。
サイト内本文

今週のAIシーケンス #875: なぜ言語モデルには昼寝が必要なのか

論文「言語モデルには睡眠が必要」は、LLMが訓練後に学習できなくなる「前向性健忘」に悩まされていると指摘し、記憶を定着させるための睡眠のようなメカニズムを提案している。

  • LLMは事前学習後は静的で、新しい知識を学習できない。
  • 前向性健忘を抱え、長期記憶が形成されない。
サイト内本文

シーケンス知識#874:トランスフォーマー、それともそうでない?

トランスフォーマーアーキテクチャは、現在AIの参照アーキテクチャであり、そのスケーラビリティから産業標準となっていますが、アテンション機構の計算コストが高くつきます。この記事では、トランスフォーマーが最終的なアーキテクチャなのか、それとも最初の真にスケーラブルなアーキテクチャに過ぎないのかを探ります。

  • トランスフォーマーの強みはアテンション機構で、多様なデータタイプに対応可能。
  • アテンションは計算コストが高く、シーケンス長が長くなるとスケーラビリティが低下。
サイト内本文

シーケンスレーダー#873:先週のAI:サッカー、S-1、スーパーモデル

新しいAIサッカートーナメント、主要モデルのリリース、資金調達、AnthropicのS-1。

  • LayerLensがStratix Cupを発表。最先端AIモデルが参加するシミュレーションサッカートーナメント。
  • MicrosoftがBuildで新しいMAIモデル群を公開。AIがオペレーティングシステムへと変化。
サイト内本文

ザ・シーケンス オピニオン第872号:ケーキは戦場—誰が本当にAIスタックを支配するのか

エヌビディアのジェンスン・フアンはAIスタックを5層のケーキとして描き、調和を強調する。しかし戦略家の目には、それは5つの利益プールの垂直戦争に映る。真の支配は、希少層とその隣接する「継ぎ目」を所有することにかかっている。

  • フアンのAIケーキ図はチップベンダーの視点から調和を示している。
  • 戦略的には、AIスタックは各層がコモディティ化の脅威にさらされる戦場である。
サイト内本文

週刊AI #871:Claude Opus 4.8の内部ループ

Claude Opus 4.8は2026年5月28日にリリースされました。バージョン番号の小幅な増加にもかかわらず、信頼性において大きな進歩を遂げています。具体的には、キャリブレーションの改善によりコードの欠陥を検出する頻度が約4倍向上し、サイレントツール呼び出しのスキップを修正し、長期タスクのための圧縮リカバリを改善し、動的ワークフロー、適応的思考、そして4.7よりも2.5倍高速で3倍安価な高速モードを備えています。このリリースは、ベンチマークスコアではなく、エージェントの信頼性に焦点を当てており、プロダクション環境でのエージェントループに重要なアップデートです。

  • Claude Opus 4.8はキャリブレーションと正直性を改善し、モデルが自身のコードの欠陥を見逃す頻度を約4倍削減。
  • サイレントツール呼び出しのスキップを修正し、圧縮リカバリを改善して長期実行の信頼性を向上。
サイト内本文

シークエンス・ナレッジ #870:リキッドモデルとポストTransformerアーキテクチャの探求

本稿ではTransformerアーキテクチャの限界と、低レイテンシ・プライベートなオンデバイス知能に向けた液体モデルの可能性について考察する。

  • Transformerのグローバルアテンションは推論時のメモリと計算コストが高い。
  • 液体モデルは動力学を用いてアテンションを代替し、リアルタイム・エッジ向けの効率性を提供する。
サイト内本文

The Sequence Radar #869:先週のAI:トークンが会計単位になる——Opus 4.8、OpenRouter、Cognition、Snowflake、そして教皇の警告

AnthropicがClaude Opus 4.8をリリース、営業利益に近づく;OpenRouterやCognitionが大型調達;SnowflakeがAWSと60億ドル契約;教皇レオ14世がAIのリスクを警告。業界はモデル中心の競争からトークン単位の経済へ移行している。

  • AnthropicのClaude Opus 4.8はコーディングと推論で小幅な改善、エフォートコントロールや動的ワークフローを導入。
  • OpenRouterが1億1300万ドル調達、週間処理量25兆トークン;Cognitionが10億ドル調達、Devinが社内コードの89%を記述。
サイト内本文

シーケンス意見番号868:再帰が新しいスケーリング則である

現代のAI時代のほとんどにおいて、スケーリング則が進歩を推進してきたが、今や再帰——モデルやシステムが再検討、修正、探索、シミュレーションする能力——が新たな拡張次元になりつつある。この変化は、単一の前方伝播から反復計算へのパラダイムシフトを示している。

  • 従来のAIの進歩は大規模モデルとデータに依存していたが、再帰が新たな最前線として浮上している。
  • 再帰により、モデルは一回限りの出力ではなく、反復的に回答を改善できる。
サイト内本文

AIシーケンス第867週:ラテント思考——サピエントのHRM-Textがチェーン・オブ・ソートに静かに反駁する理由

本記事は、LLMにおけるチェーン・オブ・ソート(CoT)推論を非効率だと批判する。推論が残差ストリームを離れ、離散トークンになることを強制するためだ。サピエント・インテリジェンスのHRM-Textは、潜在空間で推論を行うことでこの問題に対処し、固定深度のトランスフォーマーに可変の内部深度を提供し、現在の推論パラダイムに挑戦する。

  • チェーン・オブ・ソート(CoT)は真の推論ではなく、モデルが出力トークンから「深さを借りる」回避策である。
  • サピエント・インテリジェンスのHRM-Textは、トークンストリームではなく潜在空間で推論を行う。
サイト内本文

シークエンスナレッジ #866: 知っておくべき3つのテキスト拡散モデル

テキスト拡散モデルは、自己回帰型のパラダイムに挑戦し、ノイズから繰り返しノイズ除去することでテキストを生成し、生成をタイピングではなく編集として捉えます。この分野を定義する3つの主要システム:LLaDA(スケーリングの証明)、Mercury(商用速度の優位性)、Gemini Diffusion(フロンティア検証)があり、新しいアーキテクチャクラスの3つのフェーズ(科学的証明、産業展開、フロンティア検証)を代表しています。

  • テキスト拡散モデルはノイズからの繰り返し精錬によりテキストを生成し、双方向コンテキストを利用します。
  • LLaDAは拡散モデルが大規模言語モデルに拡張可能であることを証明しました。
サイト内本文

The Sequence Radar #865:先週のAI:Karpathy、Google、Colossus、そして迫るIPOの波

先週のAI業界は大きな転換点を迎えた:GoogleがGemini Omniとエージェント優先プラットフォームを発表、Andrej KarpathyがAnthropicに加入しClaudeを活用した事前学習の加速に着手、AnthropicはxAIのColossusと450億ドルの計算リース契約を締結、CerebrasのIPOで時価総額約950億ドルに、SpaceX、OpenAI、Anthropicが今後6ヶ月以内に上場を計画し、総評価額は3兆ドルを超える可能性がある。また、HRM-Text効率的事前学習、AIレビュアーの評価、NVIDIAの統合AR-拡散モデルなど、複数の最先端研究が発表された。

  • Google I/OでGemini Omniマルチモーダルモデルとエージェント優先プラットフォームAntigravityを発表、TPU 8iで垂直統合を実現。
  • Andrej KarpathyがAnthropicに加入し、Claudeを使って事前学習を加速するチームを結成、自己改善サイクルの実質的な進展を示す。
サイト内本文

ザ・シーケンス・オピニオン #864: すべてのAIエージェントにはコンピュータが必要

AIエージェントの次フェーズは、より優れたモデルだけでなく、ファイルシステム、ターミナル、ブラウザなどへのアクセスによって定義される。エージェント用サンドボックスの市場が台頭している。

  • AIエージェントにはファイルシステム、ターミナル、ネットワーク等の実実行環境が必要。
  • トークンを出力するだけのエージェントは「瓶の中の脳」であり、行動力がない。
サイト内本文

今週のAIシーケンス第863号:モデルがインターフェース:シンキングマシンズのインタラクティブモデル内部

シンキングマシンズのインタラクティブモデルは、リアルタイムの会話、視覚、音声、ツール使用を一つの継続的な学習システムに統合します。

  • シンキングマシンズは、複数のモダリティをリアルタイムで統合するインタラクティブモデルを発表。
  • 現在のテキストベースのLLMパラダイムではリアルタイムコラボレーションに不十分。
サイト内本文

シーケンスナレッジ第862号:テキスト拡散モデルについて学ぶ

テキスト拡散モデルは、生成ドリフトや反転の呪いなどの限界を克服し、言語生成における自己回帰型トランスフォーマーモデルに代わる信頼できる選択肢として浮上しています。

  • 拡散モデルはビジュアルAIを支配しているが、テキストでは後回しにされてきた。
  • 自己回帰モデルには固有の欠陥がある:左から右への生成、グローバルな計画の欠如、エラーの連鎖。
サイト内本文

シーケンスレーダー #861:先週のAIニュース——IPO、対話型モデル、そして再帰的な夢

先週のAI業界では、CerebrasのIPOにより時価総額が約950億ドルに急騰、Thinking Machinesが対話をモデル自体に組み込んだ「インタラクションモデル」を公開、元SalesforceチーフサイエンティストのRichard Socherが自己改善型AIシステムを目指すRecursive Superintelligenceを立ち上げ、元AlibabaのQwen責任者である林俊陽氏が約20億ドルの評価額で新たなAIラボを設立するなど、重要な動きがあった。

  • CerebrasのIPOは初日で68%上昇し、時価総額約950億ドルに。AIハードウェアの重要性を再認識させる。
  • Thinking Machinesが「インタラクションモデル」の研究プレビューを公開。リアルタイムの協調をモデル自体に組み込んだ。
サイト内本文

ザ・シークエンス・オピニオン #860:すべての企業の最後の試験——実用的なAI評価についての考察

AIシステムがチャットボットからエージェントへと進化する中で、評価は計算能力、データ、モデルに並ぶ第4の柱になりつつある。各企業は汎用的なベンチマークではなく、自社のワークフローに合わせた動的な評価スイートを構築する必要がある。

  • 評価は現代AIの第4の柱になりつつある。
  • 企業は自社のワークフローに特化したプライベートな評価システムを必要とする。
サイト内本文

Sequence AI 今週の第859号:Claudeの心を英語で読む——自然言語オートエンコーダについてのノート

Anthropicの新しい自然言語オートエンコーダにより、研究者はLLMの活性化に対する直接的な英語の説明を得ることができ、解釈可能性における重要な一歩となります。

  • Anthropicは、LLMの活性化に対する教師なしの英語説明を生成する自然言語オートエンコーダ(NLA)を導入。
  • NLAにより、「何を考えている?」と尋ね、箇条書きの回答を得ることが可能に。
サイト内本文

シーケンス知識 #858:状態空間モデルはどのようにして好奇心から真剣なTransformerの競合へと変わったか

状態空間モデル(SSM)は、線形時間計算量と一定メモリを実現し、Transformerの支配的なパラダイムに挑戦しています。この記事では、SSMの数学的基盤、発展の経緯、および言語モデリングなどのタスクでの性能について概説します。

  • Transformerの自己注意機構はO(n²)の複雑さを持ち、超長コンテキストウィンドウの拡張を制限する。
  • 状態空間モデルは線形複雑度、KVキャッシュ不要、推論時のメモリ定数を提供する。
サイト内本文

シーケンスレーダー #857:今週のAI:マシンの内側、テキストボックスの外側

今週のAIは、科学化、製品化、投機化が同時に進む市場の様相を示した。Anthropicは自然言語オートエンコーダを発表し、モデルの内部状態を言語で解釈する新手法を提案。OpenAIは新しい音声モデルでAIをネイティブインターフェースへと押し上げる。SubQは1200万トークンのコンテキストウィンドウを主張し、RAGアーキテクチャに挑戦。DeepSeekやMoonshotなどの中国AIラボの評価額が急騰し、市場はAIを戦略的資産として捉えている。全体として、AIはモデル競争からインフラ競争へと移行している。

  • Anthropicの自然言語オートエンコーダは、モデルの活性化値を自然言語に圧縮し、解釈可能性の新たなパラダイムを開く
  • OpenAIの音声モデルは、AIをテキストインターフェースからリアルタイム音声エージェントへと進化させる
サイト内本文

The Sequence Opinion #856: エージェントのSalesforceはSalesforceではなく、エージェントのGoogleはGoogleではない

AIエージェントがソフトウェアを再構築し、エージェント経済の支配者は既存の巨人ではないと論じる。

  • 従来のソフトウェアは人間のユーザーを前提として構築されていた。
  • AIエージェントの登場により、ソフトウェアは機械ユーザー向けに設計される必要がある。
サイト内本文

The Sequence 今週のAI 第855回:Nemotron Omniの内部——NVIDIAがエージェント向けに開発した新しいマルチモーダル脳

NVIDIAのNemotron 3 Nano Omniは、ビデオ、オーディオ、画像、テキスト処理を単一の効率的なモデルに統合し、個別モデルのパイプラインによる損失を回避するマルチモーダル推論モデルです。

  • Nemotron 3 Nano Omniはビデオ、オーディオ、画像、テキストを一つのモデルに統合。
  • 個別のASR、VLM、OCRモデルによる断片的なパイプラインを置き換える設計。
サイト内本文

全ソース