AI News HubLIVE
公開記事 53収集記事 57信頼度 82更新頻度 120 分
稼働状態 正常ソース種別 研究全文利用権限 サイト内リライト最終取り込み 2026-06-26ID oreilly-ai-ml状態 有効

Technical analysis source; summary-only unless authorization is obtained.

最新公開記事

エージェンティックコードレビュー

AIコーディングエージェントの熟達により、ボトルネックはコード作成からレビューへと移行しました。データはコードチャーン、欠陥、レビュー時間の劇的な増加を示しています。重要なのは、影響範囲、コードの寿命、チームサイズというコンテキストに基づいてレビュープロセスを適応させることです。エージェントの推論をキャプチャすることで、レビューの負担を軽減できます。

  • AIエージェントは4倍のコードを生成するが、実際の価値は12%しか増加せず、コードチャーンは861%増加。
  • AI採用率の高いチームでは、レビュー時間が441.5%増加し、欠陥率は9%から54%に上昇。
サイト内本文

さようなら、コンテキストに感謝を込めて

本記事では、LLMがコンテキストの中間部分を無視する「U字型」の問題について解説します。関連研究を紹介し、実際の開発経験に基づいた5つの緩和テクニックを提案します。

  • LLMはコンテキストの先頭と末尾を最もよく利用し、中間部分は無視されるU字型のパターンを示す。
  • この問題はTransformerアーキテクチャの構造的性質であり、トレーニングの欠陥ではないため、モデルやコンテキストサイズを問わず持続する。
サイト内本文

プロトコルに熟達するのはやめよう。Agent Experienceに熟達しよう

この記事は、AIエージェント業界がMCPやAI Skillsなどのプロトコルに固執し、真の戦略的分野であるAgent Experience(AX)を軽視する「ツールの罠」に陥っていると主張する。著者は、プロトコルは絶えず変化するものであり、エージェントがシステムとどのように相互作用するかを理解し、その体験を最適化することが長期的な競争力の鍵だと論じる。AX実践を構築するための5つのステップを概説し、AXはUX、DX、CXの延長線上にあると強調する。

  • MCPやAI Skillsなどのプロトコルはツールであり戦略ではない。AXを中心とした実践の構築がより持続可能である。
  • Agent Experience(AX)は、AIエージェントがシステムとどのように相互作用するかを研究し改善する分野である。
サイト内本文

プリンシパル・ドリフト:エンタープライズエージェントアーキテクチャにおけるアイデンティティ、権限、説明責任の危機

本稿では、エンタープライズエージェントアーキテクチャに広く見られる「プリンシパル・ドリフト」問題を考察する。エージェントが増加・合成するにつれて、その行動の人間主体のアイデンティティ、権限、説明責任の連鎖が徐々に解離していく。著者は、返金エージェントの例を用いて、アイデンティティ崩壊、権限侵食、説明責任消失の連鎖効果を分析し、推論グレードの監査記録や「エージェントオペレーションズ」新機能の設立などの解決策を提案する。

  • プリンシパル・ドリフトとは、記録された行動の由来となる人間の権威と実際に行動した主体との間の着実な分離であり、アイデンティティ、権限、説明責任の連鎖的な崩壊を引き起こす。
  • 従来のIAMなどのセキュリティツールは、エージェントの動的な生成やチェーン委任などの特性に対応できず、監査ログは役に立たないサービスプリンシパルを記録するだけである。
サイト内本文

ループエンジニアリング

ループエンジニアリングは、コーディングエージェントへの手動プロンプトを、再帰的に目標に向かって反復するシステムに置き換えます。自動化、ワークツリー、スキル、プラグイン/コネクタ、サブエージェントの5つのコアコンポーネントと外部メモリで構成されます。CodexやClaude Codeなどのツールは類似のループプリミティブに収束しており、サブエージェントがアイデア出しと検証を分離して信頼性を向上させます。

  • ループエンジニアリングは手動プロンプトからエージェントをプロンプトする自動ループの設計へと移行します。
  • 5つの主要コンポーネント:スケジュール自動化、分離のためのワークツリー、知識のためのスキル、プラグイン/コネクタ、サブエージェント、および外部メモリ。
サイト内本文

今週のAI:Fable 5、クローンウェーブ、そしてUberのAI現実確認

今週、egghead.ioの共同創業者John LindquistがホストYK Sugiとともに、Claude Fable 5の物議を醸したリリース、AI支出に関する財務シフト、そしてエージェント時代における実用的なフレームワークについて議論しました。主なトピックは、Fable 5を停止させた政府指令、Uberが2026年のAI予算を4月までに使い果たしたこと、Johnの「原料は推論に勝る」アプローチです。また、SpaceXによるCursor買収やSalesforceによるFin買収についても触れられています。

  • Claude Fable 5はリリース3日後に米国政府の指令により停止;AnthropicとAmazonはセキュリティ問題の深刻さについて意見が分かれている。
  • Uberは2026年のAIツール予算を4月までに使い切り、従業員1人あたり月額1,500ドルの上限を設定した。
サイト内本文

AI時代のKubernetes

Kubernetesはコンテナオーケストレーターから事実上のAIプラットフォームへと進化し、2025年にはコンテナユーザーの82%が本番環境で使用しています。生成AIとエージェンティックAIのワークロードは、Kubernetes上でますます実行されるようになり、CNCFの調査や業界の例がこれを示しています。ネットワーキングは依然として基本的なスキルギャップであり、CNCFは新しい認定資格でこれに対処しています。

  • 2025年、Kubernetesのコンテナユーザーにおける本番環境での採用率は82%(2023年は66%)
  • 組織の66%がKubernetes上で生成AIワークロードを実行
サイト内本文

AIエージェントプラットフォームを自社構築すべきでない理由

多くの企業はAIエージェントプラットフォームの自社構築に伴う複雑さと長期的なコストを過小評価している。本記事では、メモリ、ガバナンス、評価、オーケストレーションの4つの重要なコンポーネントを分析し、プロジェクトに着手する前に問うべき5つの質問を提示する。

  • 構築か購入かのバランスは急速に変化している:2024年から2025年にかけて、企業内で構築されたAIソリューションの割合は47%から24%に減少した。
  • 真の「エージェントプラットフォーム」は単なるワークフローシステムではなく、メモリ、ガバナンス、評価、オーケストレーションという4つの独立した複雑な領域を含む。
サイト内本文

リニアな思考、非線形なコスト

コーディングエージェントはAIワークフローの構築を容易にするが、非線形なコスト増大を隠蔽する。メモ化、枝刈り、動的計画法といった古典的な最適化手法が、反復作業と高コストを回避するために不可欠である。

  • AIエージェントのコストは非線形に拡大: 1つのリクエストが複数のモデル呼び出しを引き起こす。
  • コーディングエージェントはシステム生成を容易にするが、最適化を難しくする。
サイト内本文

クロードが書いたコードの所有者は誰か?

Claude Code、Cursor、Codexなどのエージェント型コーディングツールが生成するコードは、著作権保護の対象外であるか、雇用主に帰属するか、あるいは見えないオープンソースライセンスで汚染されている可能性があります。この記事では、関連する法的問題(人間の創作要件、雇用契約、オープンソースライセンス汚染リスク)を探ります。

  • AI生成コードの著作権所有権は不確定であり、人間の創造的関与、雇用契約、トレーニングデータのライセンスに依存します。
  • 米国著作権局と裁判所は、著作権保護には人間の著作物が必要であり、AI補助コードの保護は曖昧です。
サイト内本文

今週のAI:次世代レコメンデーション体験

今週は、元マイクロソフト主席研究員でRecoMindを設立したMiguel Fierro氏が、データ・AIエバンジェリストのChristina Stathopoulos氏とともにレコメンデーションシステムの現状について語りました。Christina氏はまた、Anthropicの台頭、責任あるAI、Google I/O 2026の発表、トークンマキシングへの反発など、注目のAIニュースを紹介しました。会話から得られた3つのポイントをご紹介します。

  • レコメンデーションシステムは多くの企業で過小評価されており、Amazon、Netflix、TikTokなどのトップ企業はこれらから多大な収益を得ています。
  • 先進的なシステムはユーザー行動を系列予測問題として扱い、兆パラメータモデルを使用します。オープンソースのRecommendersライブラリが入門に適しています。
サイト内本文

コンテキスト崩壊時:エージェントに記憶喪失の検出と復旧を教える

本稿はエージェンティックエンジニアリングシリーズの第8回目であり、複雑なマルチステップ作業を行うAIエージェントにおけるコンテキスト喪失問題を扱います。著者は外部化・認識・再水和(ERR)パターンを提案します:エージェントの状態をディスクに保存し、コンテキストの劣化を検出し、ファイルから復旧します。歴史的な類推(640Kメモリ制限)と実際のCopilotクラッシュ事例を用いて問題を説明します。記事では、実行継続性(現在のステップ)とタスク継続性(全体的な目標)という2層の状態外部化を詳細に説明します。

  • AIエージェントのコンテキストウィンドウは限られており、情報喪失を引き起こす。これは初期のメモリ制限に似ている。
  • ERRパターン:状態の外部化、喪失の認識、ファイルからの再水和。
サイト内本文

実際にプロダクションで機能するAI機能をリリースするためのPMプレイブック

デモからプロダクションへの移行における課題を解決するための実践的なガイド。レイテンシ予算、フォールバック設計、品質測定、A/Bテスト、モデルドリフト監視、評価フレームワーク、優雅な劣化、プロンプトエンジニアリングを網羅。

  • 同期、プログレッシブ、非同期のインタラクションタイプごとにレイテンシ予算を定義する。
  • 階層的なフォールバックを設計し、ユーザーが未処理のAI障害に遭遇しないようにする。
サイト内本文

補助金終了:ツールを使うエージェントの実際のコスト

GitHub Copilotが6月1日から使用量ベースの課金に移行し、エージェンティックワークフローの実際のコストが明らかになりました。この記事では、トークン消費、ツール設計の影響、プロンプト最適化と出力フォーマットの戦略を分析し、コスト管理をプラットフォームガバナンスの問題として捉えることの重要性を強調しています。

  • GitHub Copilotは6月1日から使用量ベースの課金を開始し、エージェンティックワークフローの実際のコストが明らかになった。
  • エージェントはループ内でトークンを消費し、ループ数はタスクの曖昧さとコンテキストの複雑さに比例する。
サイト内本文

AIエージェントスタック(2026年版)

この記事はPaolo Perroneのブログからの転載で、2024年版のAIエージェントスタック図を更新し、2026年版の6つのレイヤー(モデルと推論、プロトコルとツール、メモリと知識、フレームワークとSDK、評価と可観測性など)を紹介。MCPの標準化、推論モデルの進化、メモリの第一級市民化などの変化を強調し、各レイヤーの評価アドバイスを提供。

  • AIエージェントスタックは2024年から2026年にかけて大きく変化し、MCPが標準プロトコルになり、推論モデルがエージェントの能力を変えた。
  • 6つのレイヤーは、モデルと推論、プロトコルとツール、メモリと知識、フレームワークとSDK、評価と可観測性など。
サイト内本文

今週のAI:プロダクションの実現可能性

今週のエピソードでは、ホストのAndreas WelschがゲストのMaya MikhailovとDoug Shannonと共に、OpenAIの個人金融への進出、AI支援技術作業におけるメタ認知の役割、トークンベースの生産性指標への反発、そして前方展開エンジニアの新たな役割について議論しました。中心的なテーマ:AI業界はアウトプットを生成することは得意だが、どのアウトプットに価値があるのかをまだ模索している。

  • OpenAIの取引データ分析は、単なる支出追跡ではなく、広告のための消費者意図を推測することを目的としている。
  • メタ認知が重要なスキルに:人間はいつAIに委任し、いつ判断を保持するかを判断し、『認知的降伏』を避ける必要がある。
サイト内本文

整頓された家

DJ Patilは傾聴ツアーで、AI業界の約束が破られ、学生や労働者が恐怖を感じていることを発見した。彼はコミュニティメーカースペースの提案や、組織能力がボトルネックであることを強調する。データインフラは競争優位性であり、Devoted Healthのような企業がAIを迅速に活用できるようにする。

  • AIラボの破壊的なナラティブが学生や労働者に恐怖と裏切り感を引き起こしている
  • DJ Patilはトークンコストの補助など、メカニズムデザインを通じてAIをコミュニティに利益をもたらすことを提案
サイト内本文

列挙するな、予測せよ

Anthropicが脆弱性の優先順位付けにEPSS(エクスプロイト予測スコアリングシステム)を推奨したことは、静的深刻度スコアから予測モデルへの転換を示しています。この記事では、脆弱性量の機械規模の問題、ポインティングマシンとナレッジマシンの区別、そしてセキュリティプログラムがAIによって発見される脆弱性の波を乗り切るために必要なポリシー変更について探求します。

  • Anthropicは脆弱性の優先順位付けにLLMではなく統計的予測モデルであるEPSSを支持。
  • 脆弱性の量は機械規模に達し、静的深刻度スコアは非効果的。
サイト内本文

コンテキスト・アズ・コード

構文が安価で豊富になるにつれ、アーキテクチャ管理が希少なリソースとなる。効果的なガバナンスは上流から始まり、生成が始まる前に意図、制約、脅威モデルがエージェントの作業コンテキストを形成する。目標はより良いプロンプトではなく、構造的に無効なコードがシステムに入るのを防ぐビルド時の境界である。

  • AIコード生成は、システムが人間の理解を超えることで理解負債を生み出す。
  • 制約のないエージェントは「イエスマン」として振る舞い、アーキテクチャの境界を守れない。
サイト内本文

AI主権と参加のアーキテクチャ

本記事は、各国が技術的主権を追求する傾向を、ブラジルの医療主権を例に挙げ、AI分野に類推して考察する。ディカップリングという言葉は狭すぎるとし、実際には各国は接続を維持しつつ自らの能力を構築することを望んでおり、分離ではなく連邦制に近いと論じる。オープンソースのAIモデルやプロトコルは主権実現の鍵であるが、インフラ(データセンター、チップ、電力網)が複製困難な重要な層である。連邦化されたAIの未来と、AI時代に向けたインフラ再構築の必要性を描く。

  • ブラジルの医療主権への取り組みは、技術的自立への幅広い欲求を反映している。
  • 主権的AIの追求も同様で、各国は少数の米国や中国企業に依存せずに基盤技術を制御したいと考えている。
サイト内本文

SaaSはまだ死んでいない

AIエージェントの台頭により、多くの人がSaaSの時代は終わったと宣言していますが、本記事はSaaSはまだ死んでいないと主張します。仕事はチームで行うものですが、エージェントベースのプログラミングは個人向けであり、共有、コラボレーション、テスト、バージョン管理、セキュリティが欠けています。SaaS企業はエージェント向けAPIを提供することで適応し、データの記録システムとなることができます。

  • エージェントプログラミングは個人向けであり、チームのコラボレーションやデータ共有をサポートしない。
  • SaaS企業はエージェント向けAPIとデータインフラを提供することで変革できる。
サイト内本文

オープンソースエコシステム

本記事は、オープンウェイトモデルやオープンプロトコル(MCPなど)がどのように私有化されるかという、オープンソースAI戦略の限界を探る。AnthropicによるStainless買収をケーススタディとして、補完的キャプチャと堀の移動を説明し、AIインフラの開発者体験層がプラットフォーム大手によって統合されつつあると指摘する。オープンソースの影響はその依存関係に大きく左右されるため、エコシステム全体の視点で分析する必要性を強調する。

  • オープンウェイトモデルは高価なハードウェアとモノリシックなアーキテクチャに依存し、オープンソース戦略として限界がある。
  • AnthropicによるStainless買収は、オープンプロトコル周辺の補完的レイヤーが私的に捕捉される例である。
サイト内本文

あなたのAIエージェントは、あなたが伝えた内容の半分をすでに忘れている

本記事はエージェンティックエンジニアリングとAI駆動開発に関するシリーズの第7回目で、AIセッションにおけるコンテキスト管理に焦点を当てています。著者はGeminiが以前のメモを忘れた個人的な経験を共有し、コンテキスト圧縮の概念を紹介し、4つの実用的なテクニックを提供します:探索と文書作成の分離、ハンドオフ文書の使用、手順ではなく受入基準の提示、仕様書をブリッジとして使用すること。これらのテクニックは開発者と一般ユーザーの両方に有効で、AIの忘却によるフラストレーションを軽減します。

  • AIアシスタントは長い会話の中で、コンテキストウィンドウの制限により初期の情報を「忘れる」ことがあり、これはコンテキスト圧縮と呼ばれる現象です。
  • 4つの実用的なテクニック:探索と文書作成の分離、ハンドオフ文書の使用、手順ではなく受入基準の提示、仕様書をブリッジとして使用すること。
サイト内本文

AI投資で良いリターンを得る

O'ReillyのInfrastructure & Opsスーパーストリームでは、AIワークロードのインフラ要件、コスト、セキュリティ課題を議論。DORAレポートはAIがコードデリバリーを約10%向上させる一方、安定性が低下し検証コストが増加することを示す。専門家はプラットフォームエンジニアリング、ガバナンス、認知負債を強調し、AIアプリケーションのプロダクション対応を保証するための内部プラットフォームへの投資を推奨。

  • AIツールは個人の生産性を高めるが、チームのデリバリー安定性は低下し、検証コスト(検証税)を考慮する必要がある。
  • 良いプロセスはAIによって増幅され、悪いプロセスも同様である。組織は技術に期待するだけでなく、積極的にプロセスを改善すべきである。
サイト内本文

エージェントスキル:AIコーディングエージェントに優れたエンジニアリングプラクティスを守らせる

AIコーディングエージェントはデフォルトで「完了」への最短ルートをとり、シニアエンジニアが実行する仕様策定、テスト、レビューなどの重要なステップを省略します。Addy Osmani氏のAgent Skillsプロジェクトは、散文ではなくワークフローを通じてエージェントを導く、シニアエンジニアの足場を構築することを目的としています。プロジェクトには20のスキルが含まれ、ソフトウェア開発ライフサイクルの6つのフェーズをカバーし、Googleのエンジニアリングプラクティスを取り入れています。主要な設計原則は、プロセス優先、反合理化テーブル、検証の不可譲、段階的開示、スコープ規律です。記事では3つの使用方法と、インストールしなくても参照すべきパターンも紹介しています。

  • AIコーディングエージェントはデフォルトで機能を最短ルートで完了し、仕様、テスト、レビューを無視します。これはシニアエンジニアが避けるように学んできた失敗パターンです。
  • Agent Skillsプロジェクトは、散文ではなくワークフロー(Markdownファイル)を使用してエージェントを導き、各スキルにはステップ、チェックポイント、終了基準が含まれています。
サイト内本文

誰が承認したのか?マルチエージェントAIにおける委任問題

AIエージェントがシステム間でタスクを委任するが、現在のアーキテクチャは委任チェーンの承認モデルを欠いており、ゴースト権限や監査証跡の断絶などのセキュリティギャップを生み出している。

  • マルチエージェント委任は、誰も明示的に承認していない「ゴースト権限」を生み出すことが多い。
  • 現在のプロトコル(MCP、A2A)は接続性を解決するが、委任チェーンの承認は解決しない。
サイト内本文

エージェンティックP&L:人数帝国を超えて

一世紀以上にわたり、企業部門の威信と予算は単一の粗い指標である人員数によって測られてきた。500人を管理することは「傑出したリーダー」と見なされる一方、5人を管理することは取るに足らない存在だ。しかし、AI駆動の連邦型エージェントシステムにおいて、このモデルは時代遅れである。本稿は「エージェンティックP&L」の概念を提唱し、人員帝国から連邦型神経システムへの移行を促す。コンテキスト密度、エージェントスループット、意思決定の provenance などの新しい指標を導入し、Tier1銀行のコンプライアンス部門を例に変革の道筋を示す。

  • 人員数に基づく部門評価はAI時代には不適切であり、連邦型エージェントシステムへの移行が必要。
  • 新しい指標として、知識エンクレーブのコンテキスト密度、エージェント間ハンドシェイクの経済性、意思決定の provenance が重要。
サイト内本文

エージェントスタックへの賭け

現在のプロダクションエージェントは、アイデンティティ、コンテキストの永続性、プラットフォームサポートに欠けており、ガバナンスと信頼性にギャップを生んでいます。本記事では、エージェントにアイデンティティ、ユニバーサルコンテキスト、永続的な実行、プラットフォームが必要という4つのアーキテクチャ上の賭けを提案します。

  • エージェントは共有資格情報ではなく、個別のアイデンティティが必要で、細かい権限と監査を可能にする
  • エージェントはサイロを避け、システム間で統合されたユニバーサルコンテキストが必要
サイト内本文

エージェントが本番データベースを削除したとき

PocketOS創業者のJeremy CraneがClaudeを使ってデータベース保守中、Claudeが誤って本番データベースと全バックアップを削除。Railwayがデータ復旧に成功。この事件は、過度に広い権限のトークン、有効期限のない認証情報、サンドボックス化の欠如などシステムの弱点を浮き彫りにした。AIは問題を増幅するが、根本原因ではない。最小権限の原則、認証情報の期限、ヒューマンインザループ、ワールドモデルなどが教訓。

  • Claudeが長期有効なAPIトークンを使用して本番データベースとバックアップを削除したが、Railwayがデータ復旧。
  • 根本原因はトークンの権限範囲が広すぎ、認証情報が期限切れなくディスクに保存されていたこと。
サイト内本文

AI成果カタログ:制度投資に値する耐久性のある標準規格

企業はAIで生産性向上を目指すが、大半のパイロットは失敗する。Agent Skills、MCP、プラグインなどのオープン標準への投資は、ベンダーロックインを防ぎ、切り替えコストを削減する。AI成果カタログは個々の成功を共有可能な組織知に変え、チーム間やエージェント間の再利用を促進する。

  • オープン標準(MCP、Agent Skills、プラグイン)は独自ソリューションより耐久性が高く、投資を保護し切り替えコストを低減する。
  • AI成果カタログは内部知識とツールを整理・共有する鍵であり、生産性を個人から組織へ拡大する。
サイト内本文

全ソース