AIエージェントに目を与えたが、まったく使わなかった
AIエージェントに視覚機能を与えても、実際には使わない可能性があることが実験で示された。Claude Haiku 4.5とGooseフレームワークを用いたテストでは、エージェントは視覚ではなくレイアウトを保持するテキストツールを使って複雑な表抽出タスクを成功させた。オープン標準AVPによる記録が、高価なモデルよりも粘り強さと適切なツールの重要性を明らかにした。
- 視覚機能を持つAIエージェントがそれを利用せず、レイアウト認識テキストツールで成功。
- 安価なモデル(Claude Haiku 4.5)が適切なハーネスとツールで高難度のPDF抽出タスクを達成。
AgentOps:Amazon Bedrock AgentCore を使用した大規模なエージェンティック AI の運用
エージェンティック AI ソリューションを構築する際、エージェントの予測不可能な意思決定、コストの予期せぬ上昇、非決定論的な障害のデバッグといった独自の運用上の課題に直面します。AgentOps は、本番環境で AI エージェントをデプロイ、管理、継続的に改善するための運用規律です。この記事では、Amazon Bedrock AgentCore を使用して AgentOps を実装する方法を紹介し、ガバナンスとセキュリティ、構築と運用、評価、可観測性の 4 つの柱について説明し、リファレンスアーキテクチャと実践ガイドを提供します。
- AgentOps は AI エージェント専用の運用規律であり、自律的な意思決定による課題に対応します。
- 4 つの柱には、ガバナンスとセキュリティ、構築と運用、評価、可観測性が含まれます。
AI主権と参加のアーキテクチャ
本記事は、各国が技術的主権を追求する傾向を、ブラジルの医療主権を例に挙げ、AI分野に類推して考察する。ディカップリングという言葉は狭すぎるとし、実際には各国は接続を維持しつつ自らの能力を構築することを望んでおり、分離ではなく連邦制に近いと論じる。オープンソースのAIモデルやプロトコルは主権実現の鍵であるが、インフラ(データセンター、チップ、電力網)が複製困難な重要な層である。連邦化されたAIの未来と、AI時代に向けたインフラ再構築の必要性を描く。
- ブラジルの医療主権への取り組みは、技術的自立への幅広い欲求を反映している。
- 主権的AIの追求も同様で、各国は少数の米国や中国企業に依存せずに基盤技術を制御したいと考えている。
Rippling、Deep AgentsとLangSmithで6ヶ月で全プロダクトにAIを導入
RipplingはLangChainのDeep AgentsとLangSmithを活用し、HR、IT、財務、給与、グローバルオペレーションにわたるクロスドメインAIを6ヶ月で本番運用。マルチエージェントアーキテクチャとコンテキストエンジニアリングで大規模オントロジー推論の課題を解決。
- Rippling AIはスーパーバイザーエージェントが5〜7の専門サブエージェント(読み取り、RAG、アクション)を調整するマルチエージェントシステム。
- コンテキストエンジニアリングには動的スキル注入、コード実行、変数ピン留め(REPL)を使用し、コンテキストサイズを100〜500倍削減。
Amazon Quick と時系列データベースの統合による市場インテリジェンス(MCP 活用)
本稿では、KDB-X MCP サーバーと Amazon Quick の統合を通じて、トレーダーやアナリストが自然言語で質問し、データセットから実用的な洞察を得る方法を解説します。この統合パターンは、金融市場分析、IoT センサーモニタリング、DevOps パフォーマンスダッシュボードなど、さまざまな領域に適用可能です。
- Amazon Quick が MCP を統合し、時系列データへの複雑なデータベースクエリを不要にします。
- KDB-X MCP サーバーを EC2 にデプロイし、Amazon Bedrock AgentCore Gateway で安全に接続します。
Geminiを使ってGoogle I/O 2026を構築した方法
Google社員がAIを駆使してGoogle I/O 2026をどのように制作したかを紹介。クラゲのプレショーから「TPUトレーニングデイ」フィルムまで、Geminiが今年のI/O実現にどう貢献したかをご覧ください。
- Google I/O 2026の制作では、Gemini、Nano Banana、LyriaなどのAIツールが広く活用されました。
- 人間の芸術性とAIを融合させ、短編映画、ビジュアルアイデンティティ、没入型体験を創出しました。
このコーディングエージェントはフィードバックを求めない——反復なしで出荷する
SkipLabsは、クローズドループのAIコーディングエージェント「Skipper」を発表した。自然言語の説明やOpenAPI仕様から、完全なバックエンドサービスを直接生成し、開発者の反復作業を不要にする。Skip言語由来のリアクティブランタイムで状態管理と並行処理を自動化し、AIコードが最も失敗しやすい領域に対処する。SkipperはAIモデルをコモディティとして扱い、デフォルトでClaude Opusを使用するが複数のモデルに対応する。今後の計画には、インクリメンタルTypeScript実装とインクリメンタル更新モードが含まれる。
- Skipperはクローズドループエージェントであり、説明から実行可能なバックエンドサービスを開発者の反復なしに生成する。
- リアクティブランタイムを使用して状態管理、キャッシュ無効化、並行処理を自動化し、AIコードの一般的な失敗を回避する。
Anthropic、SECにS-1草案を機密提出
Anthropicは米国証券取引委員会にS-1登録声明の草案を機密提出し、新規株式公開の可能性に備えました。市場状況やSEC審査に依存します。株式数や価格は未定です。
- Anthropicは2026年6月1日にSECへS-1草案を機密提出。
- IPOは任意であり、SEC審査と市場状況次第。
エージェント実行税:ブラウザ自動化における真のボトルネック
720回のブラウザエージェントタスクのベンチマークで、構造化出力の信頼性がエージェントAIのボトルネックであることが判明。Gemini 2.5 Flashは22.9%の実行税(無駄な推論呼び出しの割合)が発生したのに対し、Kimi K2.5はゼロ。この税はレイテンシ、コスト、失敗率を増幅させる。本レポートは信頼性調整済み精度とタスクあたりのコスト指標を導入する。
- エージェント実行税は構造化出力の失敗による無駄な推論を測定し、最悪モデルで22.9%、最良で0%。
- Gemini 2.5 Flashはタスクの86.7%で少なくとも1回のパース再試行が発生、Kimi K2.5は0%。