AI News HubLIVE

今日の必読ニュース

Agent

2026年6月:LangChainニュースレター — Fleetオンコールコパイロット、Deep Agentsルーブリックなど

LangSmithの新機能:アラートトリアージ用のFleetオンコールコパイロット、エージェントのコンピュータ使用、音声トレースデバッグ、実験ステータストラッキング。さらにDeep Agentsルーブリック、プログラムによるサブエージェント、新しいLangSmithデプロイメントコース、そしてシカゴ、ベルリン、ワシントンDC、ラスベガスでのイベント。

  • Fleet On-Call Copilot:コード、トレース、ランブックを活用してアラートをトリアージし、更新ドラフトを作成するプリビルドエージェントテンプレート。
  • コンピュータ使用:エージェントが隔離された仮想コンピュータを使用してコード、ファイル、認証API呼び出しを実行可能に。
サイト内本文

「倫理的なAI」に反対する

本稿は、Anthropic を中心とする「倫理的なAI」運動を批判する。その運動は、AI開発は止められないが方向づけは可能という未証明の仮定に基づいている。実際には、倫理的AIは認識論的衛生を再生せず、AIを人間らしい方向に導くこともなく、非倫理的AIの御用反対派として機能している。Jack Clark の世界構築物語を分析することで、著者は矛盾を露呈する:AIを減速できないと主張しながら、その結果を制御できると主張する。

  • 倫理的AIは「進歩は不可避だが誘導可能」という誤った前提に立つ。
  • Anthropic の物語はAI開発をSF的世界構築プロジェクトと捉え、AGIは不可避だが形作れると主張する。
サイト内本文

AI時代に向けた小売業の再配置

人工知能が小売業を急速に変革しているが、その変化は主に舞台裏で起こっている。メイシーズは「AIファースト」アプローチを採用し、パーソナライゼーション、検索、業務計画にインテリジェンスを組み込んでいる。Ask Macy'sのような会話型ショッピングアシスタントも導入。AIは人間の判断を補完する不可視の層と見なされている。

  • 小売業におけるAIの活用は、商品検索、在庫管理、コード開発などの裏方の意思決定プロセスに重点を置いている。
  • メイシーズは「AIファースト」アプローチを採用し、システムに直接インテリジェンスを埋め込むことで、ビジネスの意思決定を迅速化し、パーソナライズされた体験を提供している。
サイト内本文
モデル

銀行にチーフサイエンティストが必要な理由

プレム・ナタラジャン氏はアマゾンを離れ、キャピタル・ワンのチーフサイエンティストに就任。詐欺検出からエージェント型カスタマーサービスまで、大規模な実際の金融課題を解決するために深いAI研究を応用している。

  • キャピタル・ワンはAIを単なる導入技術ではなく、科学分野として扱っている。
  • クラウドファーストのインフラにより、大規模なAI研究が可能。
サイト内本文

DeepReinforce、Ornith-1.0を公開:独自のRLスキャフォールドを学習するオープンソースコーディングモデルファミリー

DeepReinforceは、Gemma 4とQwen 3.5をベースにしたオープンソースのコーディングモデルファミリーOrnith-1.0をリリースしました。固定のハーネスではなく、強化学習中にモデルが独自のスキャフォールドを学習します。397BフラッグシップモデルはSWE-Bench Verifiedで82.4を記録し、すべての重みはMITライセンスで提供されます。

  • Ornith-1.0は9B、31B、35B-MoE、397B-MoEの4サイズで提供され、Gemma 4とQwen 3.5をベースにMITライセンスで公開。
  • モデルは強化学習中に独自のスキャフォールドを学習し、ハーネスと解法を同時に最適化。
サイト内本文
ツール

AIが自ら生み出すエネルギー問題をどう解決できるか

データセンター企業の幹部は、AIが増大する電力需要を管理しつつ、エネルギー転換目標を支援できると述べています。

  • AIの急速な発展により電力需要が急増し、エネルギーシステムに負担がかかっている。
  • データセンター幹部は、AI自体がエネルギー使用を最適化し、再生可能エネルギーの統合を支援できると考える。
サイト内本文

Meta、エンジニアのAIトレーニング強制を撤回、個人の選択を尊重へ

Metaは当初7000人の従業員をApplied AIタスクフォースに強制配置したが、反発を受け、現在は個人の選択を尊重する方針に転換した。この背景には士気の低下と大規模レイオフがある。

  • Meta、7000人のエンジニアをAIトレーニングタスクフォースに強制配置
  • 内部メモで個人の選択を尊重すると発表
サイト内本文
チップ

AI経済の現状

過去12ヶ月間で生成AIエコノミーは1100億ドルの売上を生み出し、年換算では1750億ドルを超える。本レポートはボトムアップの重複排除手法により、消費者・企業のAI支出を初めて包括的に測定。AI収益がGPU投資を賄えるか、トークン価格下落が市場に与える影響などを分析する。

  • AIエコシステムは過去12ヶ月で1100億ドルの収益(重複排除後)、年換算で1750億ドルのペースで成長。これはモバイルやインターネットの波の3倍の速度。
  • 需要側の測定に焦点を当て、エンドカスタマーの支出のみをカウントする重複排除手法を採用。
サイト内本文

NVIDIA Blackwell で Amazon SageMaker AI のモデルトレーニングを最適化

この記事では、Amazon SageMaker AI でトレーニングジョブを構成して、AWS 上の Blackwell アーキテクチャを最大限に活用する方法を説明します。Blackwell の拡張メモリを活用するバッチサイズとシーケンス長の選択、モデルサイズ(1B~64B パラメータ)に適した精度形式の選択、アクティベーションチェックポイントの戦略的適用について学びます。最後に、トレーニング構成を調整し、P6-B200 インスタンスで分散トレーニングジョブを起動するための実用的なフレームワークを提供します。

  • Blackwell の拡張メモリにより、より大きなバッチサイズ、より長いシーケンス長、簡素化されたモデルシャーディングが可能になります。
  • アクティベーションチェックポイントは、大規模モデル(〜14B+ パラメータ)の安定したトレーニングの前提条件です。
サイト内本文
政策

誰も解決しようとしないAI記憶問題

長期間稼働するAIシステムにおけるコンテキストドリフトの問題を探り、LLM幻覚とアーキテクチャ幻覚を区別。コンテキストウィンドウやRAGでは記憶の整合性を保てないと論じ、抽出ガードレール付きの構造化記憶を解決策として提案する。

  • AIの記憶はモデルの限界ではなく、コンテキスト圧縮によって劣化する。
  • アーキテクチャ幻覚は自己フィードバックループによるコンテキストドリフトから生じる。
サイト内本文
その他の更新(10件)
Agent

Amazon SageMaker AI に SeedVR2 をデプロイして超解像を実現

この投稿では、SeedVR2 を Amazon SageMaker AI 上で使用して動画をアップスケーリングする方法を紹介します。ソリューションのアーキテクチャ、デプロイ手順、品質向上と処理効率を示すパフォーマンス比較について説明します。最後まで読めば、この超解像ソリューションを実装するための実践的な知識が得られます。

  • SeedVR2 は ByteDance のオープンソース動画復元モデルで、拡散モデルと GAN を組み合わせて効率的なアップスケーリングを実現します。
  • ソリューションはセキュリティ、ストレージ、SageMaker 処理パイプラインを含む3層の AWS アーキテクチャを採用しています。
サイト内本文

Amazon Bedrockを利用したAIエージェントによるセルフサービスAWS Health分析で実用的なヘルスインサイトを見つける

この投稿では、Model Context Protocol(MCP)を介して公開されたAIエージェントを使用してセルフサービスのヘルスイベント分析を提供する、オープンソースソリューションであるChaplin(Customer Health and Planned Lifecycle Intelligence Nexus)の構築方法を紹介します。

  • Chaplinは、MCPを介したAIエージェントを使用するセルフサービスAWS Healthイベント分析のためのオープンソースソリューションです。
  • TAMに依存するヘルスイベント解釈のボトルネックを解消します。
サイト内本文

AWSで最新のデータメッシュ戦略を用いたエージェンティックAIアプリケーションの構築

この記事では、AWS上でガバナンスが効いたサーバーレスデータメッシュを構築し、プロダクション環境のエージェンティックAIに必要な安全でスケーラブルなデータ基盤を提供する方法を紹介します。

  • エージェンティックAIでは、ツールの発見からクエリ実行までの各ステップで細粒度のアクセス制御が必要であり、従来のRAGガバナンスでは対応できません。
  • Amazon S3 Tables(Iceberg内蔵)とAWS Lake Formationにより、行/列/セルレベルのセキュリティを実現し、1秒あたりのトランザクション数が最大10倍向上します。
サイト内本文

OpenKnowledge:Obsidian/Notionに代わるオープンソースのAIネイティブツール

OpenKnowledgeは、オープンソースでAIネイティブなMarkdownエディター・ナレッジベースであり、ObsidianやNotionの代替を目指します。美しいリッチテキストエディターを提供し、内部はMarkdownで動作し、人間とAIエージェントの両方のために設計されています。機能には、共同編集、Gitバックアップの同期、エージェントネイティブスキル、Claude・Cursor・CodexとのMCP統合、ローカルファーストでプライバシー重視のアプローチが含まれます。v2.0のローンチ後24時間で1,400の新規登録を獲得し、Product Huntで1位、Hacker Newsのフロントページを獲得しました。

  • OpenKnowledgeは、オープンソースでAIネイティブなMarkdownエディター・ナレッジベースです。
  • Markdownベースのリッチテキストエディターを備え、人間とAIエージェントの協働を想定。
サイト内本文

Tabularis:AIエージェントも使用可能なオープンソースデスクトップSQLクライアント

Tabularis は、AIエージェントと人間ユーザーの両方を考慮して設計されたオープンソースのデスクトップデータベースクライアントです。内蔵MCPサーバーによりAIエージェントが安全にスキーマを検査しクエリを実行でき、さらにMonaco SQLエディタ、ノートブック、ビジュアルクエリビルダーなどの人間向け機能も充実。PostgreSQL、MySQL、SQLiteをサポートし、プラグインで拡張可能。ローカルファーストのアーキテクチャでデータセキュリティを確保します。

  • Model Context Protocol (MCP) サーバーを内蔵し、AIエージェントがアプリ内でクエリを実行可能
  • Monaco SQLエディタ、ノートブック、ビジュアルEXPLAIN、ER図などの専門ツールを提供
サイト内本文

Gemini を使って Google スプレッドシートを作成する

このチュートリアルでは、Gemini を使って Google スプレッドシートを作成する3つの方法を紹介します。スプレッドシート内の組み込み統合、Gemini Web アプリからのエクスポート、Google Apps Script の生成による高度な自動化です。また、より良い結果を得るためのヒントも提供します。

  • Gemini は Google スプレッドシートの AI 統合機能で、自然言語による表作成、データ入力、分析が可能。
  • 方法1:スプレッドシート内の Gemini サイドパネルを使って、プロンプトから表や数式、分析を生成。
サイト内本文

コードレビューは終わった。コードレビュー万歳

AI生成コードの爆発的な増加により、従来の人間による事前承認ベースのコードレビューはスケールしなくなりました。本記事では、自動化されたCI/CDゲートによる一貫性のあるポリシー適用、高リスク変更への人間のレビュー集中、4層の品質ゲートパイプライン、ポストマージレビューによるフィードバックループの構築を提唱しています。

  • AI生成コードの量が人間のレビュー能力を圧倒している。
  • 自動ゲート(lint、SAST、テスト、ブランチ保護)が儀式的承認を置き換える。
サイト内本文

AIエージェントによるフォークメンテナンスの自動化 | Cohere

本稿では、AIコーディングエージェントを用いてソフトウェアフォークのメンテナンスを自動化する方法を紹介し、これを制御理論における閉ループフィードバックシステムとして捉えます。CohereのvLLMフォークに適用した例では、アップストリームリリースの吸収時間を数週間から数日に短縮しました。自動リベース、測定収集、反復修正を含むアプローチで、Cohere Transcribeモデルのケーススタディも示します。

  • AIエージェントがフォークメンテナンスの全サイクル(同期、測定、修正、反復)を自動化できる。
  • フォークメンテナンスをフィードバック制御システムとしてモデル化し、エージェントがコントローラの役割を果たす。
サイト内本文
研究

ハイブリッドモデルはどのトークンをより正確に予測するか?

Ai2チームは、7BパラメータのTransformerモデルOlmo 3とハイブリッドモデルOlmo Hybridを比較。ハイブリッドモデルは内容語(名詞、動詞、形容詞)や文脈推論が必要なトークンで優れるが、繰り返しトークンや閉じ括弧では優位性が消失する。トークンレベルの損失フィルタリングにより、アーキテクチャ間の微妙な差異が明らかになった。

  • ハイブリッドモデルは意味のあるトークン(内容語)で予測が正確だが、繰り返しトークンでは優位性がない。
  • ハイブリッドモデルは一部のアテンション層を再帰層に置き換え、固定サイズのメモリで系列の状態追跡に適する。
サイト内本文

AI駆動の説明と実験による脳の理解

マイクロソフトリサーチと共同研究者らは、ブラックボックスモデルを検証可能な仮説に変換し、脳の特定領域が言語内の概念にどう反応するかを明らかにする生成的因果テスト(GCT)を導入した。

  • GCTは脳予測モデルを短い言語説明に蒸留する。
  • 新しいストーリーを生成しfMRIで説明を因果的に検証する。