AI News HubLIVE

今日の必読ニュース

Agent

Goat 2.0 – AIエージェントのためのプロアクティブエピソディックメモリ

Goat 2.0 は、Telegram ベースの AI エージェントであり、プロアクティブな階層型メモリシステムを中核としています。標準的な RAG とは異なり、クエリの内容に関係なく、毎ターン前にメモリを能動的に検索します。3 つの独立したバックエンド(Redis、ChromaDB、Letta)を備え、適応型トークン予算、優先順位反転 L2/L3 分割、ライトスルーアーカイブなどの機能を備えています。このプロジェクトは、複雑なメモリ機構を備えた AI アシスタントを構築する方法を示しています。

  • プロアクティブ検索:毎ターン、LLM の応答前にクエリ内容とは独立してメモリ検索が行われます。
  • 3 つの独立バックエンド:ワーキングメモリ(Redis)、エピソディックメモリ(ChromaDB)、パーマネントメモリ(Letta)はそれぞれ遅延接続し、独立して障害が発生します。
サイト内本文

Anthropic、自社のAIから民主主義を守る人材を募集中

Anthropicは「法治」チームのリサーチエンジニア職を公開し、自社のAIシステムが民主主義制度に与える影響を調査・緩和することを目指している。この役割は新設されたAnthropic研究所内に位置し、内部からAIの経済・民主主義・社会への影響を評価する。作業は3つの分野に分かれる:AIエージェントの法令遵守、AIによる政府構造の変化の研究、AIを活用した民主主義の強化。理想的な候補者は、AIの深い専門知識と法律・政治学・公共政策の知識を併せ持つ。

  • Anthropicが「法治」チームのリサーチエンジニアを募集、AIの民主主義への影響を研究
  • 役割はAnthropic研究所内にあり、内部からAIの社会的影響を評価
サイト内本文

AI根本原因分析の難所はもはやモデルではない

AIによる根本原因分析(RCA)の真の課題は、モデルの推論能力ではなく、データ準備とツールチェーン(ハーネス)にあることを指摘。実験を通じて、生テレメトリをそのままモデルに渡すのではなく、決定論的パイプラインで前処理したコンテキストを与えることの重要性を示す。様々なモデルの性能を評価し、小型モデルでもGemma 4 31Bが際立つ結果となった。

  • RCAは推論とハーネスに分かれ、現在のボトルネックはハーネス。
  • 決定論的パイプラインでデータを前処理し、モデルに焦点を絞ったコンテキストを提供する。
サイト内本文

2026年6月のGoogle AI最新ニュース

Googleは2026年6月に、Gemini 3.5 Live Translate、Android 17の新機能、Google Home Speaker、Gemma 4 12Bローカルモデル、Gemini 3.5 Flashのコンピュータ使用、Nano Banana 2 LiteとGemini Omni Flashモデル、Pixel Juneアップデート、新しいGoogle Finance、NotebookLMアップグレード、Gemini学習ノート、教育ツール、詐欺対策訴訟、異常気象AI、AI採用調査など、一連のAIアップデートを発表しました。

  • Gemini 3.5 Live Translateが70以上の言語をリアルタイムで翻訳し、自然な抑揚を保持。
  • Android 17にフローティングウィンドウ、スクリーンリアクション、折りたたみ最適化とセキュリティ強化。
サイト内本文

サーバーレスA2Aゲートウェイの構築:エージェントの発見、ルーティング、アクセス制御

この記事では、AWS上でサーバーレスA2Aゲートウェイを構築し、パスベースのルーティング、一元化されたアクセス制御、意味検索により複数のエージェントを管理する方法を解説します。標準のA2Aクライアントはそのまま動作します。

  • API Gatewayを単一エントリポイントとし、パスベースルーティングを実装。
  • JWTスコープに基づくLambdaオーソライザーで細かいアクセス制御。
サイト内本文

AgentCore Memory における構造化メタデータフィルタリング

本記事では、Amazon Bedrock AgentCore Memory でメタデータフィルタリングを使用して検索精度を向上させる方法を解説します。名前空間分離に加えて属性ベースのフィルタを追加することで、優先度、部門、時間範囲などのビジネス次元に検索を絞り込みます。メタデータの3フェーズライフサイクル(構成、取り込み、検索)、厳密一貫抽出、マルチエージェントおよびマルチテナントアーキテクチャにおけるベストプラクティスを紹介します。

  • メタデータフィルタリングにより、151問のテストセットでQA精度が40%から64%に向上。
  • メタデータは構成、取り込み、検索の3フェーズで管理され、メモリ想起を精密に制御。
サイト内本文
モデル

ZCode:GLM開発者によるClaude Code

ヒューリスティックAI戦略を備えた五目並べゲームをゼロから構築し、ボードのレンダリング、着手ロジック、勝敗判定、AI戦略の最適化を経て、完全にローカルで動作するブラウザゲームを実現しました。

  • 15x15の五目並べゲームをゼロから構築し、プレイヤーとAIの対戦を実現
  • AIはヒューリスティックスコアリングアルゴリズムを使用し、攻撃、防御、中央偏好を総合して最適な手を選択
サイト内本文

日本が国産AIモデルと1000万台のロボット計画を発表

日本政府は、2040年までに国産の人工知能モデルを開発し、10以上の分野で1000万台のAI搭載ロボットを稼働させる計画を発表した。約60億ドルを投資し、ソフトバンクやソニーなどの企業連合「Noetra」が開発を担当する。米中への過度な依存を減らすための取り組み。

  • 日本は2040年までに1000万台のAIロボットを10以上の分野で導入。
  • 約60億ドルを投じて国産AIモデルを開発。
サイト内本文

AWS GovCloud (US) で Amazon Bedrock 上で NVIDIA Nemotron と OpenAI GPT OSS モデルを実行する

AWS GovCloud (US) リージョンでは、Amazon Bedrock を通じて OpenAI のオープンウェイト GPT OSS モデル(120B、20B)および NVIDIA Nemotron モデル(Nano 9B v2、Nano 12B v2、Nano 30B、Super 120B)をサポートするようになりました。推論はすべて米国内で米国市民が運営するインフラ上で実行され、FedRAMP、DoD SRG などのコンプライアンス要件を満たします。

  • Amazon Bedrock が AWS GovCloud (US) で OpenAI GPT OSS(120B/20B)と NVIDIA Nemotron(複数サイズ)モデルを追加。
  • すべての推論は AWS GovCloud (US) 境界内に留まり、データは米国から出ない。
サイト内本文
ツール

AIに重要な空白をすべて埋めさせないで

AIは「空白を埋める」のが得意だが、それが平凡な出力につながると論じる。プロンプトを具体的かつ詳細にし、LLMをブラックボックスではなくペアプログラマーとして扱い、意思決定を放棄しないことを提唱。不確定性を減らし、プロンプトスキルを向上させることで、個性的な結果を得る重要性を強調している。

  • AIの空白を埋める能力は統計的平均値をもたらし、個性を欠く。
  • 具体的な技術的・美的判断でプロンプトを固定し、AIによる凡庸な代替を防ぐ。
サイト内本文
その他の更新(16件)
モデル

HippoRAG: Amazon Bedrock、Amazon Neptune、Personalized PageRankを用いた神経生物学的に着想を得たRAG

本記事では、AWSスタックを活用したHippoRAGの実装方法を紹介します。Amazon BedrockでLLM機能、Amazon Neptuneでグラフデータベース、Neptune AnalyticsでPersonalized PageRankを含む高度なグラフアルゴリズム、Amazon Titan Embeddingsでベクトル表現を提供します。この実装により、エンタープライズ規模のアプリケーション向けにHippoRAGをAWSインフラ上で構築・デプロイする方法を示します。

  • HippoRAGは海馬記憶システムに着想を得た新しいRAGフレームワークで、複数ドキュメントにわたる多段階推論を実現します。
  • 実装ではAmazon Bedrock、Neptune、Neptune Analytics(Personalized PageRank用)、Titan Embeddingsを活用します。
サイト内本文

読者はAIモデルを使って小説を生成しているのか?

50万以上の匿名ChatGPT会話を分析した新しい研究によると、3分の1以上の会話がフィクション生成を含んでおり、オリジナルストーリー、ロールプレイ、ファンフィクション、エロチカなどが含まれます。パワーユーザーが支配的で、「無限ストーリー要求者」のようなパターンが見られます。著者らは、AIが「自己完結的な読み書き者」を生み出し、エンターテイメントにおけるAIの役割について疑問を投げかける可能性があると主張しています。

  • ChatGPTの会話の3分の1以上がフィクション生成を含む。
  • パワーユーザーが支配的で、同じ物語を繰り返し要求するパターンがある。
サイト内本文

AIが世界のエネルギーシステムを変革する中、メルボルンがエンジニアリング連携で先導

人工知能が計算需要を加速させるにつれ、エネルギーシステムも緊急の課題に直面している。オーストラリアのメルボルンは、統合されたエネルギーエコシステム、世界クラスの工学研究、そして政府・産業界・学界の強力な連携により、世界的リーダーとして台頭している。本記事では、AIがエネルギーインフラに与える影響、メルボルンのスマートグリッドと再生可能エネルギーにおける革新、そして2027年のIEEE PES GTDアジア会議がどのように国際協力を促進するかを探る。

  • 2035年までにデータセンターがオーストラリアの電力消費の最大11%を占め、エネルギーシステムに圧力をかける。
  • メルボルンはメルボルン大学、スマートグリッドラボ、EPICSセンターなどを通じてエネルギーとデジタルインフラの共設計を推進。
サイト内本文
Agent

OpenWiki:コーディングエージェントのためのオープンソースリポジトリドキュメント

OpenWikiはコードベースのドキュメントを自動生成・維持するオープンソースエージェントです。コーディングエージェントがリポジトリのコンテキストを効率的に取得できるようにします。

  • OpenWikiはコードベースのWikiを自動生成し、更新を維持します。
  • エージェントの指示ファイルに参照を追加し、エージェントが必要に応じてドキュメントを取得できるようにします。
サイト内本文

Inscribe が Amazon Bedrock を使って数秒で文書詐欺を阻止する方法

Inscribe は Amazon Bedrock を活用したエージェント型 AI システムを開発し、専門の詐欺分析官のように文書を推論します。このシステムは改ざん、偽造、AI 生成された金融文書を 90 秒未満で検出し、従来の手動審査比で 20 倍の改善を達成しながら、金融規制が求める正確性と説明可能性を維持します。

  • 16 件中 1 件の文書に詐欺が含まれ、AI 生成の偽造文書は 2025 年 4 月から 12 月で 5 倍に増加。
  • Inscribe のエージェント型 AI は Amazon Bedrock 上の複数の基盤モデルを連携し、90 秒未満でエンドツーエンドの詐欺検出を実現。
サイト内本文

Amazon SageMaker AI上のBoltzGenでタンパク質設計を加速

この記事では、SageMaker AIにBoltzGenをデプロイし、エンドツーエンドのタンパク質設計実験を実行する方法を説明します。この設定は研究のさまざまな段階に最適化された2つの実行モードを提供し、反復ワークフローでの計算コストを削減するためにステップレベルのキャッシュを使用します。

  • BoltzGenはタンパク質やペプチドを設計するための拡散ベースの生成モデルです。
  • SageMaker AIはGPUコンピュートをプロビジョニングから結果配信、クリーンアップまで管理します。
サイト内本文

Show HN:AnalystAIPack – マルウェア解析とリバースエンジニアリングのための118の実行可能なエージェントスキル

AnalystAIPack は、マルウェア解析、リバースエンジニアリング、脅威ハンティングのための118のスキルを備えたオープンソースのエージェントスキルライブラリです。汎用AIエージェントが実践的な知識不足から不正確なアドバイスをする問題に対処し、実際のアナリストのワークフローに沿った深さ重視の実行可能スクリプトを提供します。各スキルにはテスト済みのPythonスクリプト、安全設計(読み取り専用解析、無害化IOC)、およびMITRE ATT&CK、D3FEND、CARへのマッピングが含まれています。記事では、チェーンされたスキルを使用したトリアージから検出までのエンドツーエンドの例を示しています。

  • 118の厳選されたスキルが4つのサブドメイン(ラボ基盤、マルウェア解析、リバースエンジニアリング、脅威ハンティング)をカバー。
  • 各スキルにはテスト済みの読み取り専用Pythonスクリプトが付属し、構造化JSONを出力。
サイト内本文

Show HN: AnalystAIPack – マルウェア解析とリバースエンジニアリングのための118の実行可能なエージェントスキル

AnalystAIPackは、マルウェア解析、リバースエンジニアリング、脅威ハンティングのためのオープンソースエージェントスキルライブラリです。MITRE ATT&CK、D3FEND、CARにマッピングされた118の厳選された実行可能スキルを備え、各スキルにはテスト済みのPythonスクリプトが付属しています。深さを重視し、安全性を第一に設計されています。

  • マルウェア解析、リバースエンジニアリング、脅威ハンティング、ラボ基盤の4つのサブドメインにわたる118の実行可能スキル。
  • 各スキルにはテスト済みのPythonスクリプトと詳細なドキュメント(使用タイミング、ワークフロー、検証、落とし穴)が含まれています。
サイト内本文

Devin Security Swarm:AI駆動のコードセキュリティ解析の新パラダイム

Devinは、新しいアーキテクチャ「Agentic MapReduce」を採用した自動セキュリティ分析ツール「Security Swarm」を発表。実際のコードベースをセキュリティ研究チームのように分析し、攻撃面をマッピング、並列調査、脆弱性を検証する。評価では72%の再現率を達成し、コストは次善のツールの約3分の2。

  • Security SwarmはAgentic MapReduceアーキテクチャを採用。プランナーがセレクターを作成し、子エージェントが並列調査、リデューサーが結果を統合。深刻な発見はサンドボックスで再現。
  • モデル学習期限後に公開された14言語50の実脆弱性で評価。記憶ではなく推論による検出を保証。
サイト内本文

GeminiとClaudeにメール返信を書かせてみた – しかし、自分らしいのは一つだけ

GeminiとClaudeにはそれぞれ長所があるが、メール作成の支援に関しては明確な勝者が一ついる。

  • GoogleのGeminiはGmailのHelp Me Writeを支えているが、Claudeはトーンと要件の一致に優れている。
  • テストでは、Claudeがより関連性の高いフォローアップ質問をし、より短くパーソナライズされたドラフトを生成した。
サイト内本文

Databricks データ+AI サミット 2026 後の考察:データ層が再び重要になる理由

著者は、データ層がAIスタックで最も過小評価されているが、AIが本番環境に移行するにつれて重要性が増すと論じる。AIエージェントがデータパイプラインの欠陥を露呈し、Databricksの方向性は正しいがアーキテクチャは未完成。将来のAIネイティブデータシステムに必要な特性を探る。

  • データ層はAIスタックで最も再評価が遅れているが、防御可能な層である
  • AIエージェントは古いコンテキストで失敗し、データパイプラインの問題を明らかにする
サイト内本文

ニューヨーク市の教育者と業界リーダーがGoogleオフィスに集結、教室でのAIの未来を形作る

Google、ニューヨーク・ジョブズCEO評議会、アーバン・アセンブリが共同でAIサミットを開催。150人の教育・業界リーダーが参加し、AIリテラシーと人間のスキルの重要性を議論した。

  • Googleとパートナーが教育とAIに関するサミットをニューヨークで開催
  • aiEDUの「Vibe Coding」やGoogleの「Meet LEA」などのハンズオンセッションを実施
サイト内本文
チップ

「You Only Compute Once」:Clockwork が AI トレーニングの再開を終わらせる方法

Clockwork は TorchPass フォールトトレランス製品と YOCO 保証を発表。GPU クラスター障害の 90% をチェックポイントロールバックなしで解決し、トレーニングジョブを正常な GPU にライブマイグレーションすることで高コストな再計算を回避します。障害のコスト、TorchPass の仕組み、2つのモード、限界、独立したベンチマーク結果を解説。

  • TorchPass は GPU 障害時にトレーニング状態をリアルタイムで移行し、チェックポイントロールバックを回避。
  • YOCO 保証は障害の 90% を進捗損失なしで解決、未達時は更新料を 25% 割引。
サイト内本文

GPUスナップショットでgVisorのコールドスタートを削減

本記事では、CerebriumがGPUメモリのチェックポイント技術を用いて、gVisorサンドボックス内のGPUワークロードのコールドスタート時間を50秒から2.25秒まで短縮した方法を解説。初期化処理は決定的であり、一度実行した結果を凍結し、必要なときに復元するアイデア。実装にはgVisor containerd shimを修正し、コンテナ作成時に通常起動かチェックポイント復元かを判断。タイミング、ネットワーク状態、マルチプロセッシング、ファイルシステム、ストレージパフォーマンスなど多くのエッジケースに対処。

  • GPUワークロードの初期化(Pythonモジュールインポート、PyTorchロード、カーネルコンパイル)は決定的であり、チェックポイントで結果をキャッシュできる。
  • CerebriumはgVisorランタイムを拡張し、互換性のあるチェックポイントが存在する場合、コンテナ作成時にスナップショットから復元する。
サイト内本文
政策

Fable 5、Mythos 5 の制限解除、AnthropicがSonnet 5を公開

強力なモデルのリリースは、企業がさまざまなAIシステムにオープンである必要があり、モデル選択の一部としてガバナンスを考慮すべきであることを示しています。

  • AnthropicがSonnet 5を公開し、Fable 5とMythos 5の制限を解除。
  • 企業は多様なAIシステムを受け入れ、モデル選定にガバナンスを組み込むべき。
サイト内本文
ツール

AIなしでも生きていけるが、清潔な水なしでは生きていけない | 読者の手紙

読者は、エリン・ブロコビッチがAIデータセンターと戦う記事に反応し、AIの大量の電力・水使用に対する利益を疑問視。AIの主な用途は治療、技術サポート、娯楽、ファンフィクションだが、AI治療は孤独感を減らさず、社会的スキルや批判的思考を損なう可能性があると論じる。

  • AIデータセンターは大量の電力と水を消費し、環境への懸念を引き起こす。
  • AIの主な用途は治療、技術サポート、娯楽である。
AI デイリーブリーフィング 2026-07-02 | AI News Hub