AI News HubLIVE

今日の必読ニュース

ツール

Show HN: Empirical – あなたの個人AIメモリー、すべてのAIツールに対応

Empiricalは、すべてのAIツールに統一された個人メモリー層を提供するAIメモリーインフラストラクチャで、プラットフォーム間でのコンテキストと好みの一貫性を確保します。

  • EmpiricalはAIのメモリー層として機能し、ツール間でユーザーデータと設定を同期します。
  • AIアプリケーション間の「メモリーサイロ」問題の解決を目指します。
サイト内本文
Agent

Ornith-1.0:自己改善型のオープンソースエージェントコード生成モデル

Ornith-1.0は、Gemma 4とQwen 3.5をベースに後訓練された、オープンソースのコード生成エージェントモデルシリーズです。強化学習を用いてスキャフォールドとソリューションのロールアウトを同時最適化し、Terminal-Bench、SWE-Bench、NL2Repo、OpenClawなどのベンチマークでオープンソースモデルとして最高性能を達成。9B、35B MoE、397B MoEの3サイズを提供し、MITライセンス、OpenAI互換APIとツール呼び出しをサポートします。

  • Ornith-1.0は9B(密)、35B(MoE)、397B(MoE)の3種類を提供し、複数のコード生成ベンチマークでオープンソースモデル最高の結果を達成。
  • 自己改善型の強化学習フレームワークにより、検索スキャフォールドとソリューション生成を同時最適化し、探索軌道の品質を向上。
サイト内本文

ClaudeがBlackwell Ultraと出会う:AnthropicのモデルがAzure上のNVIDIA GB300で稼働開始

Microsoft Foundry内のAnthropicのClaudeモデル(Microsoft Azure上でホストされ、NVIDIA GB300 Blackwell Ultra GPU上で動作)が一般提供を開始し、Azureネイティブ企業に自律的でドメイン固有のAIエージェントを構築するための強力な新しい方法を提供します。

  • AnthropicのClaudeモデルがAzure上でNVIDIA GB300 GPUにより加速され、Microsoft Foundryで一般提供開始。
  • この統合により、企業は高度なタスクを実行する自律サブエージェントを含む、より強力なエージェントAIシステムを構築可能に。
サイト内本文

Deep Agentsにおける動的サブエージェントの導入

動的サブエージェントにより、AIエージェントはツール呼び出しではなくコードを使用して作業を大規模にオーケストレーションできます。Deep Agentsのプログラムによるオーケストレーションがどのようにカバレッジを保証し、ファンアウトを処理し、一般的なオーケストレーションパターンとリアルタイムトレースを使用して信頼性の高いマルチステップの複雑なエージェントパイプラインを実現するかを学びます。

  • 動的サブエージェントは、ツール呼び出しに代えてコードによるプログラム的オーケストレーションを使用し、大規模な信頼性を向上させます。
  • 確定的なカバレッジと複雑なオーケストレーション(ループ、分岐、並行処理)を可能にし、マルチフェーズパイプラインやファンアウト+合成が信頼性高く実行できます。
サイト内本文

オブザーバビリティの未来は単一のプロプライエタリAIエージェントではなく、チームが構築する何千ものエージェントになる

この記事は、オブザーバビリティが単一の普遍的なAIエージェントに収束するのではなく、チーム固有の特殊なエージェントが多数存在するようになると主張し、コンテキスト、オープン性、共有調査成果物の重要性を強調しています。

  • オブザーバビリティの未来は普遍的なSREエージェントではなく、チーム固有のエージェントが多数存在する。
  • エージェントは調査範囲を広げ、データシステムに負荷をかける。
サイト内本文
チップ

今日のダウンロード:指標の弱点とAIゾウ警告

今週の『ダウンロード』では、生活を数値化する指標の危険性、インドで人とゾウの衝突を減らすAIシステム、そしてAnthropicのMythos 5公開、中国のAIモデルによるバグ発見能力の一致、Appleのチップ購入申請など、テクノロジー関連の重要なニュースを紹介する。

  • 指標は本当に重要なものを隠し、価値観を変えてしまう可能性がある。
  • インドではAI警報システムにより、人とゾウの衝突対応時間を数分から数秒に短縮。
サイト内本文

新しいゲーム用GPUの挑戦者:Bolt GraphicsがNvidiaに挑む

Bolt Graphicsが新たなゲーム用GPUを発表し、Nvidiaに対抗。性能と革新技術を紹介するビデオ。

  • Bolt GraphicsがNvidiaに挑戦する新しいゲーム用GPUを発表。
  • ビデオではその性能と革新的な機能を紹介。
サイト内本文
政策

インフラコストゼロでAI Chrome拡張機能を構築 – BYOKアーキテクチャのPR Focus AI Pro

PR Focus AI Proは、BYOKアーキテクチャを採用したChrome拡張機能で、サーバーコストをかけずにGitHubのPull Requestに対してAIによるリスクスコアリング、要約、レビュー案を提供します。すべてのデータはローカルで処理され、バックエンドは不要です。

  • ローカルAI処理:ユーザー自身のAPIキー(OpenAI、Groqなど)を使用し、コードやキーはブラウザから外部に出ません。
  • AIトリアージ:CIステータス、PR経過日数、コード範囲に基づく0~100のリスクスコア。実際の差分からAIが要約を生成。
サイト内本文
モデル

Ornith-1.0: エージェンティックコーディングのための自己足場LLM

DeepReinforceが初のオープンウェイトモデルOrnith-1.0をリリース。Gemma 4とQwen 3.5をベースに、9Bから397Bまでのバリエーションがあり、コーディングベンチマークでオープンソースモデルとして最高性能を達成。著者はLM Studioで35B MoEバリアントをテストし、エージェントツール呼び出しを効率的に処理できることを確認した。

  • DeepReinforce初のオープンウェイトモデル、MITライセンス
  • Gemma 4とQwen 3.5をベースに9B Dense、31B Dense、35B MoE、397B MoEの4バリアント
サイト内本文

AIに何を持ち込むかが結果を決める

AI教育者のハーパー・キャロルへのインタビューでは、ファインチューニングとプロンプティングの違い、2025年にコーディングを学ぶべきかどうか、AI分野が一般とのコミュニケーションで間違っていることについて取り上げる。キャロルはAIをメディアと捉え、結果は使用者の投入に依存すると論じ、自身のライティングスタイルを再現するファインチューニングを実演し、直感を人間の重要な強みとして強調する。記事はAI支援ライティングのワークフローや、職を失う恐怖ではなく野心を高めることの重要性も探求する。

  • ファインチューニングは出力分布を変えるが、プロンプティングは表面だけを曲げる。
  • コーディング学習は依然重要だが、構文よりもシステム理解に重点を置くべき。
サイト内本文
その他の更新(5件)
Agent

LangSmithを活用したCandidlyのステートアウェアエージェントハーネスの構築方法

Candidlyは、入力出力隠れマルコフモデル(IO-HMM)を用いて会話トレースからユーザーのエンゲージメント状態をリアルタイムに推測し、それに基づく応答ポリシーにより離脱率を低減するエージェントハーネスを構築しました。4つの状態(Engaged、Detailed、Guided、Disengaging)を識別し、離脱状態の割合を23%から11%に削減します。

  • CandidlyはIO-HMMを使用し、軽量なトレース特徴からユーザー状態をモデル化し、結果予測でAUC 0.90を達成。
  • 4つのエンゲージメント状態(Engaged 53%、Detailed 7%、Guided 17%、Disengaging 23%)が発見され、解決率は78%から30%まで異なる。
サイト内本文

Katra:AIエージェントのためのセルフホスト型認知メモリ(MCP)

Katraは、AIエージェントに人間のような認知記憶機能(エピソード記憶、意味検索、知識グラフ、時間分析)を提供するオープンソースのセルフホスト型メモリシステムです。MCPプロトコルを介して任意の互換エージェント(OpenClaw、Claude Codeなど)と統合し、35の専用ツールを備えています。スタートレックのバルカン精神融合(katra)に着想を得ており、多層メモリアーキテクチャとスリープ統合により創発的行動を目指します。

  • 多層メモリ:エピソード記憶、意味記憶、ワーキングメモリ、知識グラフ、時間クエリ。
  • 任意のMCP互換エージェントと連携可能、35の専用ツールを提供。
サイト内本文

AI専門家に聞く:フルスタックとは何か?

GoogleのRichard Seroter氏が、AIへのフルスタックアプローチの意味と、それがなぜGoogleのAI活動の長年の基盤となっているかを説明します。

  • フルスタックAIとは、インフラ、モデル、オーケストレーション、インターフェースをカバーする統合システムです。
  • GoogleのTPUとモデルへの10年にわたる投資により、信頼性と競争力のある価格を実現しています。
サイト内本文
政策

議会、AI企業による健康データ販売を禁止へ

米国議会は、データブローカーへのアメリカ人の健康情報や位置情報の販売を禁止する新たな法案を提出する予定。ChatGPTやClaudeなどのAIチャットボットに入力されたデータも対象となる。FTCによる執行と個人の訴訟権を認め、10億ドルの予算を計上する。

  • 改正法案は、AIシステムに入力されたデータを含む健康・位置情報の販売を企業全体に禁止する。
  • OpenAI、Anthropic、xAIなどのAIラボが医療分野に進出し、データ保護の懸念が高まっている。
サイト内本文
モデル

LlamaParse検索ハーネス:AIエージェント向けファイルシステムプリミティブ

LlamaIndexは、LlamaParse Indexのアップデートとして、AIエージェントにファイルシステムレベルのドキュメントトラバーサルツール、ビジュアルレイアウト保存、マネージドインフラストラクチャ、パイプライン可観測性を提供する検索ハーネスを発表しました。

  • 検索ハーネスには、Hybrid Retrieve、List Files、File Grep、File Readの4つのファイルシステムプリミティブが含まれます。
  • ビジュアルレイアウト保存はページスクリーンショットをキャプチャし、レイアウトに依存するコンテンツを処理します。