AI News HubLIVE

MCPの最新ニュース

ソブリンオペレーター:AIを活用したゼロトラスト実行プラットフォーム

筆者は30年にわたるデータ管理の経験を活かし、自律的でプロバイダに依存しないAIエージェントシステム「g8e」を構築。リモートシステム上で安全かつ確実に操作を実行し、SREやIoTなどの分野に応用可能。

  • リモートサポートで培った信頼と操作経験を基に、AIエージェントシステムg8eを開発。
  • g8eは5層の検証シーケンスを持つゼロトラスト実行基盤で、MCPやA2Aをサポート。
サイト内本文

Boogy:Vibe Codingのための本番インフラ

Boogyは、AIプロンプトを使って数秒でバックエンドをデプロイできるプラットフォームです。REST、RPC、MCPエンドポイントを生成し、サンドボックス化されたデータベースと認証が自動で付属します。主な特徴として、プロセス内呼び出しによるマイクロ秒遅延のメッシュネットワーク、独自の埋め込みデータベースBoogyDB(SQLiteの1.5~3倍の性能)、ベクトル検索、バックグラウンドジョブ、ゼロトラストセキュリティモデルがあります。

  • AIエージェント(Claudeなど)にプロンプトを送るだけで、フルバックエンドを数秒で生成・デプロイ。
  • サービス間はプロセス内関数呼び出しで通信し、レイテンシはマイクロ秒。ID、権限、監査が自動で付与される。
サイト内本文

AIエージェントに0ドルを与え、1万ドルを稼がせる

AIエージェントが0ドルの初期資金で180日間、人間の助けなしに実際の経済で1万ドルを稼ぐ実験。78のツール(ウォレット、メール、SMSなど)を提供するHands Body and Feet MCPサーバーを「身体」、Hermes Agentを「脳」として使用。4つの戦略(テストネットエアドロップ、マイクロSaaS、コンテンツ/アフィリエイト、日和見主義)を並行して実行。収益は自動的に30%税金、50%事業運営、20%作成者に分配。すべてのプロセスは公開追跡可能。

  • AIエージェントが0ドルから180日間で1万ドルを目標に人間の助けなしで活動。
  • Hands Body and Feet MCPサーバーにより78の実世界ツールを利用。
サイト内本文

Hermes Agent、MCP向けTool Searchを搭載:Anthropicの評価でOpus 4の精度が49%から74%に向上

Nous ResearchのオープンソースHermes AgentにTool Search機能が追加されました。BM25による段階的なスキーマ開示により、MCPツールコンテキストの肥大化を解決し、トークンオーバーヘッドを削減、モデルの精度を向上します。Anthropicの評価では、Claude Opus 4の精度が49%から74%、Opus 4.5が79.5%から88.1%に向上しました。

  • Tool Searchは、すべてのMCPツールスキーマを3つのブリッジツール(tool_search、tool_describe、tool_call)に置き換え、必要に応じてスキーマを読み込みます。
  • BM25検索とフォールバックを使用し、ツール名、説明、パラメータ名をクエリに一致させます。
サイト内本文

IBM量子サンプリングループを用いたCPU専用Qwen3-30B推論のチューニング

2017年製MacBook Air上で、人間の実験者、Codex、llama.cpp、ローカルデータベース、IBM量子プロセッサのサンプリングを組み合わせ、Qwen3-30Bモデルの推論速度を0.09トークン/秒から14.03トークン/秒に向上させた研究。量子プロセッサ上でモデルを実行するのではなく、推論設定の最適化に量子サンプリングを用いている。

  • 8GB RAMの2017年MacBook AirでGPUなしでQwen3-30Bを実行
  • 人間とAIの量子最適化ループにより速度が0.09 tok/sから14.03 tok/sに向上
サイト内本文

AIコーディング支出の実態:48%がコード生成、40%が思考に

開発者がCodeBurnという自作ツールでAIコーディングAPIの支出を追跡したところ、30日間で7,890ドルのうち実際のコード生成は47.9%に過ぎず、残りはコードベースの探索、デバッグ、サブエージェントへの委任、対話に費やされたことが判明。記事ではダッシュボード、モデル比較、無駄検出、成果追跡などの機能を詳述。

  • AIコーディング支出の47.9%のみが実際のコード生成に使用され、40%は思考プロセスに費やされた。
  • CodeBurnは13のタスクカテゴリにAPIコールを分類するオープンソースCLIツール。
サイト内本文

ChatPaper:学術論文を探索しAIと対話する

ChatPaperは研究者向けのAI駆動プラットフォームで、興味に基づく論文推薦、トップ会議の論文へのアクセス、簡単な論文管理、AIとの対話機能を提供します。また、さまざまな機関から20の最新研究論文を紹介しています。

  • ChatPaperはAIセマンティックマッチングにより、興味に基づいた毎日の論文推薦を提供します。
  • IJCAI、ICML、CVPR、KDDなどのトップAI会議の論文に無料でアクセスできます。
サイト内本文

DDS Vibe Academy – 47の無料AIコーディングマスタークラス、AIエージェントによって構築

DDS Vibe Academyは、AIエージェントによって完全に構築された47の無料AIコーディングマスタークラスを提供します。創設者のRobert McCullock氏は、コードを一切書かず、制約条件を設計しただけだと述べています。コースは基礎、開発、応用、習得の4レベルに分かれ、Claude、Antigravity、MCPなどの技術をカバーしています。

  • AIエージェントによって構築された47の無料AIコーディングマスタークラス
  • 創設者はコードを一切書かず、制約のみを設計
サイト内本文

SiteGround、WordPress 7.0でのAI統合の強引な手法が不評

筆者はSiteGroundがWordPress 7.0アップデートでユーザーの同意なくAIコネクタとAIエージェントを自動的に有効にしたことを批判し、特に有料ユーザーに対する欺瞞的な強制導入だと非難している。プラグインは急速に100万インストールを達成したが、レビューは非常に悪い。筆者はこの慣行によりホスティングの乗り換えを検討している。

  • SiteGroundはWordPress 7.0への自動アップデートと同時に、AI StudioをデフォルトのAIコネクタとして有効にし、AIエージェントをユーザーのオプトインなしでアクティブ化した。
  • 筆者はこの手法を欺瞞的であり、特に料金を支払っているユーザーに対しては選択権が与えられるべきだと批判。
サイト内本文

Liquid AI、38Tトークンで学習した8B-A1B MoEを公開

Liquid AIは、エッジデバイス向け混合エキスパートモデルLFM2.5-8B-A1Bをリリースした。総パラメータ8B、アクティブパラメータ1Bで、38兆トークンで学習。128Kコンテキストウィンドウ、非ラテン言語向けの改良トークナイザー、推論専用のチェーン・オブ・ソートを特徴とする。ベンチマークで競争力のある性能を発揮し、CPU/GPUで高速動作、ローカルエージェントタスクに適する。

  • LFM2.5-8B-A1Bは総パラメータ8B、アクティブ1BのMoEモデルで、38Tトークンで学習。
  • 128Kコンテキストウィンドウと語彙拡張(128K)により非ラテン言語のサポートが向上。
サイト内本文

問題はエージェントではない – 既存のシステムとAPIはAI向けに作られていない

MCP Bridgeは、ハイブリッド検索とAIエンリッチメントを用いて、エンタープライズAPIをAIエージェントが読めるようにする課題に取り組んでいます。APIのレスポンス形状から自動的に意味のある名前と説明を生成し、ツール選択の精度を劇的に向上させます。

  • FTSとベクトル検索を組み合わせたハイブリッド検索に再ランカーを加え、ツール発見を改善。
  • エンタープライズAPIは'getProcInfo3'のような不明瞭な名前と貧弱なドキュメントが多い。
サイト内本文

2026年のDataHackサミットで出会うべき25人の影響力あるAIパイオニア

本記事では、2026年のDataHackサミットで講演する25人の最も影響力のあるAIパイオニアを紹介します。Google DeepMind、Microsoft AI、Walmartなどからの研究者、データサイエンティスト、創業者、企業AIリーダーが含まれ、AIの技術的限界を押し広げ、コミュニティを構築し、モデルを製品に変えています。

  • 2026年のDataHackサミットには、研究、応用、リーダーシップを網羅する25人のトップAIパイオニアが集まります。
  • 講演者にはGoogle DeepMindのDheeraj Nagaraj、Microsoft AIのHardik Meisheriなどが含まれます。
サイト内本文

オープンソースエコシステム

本記事は、オープンウェイトモデルやオープンプロトコル(MCPなど)がどのように私有化されるかという、オープンソースAI戦略の限界を探る。AnthropicによるStainless買収をケーススタディとして、補完的キャプチャと堀の移動を説明し、AIインフラの開発者体験層がプラットフォーム大手によって統合されつつあると指摘する。オープンソースの影響はその依存関係に大きく左右されるため、エコシステム全体の視点で分析する必要性を強調する。

  • オープンウェイトモデルは高価なハードウェアとモノリシックなアーキテクチャに依存し、オープンソース戦略として限界がある。
  • AnthropicによるStainless買収は、オープンプロトコル周辺の補完的レイヤーが私的に捕捉される例である。
サイト内本文

AIエージェントの権限:「動作する」と「安全」の間にある欠落した層

本記事は、Claude CodeなどのAIコーディングエージェントにおけるセキュリティリスク(コマンドの誤解釈、認証情報の流出、プロンプトインジェクションなど)を考察する。人間による監視には「権限疲れ」の問題があり、サンドボックス、オートモード、フックなどの緩和策を紹介し、開発コンテナと最小権限の原則の重要性を強調している。

  • AIエージェントが自然言語コマンドを実行する際、データ削除や認証情報漏洩などの災害を引き起こす可能性があり、人間の監視は完全ではない。
  • Anthropicのテレメトリーによると、ユーザーは権限プロンプトの約93%を承認しており、顕著な権限疲れが存在する。
サイト内本文

CodePulse – AIコーディングツール向けトークン効率的なコードベースインデクサー

CodePulseは、持続的なgit差分認識インデックスを維持し、セッション開始時にコンパクトなスナップショットを注入することで、AIコーディングアシスタントのトークン予算を60~80%節約するオープンソースのコードベースインデクサーです。Claude Code、OpenAI Codex CLI、Cursorなどのツールをサポートし、タスク認識ランキング、git認識ランキング、自動バジェットなどの機能を提供します。CLI、MCPサーバー、複数の統合方法を備えています。

  • プリビルドスナップショットにより、AIアシスタントの探索トークンを60~80%節約。
  • 複数のAIツール(Claude Code、Codex CLI、Cursorなど)をサポート。
サイト内本文

Show HN: スケーラブルなAIメモリのためのオープンソースツールキット

LithiumはPostgreSQL ltreeをベースにした階層型バージョン管理ストレージエンジンで、決定論的でスコープ指定された検索、組み込みのバージョニング、ゼロランタイム依存を提供します。MCPサーバーを介してAIツールと統合し、AIエージェントのメモリ、意思決定追跡などのユースケースに適しています。

  • PostgreSQL ltreeを使用した階層型バージョン管理ストレージ、グラフデータベースより高速
  • スコープ指定検索と組み込みバージョニングを備えたTypeScript API
サイト内本文

マクロトレンドを調査する金融AI:You.comとLangchainによるEU経済分析

この記事では、Deep Agents、LangSmith、You.com Finance Research APIを使用して構築されたマクロ経済調査エージェントを紹介します。このエージェントは、EU全27加盟国のGDPデータを分析し、異常値を検出し、約45分で引用付きのブリーフィングを作成します。アイルランドの異常な成長とドイツの縮小の詳細を分析し、トレーサビリティと監査可能性の重要性を強調しています。

  • AIエージェントは約45分で27のEU諸国のGDPデータを分析し、APIコストは約2.20ドルです。
  • アイルランドの12.3%のGDP成長は医薬品輸出の前倒しによるもので、ドイツは自動車と建設部門の構造的な縮小に直面しています。
サイト内本文

AIトークン使用量を最適化する方法:repo-brainの紹介

repo-brainは、コードベース全体を1つのMarkdownコンテキストファイルに圧縮し、最大96%の圧縮率を実現してAIトークン使用量を大幅に削減するオープンソースツールです。静的解析、アーキテクチャ解析、意味的関係の発見に対応し、複数のAIプロバイダーをサポートします。

  • コードベース全体を1つのMarkdownコンテキストファイルに圧縮し、AIトークン使用量を削減
  • 262ファイルのリポジトリで96%の圧縮率を達成(154,229トークンから6,487トークンへ)
サイト内本文

theta-spec:控えめでハーネスに依存しないAIエージェント設定仕様

theta-spec は、AIコーディングエージェントのための宣言的でハーネスに依存しない設定標準です。単一の theta.toml ファイルが、命令、ルール、ツール、スキル、サブエージェントといった設定の全表面を定義します。この設定ファイルのライフサイクルのためのプロトコルが規定され、準拠する実装はそれを任意のサポートされたハーネスに解決、ロック、キャストできます。プロジェクトにはRust製の参照実装(theta CLI)が含まれ、Claude Code、Codex CLI、Cursor、GitHub Copilotなどのハーネスをサポートしています。

  • AIエージェント向けの宣言的でハーネスに依存しない設定標準。
  • Claude Code、Codex CLI、Cursor 3+、GitHub Copilotをサポート。
サイト内本文

PyTorch プロファイリング(第1回):torch.profiler 入門ガイド

本記事は PyTorch プロファイリングシリーズの第1回です。最も単純な行列乗算とバイアス加算から始め、torch.profiler の設定方法、プロファイラテーブルとトレースの読み方、CPU と GPU のアクティビティ間の時間関係、ウォームアップと行列サイズが性能に与える影響について解説します。

  • torch.profiler は統計テーブルと時間軸トレースを出力し、ホットスポットと実行タイミングを把握できる。
  • 小さい行列演算はオーバーヘッド律速になるが、サイズを大きくすると計算律速に移行する。
サイト内本文

Claude 4.8が登場!一部の能力でMythosを上回り、数百のサブエージェントを並行処理

Anthropicが最新フラッグシップモデルClaude Opus 4.8をリリース。端末エンジニアリングと知識作業で改善が見られ、一部ベンチマークでMythosを凌駕。誠実性が大幅に向上し、コード欠陥の見逃し率が前世代の4分の1に。新機能「Dynamic Workflows」により、タスクを数百の並行サブエージェントに分割して実行可能。

  • Claude Opus 4.8が4.7から43日でリリース、コーディングと知識タスクで進歩
  • Dynamic Workflows:ClaudeがJavaScriptオーケストレーションスクリプトを生成し、数百の並行サブエージェントを調整
サイト内本文

Liquid AI、LFM2.5-8B-A1Bをリリース:デバイス向けMoEモデル、総パラメータ8.3B、アクティブパラメータ1.5B

Liquid AIは、ツール呼び出しに特化したデバイス向けMixture-of-Experts(MoE)モデルLFM2.5-8B-A1Bをリリースしました。総パラメータ数8.3B、トークンあたりアクティブなパラメータはわずか1.5Bで、コンシューマーハードウェア上で動作します。128Kのコンテキストウィンドウ、推論機能、9言語対応を備えています。前世代モデルと比較して、非幻覚率が7.46から63.47に向上するなど、ベンチマークで大幅な改善を示しています。

  • LFM2.5-8B-A1Bは、総パラメータ8.3Bのうちトークンあたり1.5Bのみをアクティブにし、エッジデバイスでの効率的な推論を実現。
  • 128Kのコンテキスト長と9言語(アラビア語、中国語、日本語を含む)に対応。
サイト内本文

Open House のオブザーバビリティ発表:MCP サーバー、AI Notebooks、ClickStack Cloud

Open House で ClickHouse コミュニティに発表されたオブザーバビリティの 3 つの主要アップデート:ClickStack Cloud(フルマネージドサーバーレスオブザーバビリティプラットフォーム)のプライベートプレビュー開始、Managed ClickStack の一般提供開始、AI Notebooks のベータ版、そして ClickStack MCP サーバーのオープンソース化。AI Notebooks は永続的な調査ワークスペースで、分岐探索を可能にします。MCP サーバーは外部エージェントがオブザーバビリティプリミティブを利用できるようにし、調査効率を向上させます。

  • ClickStack Cloud のプライベートプレビュー:フルマネージドサーバーレスオブザーバビリティ。
  • Managed ClickStack が一般提供開始、深い制御を求めるチーム向け。
サイト内本文

/monitor リリース:Firecrawl がウェブページ変更監視ツールを発表、AI エージェントをリアルタイムで同期

Firecrawl は /monitor を発表。ウェブページの変更を自動検出し、webhook 経由で AI エージェントに通知、LLM トークン使用量を最大 90% 削減。

  • /monitor は URL と追跡内容を指定するだけで、変更を検出して通知。
  • 変更部分のみを読み込むことで、トークン使用量を最大 90% 削減。
サイト内本文

PerplexityがBumblebeeを発表:新しい読み取り専用開発者スキャナーがChainguardとどう違うか

Perplexityは、プログラマーのラップトップ上のリスクのあるパッケージ、拡張機能、AIツール設定をスキャンするためのオープンソース開発セキュリティツール「Bumblebee」をリリースしました。このツールは読み取り専用で、インストールスクリプトやパッケージマネージャーを実行せず、言語パッケージマネージャー、AIエージェント設定、エディター拡張機能、ブラウザー拡張機能の4つの攻撃面に焦点を当てています。コンテナとパイプラインに重点を置くChainguardとは異なり、Bumblebeeは開発者のローカル環境を対象としています。

  • BumblebeeはPerplexityが開発したオープンソースの読み取り専用スキャナーで、開発者マシン上のリスクコンポーネントをチェックします。
  • 言語パッケージマネージャー、AIエージェント設定、エディター拡張機能、ブラウザー拡張機能の4つの表面をカバーします。
サイト内本文

Unity Catalog と Apache Iceberg™ の新時代

Databricks は Unity Catalog を最も包括的で相互運用性が高く、プロダクション対応の Apache Iceberg カタログとして位置づけ、Managed Iceberg、Iceberg v3、Foreign Iceberg を GA としました。5つの主要機能:オープンAPI、カタログフェデレーション、クロスエンジンアクセス制御、ゼロコピーセキュア共有、AI主導の最適化。将来の Iceberg v4 と Delta 5.0 は統一メタデータ構造に収束します。

  • Unity Catalog は Managed Iceberg、Iceberg v3、Foreign Iceberg を GA でサポート。
  • 5つの主要機能:オープンAPI、カタログフェデレーション、クロスエンジン属性ベースアクセス制御、ゼロコピーセキュア共有、AI主導の最適化。
サイト内本文

非同期エージェントの時代 — CognitionのWalden Yan氏とOpenInspectのCole Murray氏

本記事は、AIコーディングツールが開発者と密接に連携するローカルワークフローから、非同期のバックグラウンドエージェントへと進化する過程を探り、2025年12月のモデルの変曲点が「スペックからPRへ」のワークフローを実用的にしたこと、そしてDevinやOpenInspectのアーキテクチャ、セキュリティ、テスト、メモリ、マルチエージェントオーケストレーションについて詳しく解説している。

  • バックグラウンドエージェントが主流になりつつあり、DevinのマージされたPRの割合がCognitionリポジトリで16%から80%に増加。
  • 2025年12月のモデルアップグレード(Opus 4.5/GPT 5.2)により、エージェントが仕様から完全なプルリクエストを自律的に生成できるようになった。
サイト内本文

AI時代の面接

この記事は、AIがソフトウェアエンジニアリングの面接にどのような影響を与えているかを探り、さまざまな面接タイプ(持ち帰り課題、ライブコーディング、プレゼンテーション、実際の業務)をシグナル品質と企業コストの次元で分析する。AIによって持ち帰り課題が簡単になりすぎ、ライブコーディングの重要性が低下したため、企業は面接でのAI利用を制限すべきだと主張し、従来の学校評価モデルとの類似点を挙げている。

  • AIコーディングは、特に持ち帰り課題とライブコーディングの現在の面接モデルを脅かしている。
  • 企業はシグナル品質を維持するために、面接中のAI使用を制限すべきである。
サイト内本文

AIエージェントフレームワーク比較

2026年5月時点で、7つの主要なAIエージェントフレームワーク(DSPy、Claude Agent SDK、OpenAI Agents SDK、CrewAI、AutoGen、LangGraph、Google ADK)は、設計思想、アーキテクチャ、プロダクション対応度などで異なる。LangGraphがプロダクション展開でリードし、Claude Agent SDKは最も強力なシングルプロバイダー機能を提供し、OpenAI Agents SDKは最もクリーンなマルチエージェントハンドオフを提供し、CrewAIは開発速度に優れる。市場は2025年の78.4億ドルから2030年には526.2億ドルに成長すると予測されている。

  • LangGraphは最も成熟した永続実行モデルを持ち、約400社に導入されている。
  • Claude Agent SDKは最も強力なシングルプロバイダー機能を提供するが、Anthropicモデルに限定される。
サイト内本文

Amazon Quick と Snowflake Cortex AI で AML アラートトリアージを自動化

この記事では、金融サービスにおいて最も労働集約的なワークフローの1つであるアンチマネーロンダリング(AML)アラートトリアージを自動化することで、統合の実際の動作を紹介します。Amazon Quick Flows と Snowflake Cortex を、Amazon Quick モデルコンテキストプロトコル(MCP)統合を介して接続したトリアージワークフローを構築します。テスト環境では、Amazon Quick を使用した自動化ワークフローにより、アラート調査時間を30~90分から5分未満に短縮しました。実際の結果は、アラートの複雑さとデータ量によって異なる場合があります。

  • Amazon Quick Flows と Snowflake Cortex は MCP を介して統合され、AML アラートトリアージを自動化します。
  • 自動化ワークフローにより、調査時間が30~90分から5分未満に短縮されました。
サイト内本文

Data Formulator 0.7:エンタープライズデータ向けAI搭載データ分析

Data Formulator 0.7は、データ接続、エージェントガイドによる探索、ビジュアライゼーションの改善を共有ワークスペースで統合した、エンタープライズデータ分析向けのオープンソースAIシステムです。

  • エンタープライズデータ分析向けのオープンソースAIシステム
  • データコネクタ機能により、多様なデータソースへの管理・再利用可能な接続をサポート
サイト内本文

Claudeverse – 並列Claudeコードワーカーのためのミッションコントロール

Claudeverseは、開発者が複数のClaude AIワーカーを並行管理するためのコマンドセンターです。並列ワーカー管理、ワーカーエスカレーション、レビューキュー、トレーサビリティ、iPadミラーリング、モデルニュートラルエンジンなどの機能を提供します。現在は招待制のベータ版です。

  • Claudeverseは、複数のClaudeワーカーを同時に管理する統一コマンドセンターを提供します。
  • 主な機能には、並列ワーカー管理、ワーカーエスカレーション、レビューキュー、トレーサビリティ、iPadミラーリングがあります。
サイト内本文

GPS:コーディングエージェントがリポジトリを記憶する

GPSは、コーディングエージェントがセッション間でコンテキストを忘れる問題を解決し、リポジトリ内のシンボルやファイルに記憶を固定します。ルール、注意点、テストコマンドを学習し、エージェント自身が記憶を記録できます。ローカルファースト、CLIファーストで、Claude Code、Codex、Cursor、MCPに対応。

  • GPSは、セッション終了後にエージェントがすべてを忘れてしまう問題に対処し、記憶をリポジトリのシンボルやファイルに紐付けます。
  • エージェントはタスク中に自ら記憶を保存でき、次回の実行は前回よりもスマートになります。
サイト内本文

Google Pay、AIエージェント向けユニバーサルコマースプロトコルを準備

Google Payは、AIエージェントによる取引の急増に備え、決済インフラを全面的に刷新している。新たに導入されたユニバーサルコマースプロトコル(UCP)とマーチャントコマースプラットフォーム(MCP)サーバーは、マシン間コマースのためのAPI駆動型バックエンドを提供する。このアップデートには、動的コールバック、WebViewサポートの拡張、クロスデバイス生体認証によるセキュリティ対策が含まれる。これは、マシン主導の経済への移行を示しており、企業はAIエージェントに対応するためにデジタルプレゼンスを適応させる必要がある。

  • Google Payは、AIエージェントの決済を標準化するユニバーサルコマースプロトコル(UCP)を導入。
  • 新しいマーチャントコマースプラットフォーム(MCP)サーバーが仲介役となり、取引データを集約。
サイト内本文

リビアンのソフトウェア責任者はCarPlayもボタンも不要と考えている

Decoderポッドキャストのインタビューで、リビアンのチーフソフトウェア責任者Wassym BensaidがVWとの合弁事業、新しいAI搭載リビアンアシスタント、そしてなぜ音声インターフェースがボタンに取って代わりCarPlayが不要になるのかについて語った。

  • リビアンとフォルクスワーゲンの合弁事業(RV Tech)は、リビアンのソフトウェア文化とVWの規模を融合させる。
  • リビアンアシスタントは、車両のゾーンアーキテクチャに深く統合されたAIエージェント。
サイト内本文

AIエージェントがDNS上に独自の電話帳を取得

DNS-AIDプロジェクトは、DNSインフラを活用してAIエージェント間の発見を可能にし、新たな中央集権的なレジストリの作成を回避します。Linux Foundationが管理し、MCPやA2Aなどのプロトコルをサポートし、名前、機能、ドメインでエージェントを検索できます。

  • DNS-AIDはオープンソースプロジェクトで、DNSを使ってAIエージェントを発見します。
  • 既存のDNSインフラを基盤とし、SVCBやDNSSECなどの技術を利用。
サイト内本文

Cloudflareのデータプラットフォームとその上のAIエージェントの構築方法

Cloudflareは毎秒10億以上のイベントを処理するが、データは分散してアクセスが困難だった。そこで、統合分析プラットフォーム「Town Lake」と、自然言語で質問し監査可能な回答を得られるAIエージェント「Skipper」を構築した。本記事では、プラットフォームのアーキテクチャ、ガバナンス(デフォルトクローズ)、AIエージェントの仕組みを詳述する。

  • Cloudflareはデータの分散問題を解決するため、統合データプラットフォーム「Town Lake」とAIエージェント「Skipper」を構築。
  • Town LakeはTrino、R2、Icebergを使用したデータレイクハウスアーキテクチャを採用。
サイト内本文

OpenLoomi AIをオープンソース化した理由

OpenLoomi AIチームは、AIワークパートナーをオープンソース化する決断の背景を説明。データ所有権、透明性、コミュニティ主導の開発を重視し、ローカルファーストアーキテクチャ、クローズドソースの信頼税、AIインフラの公共化などの理念を述べている。

  • OpenLoomiはローカルファースト:ユーザーデータは暗号化されて端末に留まり、モデル学習に使用されない。
  • オープンソースにより信頼への依存が不要になり、コードの監査、フォーク、セルフホスティングが可能。
サイト内本文

2026年に構築すべき7つの実用的なAIプロジェクト(ガイド付き)

この記事では、求人検索、研究、投資分析、市場動向、請求書処理、チャートのデジタル化、パーソナライズされた運動トレーニングなど、実用的なワークフローを自動化する7つのAIプロジェクトを紹介します。各プロジェクトには完全なガイドとコードが付属しています。

  • AI求人検索アシスタントを構築し、求人と履歴書を自動マッチング
  • マルチエージェント研究アシスタントを作成し、出典付きレポートを生成
サイト内本文

Show HN:ローカルコーディングエージェント——LLMでツール呼び出しを小さなAIモデルに委譲

Open Agent Tools (oats) は、ローカルコードを利用したツール呼び出しを可能にするセルフホスト型AIフレームワークです。大規模モデルのトークン消費を抑えるため、ツール呼び出しを小規模モデルに委譲します。

  • oats はローカルAIモデルがローカルソースコードを使用してツール呼び出しを実行できるようにします。
  • 20,000以上のGitHubリポジトリからデータをマイニングし、再利用可能なプロンプトインデックスを作成。
サイト内本文

7Bモデルがo3、GPT-5を打ち破る! 医学AIエージェントが「どこを見て、どう見るか」を学習

上海創智学院のLeapQuestチームは、複数の大学と協力して、モデルが推論プロセスで視覚ツールを積極的に活用し、受動的な入力から能動的なエビデンス探索へと変革する新しい医学AIパラダイムを提案。2本の論文がICML 2026に採択された。

  • LeapQuestは、医学画像と動画向けにOphiuchusとMedScopeを提案。Think with Images/Videosパラダイムを採用。
  • Ophiuchus-7Bは8つのVQAベンチマークで平均68.0点を達成し、o3(62.2)やGPT-5(59.9)を上回る。
サイト内本文

Show HN: BetterCallClaude – イタリア向けオープンソースAIリーガルエージェント

BetterCallClaudeは、イタリアの法律専門家向けに設計されたオープンソースのAIリーガルエージェントプラットフォームです。20の専門AIエージェントがイタリア全20地域をカバーし、バイリンガル(伊・英)対応、プライバシーを重視したローカルLLM処理とGDPR準拠を特徴としています。法律研究の高速化、効率向上、完全な透明性を実現します。

  • イタリア法に特化した20の専門AIエージェント
  • バイリンガル対応(イタリア語・英語)
サイト内本文

Show HN: Liiists — MarkdownファーストのiOSおよびCLIリストアプリ

Liiistsは、ターミナル、iOS、AIエージェント(MCPサーバー経由)で動作するMarkdownファーストのリストアプリです。すべて同じプレーンテキストの.mdファイルを読み書きします。CLI、ネイティブiOSアプリ(共有拡張機能、Siri対応)、AI統合用のMCPサーバーを提供。アカウント不要、ロックインなし、iCloud同期または任意のフォルダ(Obsidian vaultを含む)に対応。

  • ターミナル、iOS、AIエージェントで同じMarkdownファイルを使用
  • Goで書かれた依存関係ゼロのCLI
サイト内本文

Amazon Bedrock AgentCoreを活用したビジネスサポート用AIエージェントの構築

AWS Generative AI Innovation CenterはWorks Human Intelligenceと協力し、Amazon Bedrock AgentCoreを使用して2つのAIエージェントを構築しました。通勤手当承認とブラウザ操作を自動化し、コストを最大97%削減、運用効率を向上させました。

  • AIエージェントが通勤手当承認やブラウザ操作などの日常業務を自動化。
  • AgentCoreとStrand Agentsアーキテクチャへの移行により、コストを最大97%削減。
サイト内本文

データ過多から実用的なインサイトへ:Verizon Connectが10万人のユーザーにエージェンティックAIを展開した方法

Verizon ConnectはAWS上にエージェンティックAIソリューションを構築し、毎日5億のデータポイントを10万人のユーザー向けの実用的なインサイトに変換しています。この記事では、サーバーレスの異常検出、Strands Agentsによる動的推論、Amazon Nova Liteによる入力トークンコスト70%削減など、アーキテクチャの決定、実装の課題、測定可能な結果について詳しく説明します。

  • エージェンティックAIが120万台の車両からの毎日5億データポイントを処理し、10万人のユーザーに提供。
  • サーバーレス統計モデルで異常検出を行い、LLMが生の表形式データを処理する問題を回避。
サイト内本文

Amazon Bedrock AgentCore によるエージェント型 AI 販売戦略の推進

AWS セールスは、Amazon Bedrock AgentCore 上に Field Advisor を構築し、20 以上のドメイン固有のエージェントを統括することで、営業担当者の認知負荷を軽減し、効率を向上させました。このソリューションにより、担当者 1 人あたり週最大 2 時間の節約と、レイテンシーの 41% 削減を実現しました。

  • Field Advisor は、単一の会話インターフェースで 20 以上の専門エージェントを統括します。
  • 人間参加型ワークフローにより、データの正確性と説明責任を維持します。
サイト内本文

Robinhood、AIエージェントが顧客に代わって株式取引やクレジットカード購入を可能に

Robinhoodは、顧客がAnthropicのClaudeなどのAIエージェントをMCPを介して専用の投資口座に接続できるようにしました。エージェントは自律的に株式取引を行い、クレジットカードでの購入も可能です。米国の証券規制当局FINRAは、こうしたエージェントを新たなリスク領域として警告しています。Robinhood自身も、この製品がすべての人に適しているわけではないと認めています。

  • Robinhoodは、MCPを介してAIエージェント(Claudeなど)を投資口座に接続する機能を提供。
  • AIエージェントは自律的に株式取引やクレジットカード購入を実行できる。
サイト内本文

Robinhood、AIエージェントによる株式取引を可能に——大儲け(または大損)も

Robinhoodは、AIエージェントに取引プラットフォームを開放すると発表。ユーザーはエージェント用の独立した口座を作成し、資金を割り当てて自動的に株式を売買させることができる。投資判断の自動化を謳う一方、Robinhoodは重大なリスクを警告しており、AI主導の戦略が市場条件下でうまく機能せず、全額を失う可能性があるとしている。また、Robinhood Gold CardユーザーはAIエージェントをバーチャルクレジットカードに接続して自動購入も可能。

  • RobinhoodがAIエージェント取引機能を開始。専用口座と資金割り当てが可能。
  • 同社は全投資額の損失を含む高いリスクを警告。
サイト内本文

Show HN: Mneme HQ – AIコーディングエージェント向けリポジトリネイティブアーキテクチャルール

Mneme HQ は、コード生成前に制約を強制することでアーキテクチャの漂流を防ぎ、レビューの負荷を軽減する、AI支援開発向けアーキテクチャガバナンスレイヤーです。AIコーディングエージェントのワークフローに直接統合され、禁止されたフレームワーク、境界を越えた呼び出し、陳腐化した決定をPRキューに到達する前にブロックします。

  • AIエージェントがコードを生成する前にアーキテクチャルールを強制し、違反を根本から阻止
  • Claude Code、Cursor、GitHub Copilotなど、主要なAIコーディングツールと連携
サイト内本文

その他の成長タグ