AI News HubLIVE

ソース分布

  • Hacker News AI23
  • Microsoft Research Blog5
  • The Decoder4
  • GitHub AI & ML3
  • MarkTechPost3
  • Product Hunt AI2
  • The Verge AI2
  • ZDNet AI2

トピック分布

  • Agent36
  • 政策17
  • 研究16
  • ツール6
  • モデル5
  • チップ4
  • スタートアップ2

タイムライン

  • 2026-05-136
  • 2026-05-105
  • 2026-05-145
  • 2026-05-114
  • 2026-05-164
  • 2026-05-214
  • 2026-05-123
  • 2026-05-153

最新動向

Data Formulator 0.7:エンタープライズデータ向けAI搭載データ分析

Data Formulator 0.7は、データ接続、エージェントガイドによる探索、ビジュアライゼーションの改善を共有ワークスペースで統合した、エンタープライズデータ分析向けのオープンソースAIシステムです。

  • エンタープライズデータ分析向けのオープンソースAIシステム
  • データコネクタ機能により、多様なデータソースへの管理・再利用可能な接続をサポート
サイト内本文

MicrosoftのMAI-Image-2.5、ベンチマークでGoogleのNano Banana 2に並ぶ

MicrosoftのMAI-Image-2.5は、Arenaのテキストから画像へのリーダーボードで3位となり、GoogleのNano Banana 2と同等だが、OpenAIのImage-2には及ばない。このモデルは前世代と比べて、特に画像内テキストのレンダリングや商用ビジュアルで明らかな向上を示している。

  • MAI-Image-2.5はArenaリーダーボードで3位、GoogleのNano Banana 2と同点
  • テキストレンダリングと商用ビジュアルの改善
サイト内本文

人工知能による人間知能の拡張

現代のAIシステムは人間の知能を複製するのではなく、人間の認知と言語にすでに存在する構造を拡張するものです。この視点はAIの能力と限界を説明し、AI安全性を「暴走AI」の恐怖ではなく、工学とガバナンスを重視したシステムレベルの課題として再定義します。

  • AIシステムは言語に沈殿した理解構造をモデル化することで知能を拡張し、人間の心を複製するわけではない。
  • 幻覚や構成性ギャップは、AIが世界との生きた関わりを欠き、意味と真実を固定できないことに起因する。
サイト内本文

theta:エージェント設定を統一的に扱うための控えめなアプローチ

theta は、Rust で書かれた CLI ツールで、theta.toml ファイルを読み込み、解決、ロック、マテリアライズ、キャストを行い、サポートされている任意のハーネス(Claude Code、Codex CLI、GitHub Copilot、Cursor など)にエージェント設定を変換します。エージェントハーネスリソースのパッケージマネージャーのようなものです。インストールは簡単で、ルール、ツール、スキル、サブエージェントの追加に対応しており、検証と変換コマンドを提供します。プロジェクトは uv に強くインスパイアされており、theta-spec の標準実装です。

  • theta はエージェント設定を管理する Rust CLI ツール
  • 複数のハーネスをサポート:Claude Code、Codex CLI、GitHub Copilot、Cursor など
サイト内本文

Microsoft Copilot Coworkでファイル流出の脆弱性

Microsoft Copilot Coworkに重大な脆弱性が見つかり、攻撃者がプロンプトインジェクションと自動送信メール内の外部画像を利用してOneDriveのファイルを盗み出す可能性があります。

  • Copilot Coworkのエージェントは承認なしでユーザーの受信箱にメールを送信可能
  • メール内の外部画像がネットワークリクエストを引き起こし、データ漏洩につながる
サイト内本文

AIウィークリー第495号:マスク、ザッカーバーグが3回の電話でトランプ大統領のAI安全大統領令を葬る

週末、マスク、ザッカーバーグ、サックスが3回の電話でトランプ大統領のAI安全大統領令草案を葬った。Anthropicは同日に300億ドル以上のラウンドをクローズしたが、マイクロソフトはトークン課金が年間AI予算を消費したため、内部のClaude Codeパイロットを静かに中止し、開発者をCopilotに振り向けた。CISAは同週のDrupal SQL脆弱性に対する15,000件の攻撃を記録。初のクロスレジストリサプライチェーン攻撃「TrapDoor」がnpm、PyPI、Crates.ioを同時に攻撃し、.cursorrulesやCLAUDE.md設定ファイルをキャリアとして使用した。そして、ホワイトハウスは国防総省を個人的に覆し、ClaudeをNSA内に留めた。

  • マスク、ザッカーバーグ、サックスが3回の電話でトランプのAI安全大統領令草案を公になる前に葬った
  • Anthropicが300億ドル超のラウンドをクローズする一方、マイクロソフトはトークン費用がAI予算を消費したためClaude Codeパイロットを中止
サイト内本文

Copilot、GeminiなどのAIツールでモデル選択をデフォルトのままにしてはいけない理由

数学者のAdam Kucharski氏が、Microsoft Copilotに同一のデータセットを異なる国ラベルで与えたところ、正確な結果ではなく詳細なステレオタイプを出力しました。思考モデルはこのトリックを見抜けますが、ユーザーが適切に選択する必要があります。

  • Microsoft Copilotは同一データセットでも国ラベルが異なるとステレオタイプを生成する。
  • 思考モデルは誤りを検出できるが、ユーザーがそれを選択する必要がある。
サイト内本文

この頑丈なWindowsタブレットは泥や雨に対応できるが、基本機能は印象的ではなかった

Getac G140は、火災・救助、自動車、公益事業などの過酷な環境向けに設計された頑丈なWindows 11 Proタブレットです。AMD Ryzen AIプロセッサを搭載し、ホットスワップ可能なバッテリーと豊富なポートオプションを備えています。非常に耐久性が高く、Microsoft Copilot+ AIツールを実行できますが、ベンチマークでは性能が低く、重量3.95ポンド(約1.79kg)、画面輝度1000ニットと日光下ではやや暗めです。ニッチな産業用途には理想的ですが、高価(最大4,000ドル)でかさばります。

  • Getac G140は、MIL-STD-810HおよびIP66認証を備えた頑丈なWindows 11 Proタブレットで、過酷な環境向けです。
  • AMD Ryzen AIプロセッサ、最大64GB RAM、2TB SSD、ホットスワップ可能なバッテリーを搭載。
サイト内本文

マイクロソフト、AIのコストが人間の従業員を雇うよりも高いと報告

マイクロソフトはClaude Codeライセンスの大半をキャンセルし、エンジニアをGitHub Copilot CLIに移行している。Uberも4ヶ月で2026年のAIツール予算を使い果たした。専門家は、トークン価格が下がっても消費量が急増し、場合によってはAIの方が人間の労働より高くなると指摘する。

  • マイクロソフトがClaude Codeライセンスをキャンセル、GitHub Copilot CLIを推進。
  • Uberが2026年のAIコーディング予算を4ヶ月で使い切る。
サイト内本文

MicrosoftがFara1.5を公開:ブラウザ操作エージェントファミリー(4B/9B/27B)がOnline-Mind2WebでOpenAI OperatorとGemini 2.5 Computer Useを上回る

Microsoft Researchは、ブラウザ操作エージェントのファミリーであるFara1.5を4B、9B、27Bのサイズで公開しました。Fara1.5-27BはOnline-Mind2Webで72%のタスク成功率を達成し、OpenAI Operator(58.3%)やGemini 2.5 Computer Use(57.3%)を上回りました。また、ゲート付きドメインでのトレーニングを可能にする合成データパイプラインFaraGen1.5も含まれています。

  • Fara1.5はMicrosoft Researchによるブラウザ操作エージェントのファミリーで、Qwen3.5をベースに4B、9B、27Bのパラメータサイズを持つ。
  • Fara1.5-27BはOnline-Mind2Webで72%を記録し、OpenAI OperatorやGemini 2.5 Computer Useを凌駕。
サイト内本文

CopilotKitが2026年のエージェンティックAIスタックを再定義する方法

CopilotKitは2026年に3つの主要ツール(AG-UIプロトコル、AIMockテストスイート、Pathfinderナレッジサーバー)をリリースし、エージェンティックAIの本番環境への移行におけるアーキテクチャ上のギャップを埋めています。これらのツールは、インタラクション、テスト、知識検索の問題を解決し、Fortune 500企業に採用されています。

  • AG-UIプロトコルはエージェントとユーザーのインタラクション層を埋め、リアルタイムストリーミングと動的UI生成をサポートし、Google、Microsoftなどが採用。
  • AIMockは11のLLMプロバイダーを含むエージェントコールチェーン全体をモックし、レコードリプレイ、ドリフト検出、カオステストを提供。
サイト内本文

MicrosoftとEYが提携強化、企業のAI導入を加速

長年のパートナーであるMicrosoftとEYは、企業のAI採用を加速するために協力関係を拡大しました。

  • MicrosoftとEYが長期パートナーシップを拡大
  • 企業AI導入の加速を目指す
サイト内本文

世界の銀行がAnthropicの最新AIモデルを懸念する理由

AnthropicのMythosモデルは、何十年も発見されていなかった数千もの深刻なセキュリティ脆弱性を発見しました。世界中の銀行は、サイバー犯罪者がこのAIを悪用して銀行強盗を試みることを懸念しています。AnthropicはMicrosoftなどの防御連合にアクセスを提供しましたが、オーストラリアや英国、欧州の銀行は含まれていません。

  • Mythosは主要なOSやブラウザに数千のゼロデイ脆弱性を発見。
  • Anthropicは脆弱性修正に1億ドルのクレジットと400万ドルの助成金を拠出。
サイト内本文

Vega:AI時代のデジタルID向けゼロ知識証明

Vegaは、マイクロソフトリサーチが開発したゼロ知識証明システムで、ユーザーが政府発行の証明書を開示せずに事実を証明できるようにします。一般的なデバイスで92ミリ秒未満の証明生成を実現し、フォールディング技術により効率的な再提示が可能で、モバイル運転免許証やEUデジタルアイデンティティウォレットなど現実のフォーマットに対応し、間もなくオープンソース化されます。

  • Vegaは、証明書全体を単一のゼロ知識証明に変換し、必要な情報だけを共有します。
  • 一般的なデバイスで92ミリ秒以内に証明を生成、信頼できるセットアップは不要です。
サイト内本文

Rezonant:プロダクトアイデアをAIエージェント対応のエンジニアリングタスクに変換

Rezonantは、コーディングエージェントを活用するチームのためのプロダクトワークスペースです。プロダクトマネージャーが乱雑なアイデアを構造化された仕様やタスクに変換し、AIコーディングエージェントが直接実行できるようにします。Cursor、Claude Code、GitHub Copilotなどのツールと連携し、Chrome拡張機能「Rezonant Alter」でアイデアをキャプチャします。

  • Rezonantは、プロダクトアイデアをAIエージェントが実行可能なエンジニアリングタスクに変換するワークスペースです。
  • Chrome拡張機能「Rezonant Alter」により、ライブプロダクトからアイデアをキャプチャできます。
サイト内本文

2026年に向けたエンタープライズレベルのエージェンティックAIプラットフォームのベスト

2026年、エンタープライズエージェンティックAIはパイロットから本番へ移行しました。このガイドでは、Salesforce Agentforce、Microsoft Copilot Studio、ServiceNow、LangGraphなど、トップ10のプラットフォームを検証済みの価格、実際の導入データ、正直な制約とともにランク付けし、エンタープライズチームが適切なプラットフォームを選択できるようにします。

  • Salesforce AgentforceはCRMネイティブワークフローに最適、$800M ARR、29,000件の取引。ただしSalesforceエコシステム外では価値が低下。
  • Microsoft Copilot Studioは最も高い導入量:160,000組織、400,000以上のエージェント。Microsoft 365企業に最適。
サイト内本文

コーディングハーネスの使われ方:内省的分析

Tamarillo チームは、Cursor、Copilot、Claude などの AI コーディングアシスタント(ハーネス)の設定ファイルを含む GitHub 上の約 40 万の公開リポジトリを分析しました。調査範囲は市場シェア、採用動向、設定表面の解剖、複数ハーネスの共存、およびスター数・言語・所有者タイプによるリポジトリの人口統計です。これは設定の意図を反映したものであり、実際の使用状況の下限を示します。

  • AI コーディングハーネスの設定ファイルを持つ ~40万の GitHub 公開リポジトリを分析。
  • 市場シェア、採用動向、設定パターン、複数ハーネスの共存をカバー。
サイト内本文

ローカルGitHubセッションをどこでも操作

GitHub Copilot CLIセッションのリモートコントロールがgithub.comとGitHub Mobileで一般提供開始。VS CodeやCLIでセッションを開始し、スマートフォンなど他のデバイスから監視・調整できます。リアルタイム監視、途中での指示変更、権限承認など、プライバシーを保ったままクロスデバイスワークフローを実現します。

  • GitHub Copilot CLIセッションのリモートコントロールがgithub.comとGitHub MobileでGAに。
  • VS CodeとJetBrains IDEでもリモートコントロール対応、複数サーフェスでのワークフローを実現。
サイト内本文

MLflow AI Gateway を使用した LLM トレーシング

MLflow AI Gateway は LLM 呼び出しのトレースを自動的に記録し、エージェンティックアプリやコーディングアシスタントのデバッグを支援します。この記事では、使用方法、LiteLLM との統合、Copilot CLI のサポート、そしてトレーシングがスケーリング問題であることについて説明しています。

  • MLflow AI Gateway はコード変更なしで LLM 呼び出しのトレースを取得できます。
  • LiteLLM を介して Ollama をプロバイダーとするローカルテストが可能です。
サイト内本文

マイクロソフト、Claude Codeライセンスのキャンセルを開始

マイクロソフトは突然、AnthropicのClaude Codeライセンスをキャンセルし、自社のCopilot CLIへの移行を推進している。これは、OpenAIとの緊密な関係にもかかわらず、パートナー製品よりも内部ツールを優先する戦略を示している。この移行は開発者の摩擦を引き起こす可能性があり、ツールの品質と企業のAIインフラ管理との間の緊張を浮き彫りにしている。

  • マイクロソフトはClaude Codeライセンスをキャンセルし、開発者をCopilot CLIへ移行させている。
  • この動きは、パートナーツールよりも内部AIコーディングアシスタントを優先する姿勢を示している。
サイト内本文

AIコーディング版Strava:Copilot/Claude/Codexの使用状況を分析

Microsoftがオープンソースで公開したAI Engineer Coachは、AIコーディングアシスタントのログをローカルで分析し、プラクティススコア、アンチパターン検出、出力メトリクスを提供することで、開発者の効率向上を支援します。

  • Microsoftが公開したAIコーディングアシスタント使用状況分析ツール(完全ローカル動作、プライバシー保護)
  • プラクティススコア、アクティビティタイムライン、45のアンチパターンルールを提供
サイト内本文

GitHub、新しいCopilotアプリでClaude CodeとCodexに対抗

GitHubは、コーディングエージェント、Issue、プルリクエスト、開発セッションを単一インターフェースで管理するスタンドアロンデスクトップアプリ「GitHub Copilotアプリ」のテクニカルプレビューを発表。AnthropicのClaude CodeやOpenAIのCodexと直接競合する。Copilot CLIをベースに、統一インボックス、差分レビュー、セッション履歴、複数エージェント同時実行をサポートし、現在パブリックプレビュー中。

  • GitHubは、コーディングエージェント、Issue追跡、プルリクエスト、セッション管理を統合したスタンドアロンCopilotデスクトップアプリを発表。
  • このアプリはClaude CodeやCodexと直接競合し、GitHubの既存の開発者インフラを活用。
サイト内本文

Show HN: LightningTrack – AI支援開発のための課題トラッカー

LightningTrackは、AI支援開発向けに設計された課題トラッカーです。問題をワンクリックでCopilot、Cursor、またはClaudeのコンテキストプロンプトに変換し、メールから課題作成、スプリント計画、カスタムフィールド、レポート、エージェント対応APIを提供します。

  • 問題をワンクリックでAIツールのプロンプトに変換
  • メール転送で自動的に課題を作成、漏れなし
サイト内本文

AI委任と長期信頼性に関する最近の研究への補足説明

Microsoft Researchは、論文「LLMs Corrupt Your Documents When You Delegate」の意図を明確にし、長期委任タスクにおける情報忠実度の低下を診断するベンチマークであり、AIの実用価値を否定するものではないと述べている。

  • 論文は長期委任ワークフローにおける意味内容の忠実度を評価するベンチマークDELEGATE-52を開発。
  • 最先端モデルは20回の委任反復で19~34%の忠実度低下を示すが、Pythonワークフローでは平均1%未満。
サイト内本文

1つのMarkdownファイルでClaude、Codex、Cursor、Copilotをセットアップ

ai-project-setupというオープンソースプロジェクトは、約7600行のMarkdownブートストラップファイルを提供し、Claude Code、ChatGPT Codex CLI、Cursor、GitHub CopilotなどのAIコーディングアシスタントのルール、セーフティフック、セッション再開、メモリーシステム、バイリンガルGitHubファイルを自動生成します。ファイルをダウンロードしてAIに読み取り実行を指示するだけで、1〜3分で設定が完了し、すべてのツールファイルはgitignoreされ、プロジェクト履歴をクリーンに保ちます。

  • 単一のMarkdownファイル(AI_PROJECT_SETUP.md)がClaude、Codex、Cursor、Copilotの複数AIツールに対応する唯一の情報源。
  • 13セクションのルール、5つのセーフティフック、3層のセッション保存、デュアルライトメモリー、英韓バイリンガルのGitHub標準ファイルを自動生成。
サイト内本文

【AINews】あらゆるものが指揮者

比較的静かなAIニュースの中で、コーディングエージェントの形態がConductorの先駆的アプローチに収束する小さなトレンドが浮き彫りになった。主なトピック:GitHubの新しいCopilot AppがConductorを模倣、OpenAIのCodexモバイル版、LangChainのエージェントインフラ更新(SmithDB、Engine、Labs)、AnthropicのClaude Code制限に対する反発、Figureの24時間自律仕分けライブ配信、拡散言語モデルや時系列予測、メカニスティック解釈可能性などの研究リリース。

  • GitHubはCopilot Appを発表、Conductorに似たエージェント優先UXを採用。YC CEO Garry TanがConductorを公然と支持。
  • OpenAIはCodexをChatGPTモバイルに統合、リモートでのタスク起動・レビュー・実行を可能に。
サイト内本文

JDS:AIコーディング動作を構造化するCopilotスキルスイート

JDS は GitHub Copilot CLI プラグインであり、設計→コード、テスト→実装、証拠に基づく完了検証といった構造化されたワークフローを強制することで、AI コーディングアシスタントを単なるオートコンプリートから規律あるソフトウェアエンジニアに変えます。多段階パイプライン(思考→計画→実行→検証→完了)と、タスクに応じた柔軟/厳格なスキルを備えています。

  • 設計先行、テスト先行、証拠に基づく完了検証を強制。
  • ワークフローはブートストラップ、思考、計画、実行、検証、完了の段階で構成。
サイト内本文

MicrosoftがClaude Codeライセンスの取り消しを開始

Microsoftは6月末までに大部分のClaude Codeライセンスを廃止し、開発者にGitHub Copilot CLIへの移行を促す予定。財務上および戦略上の理由による決定で、Claude Codeの人気にもかかわらず実施される。AnthropicのモデルはCopilot CLI経由で引き続き利用可能。

  • MicrosoftはほとんどのClaude Codeライセンスを取り消し、GitHub Copilot CLIへの移行を推進。
  • 期限は6月30日で、Microsoftの会計年度末に合わせている。
サイト内本文

私はCopilotファンではないが、これら6つの新しいAIスキルがEdgeをお気に入りのモバイルブラウザに変えた

Edgeのモバイルアプリでは、複数のタブの要約をリクエストしたり、ページをポッドキャストに変換したり、閲覧履歴や過去のチャットにアクセスしたりできるようになりました。

  • モバイルEdgeはデスクトップ版の複数のAIスキルを採用:タブ要約、ポッドキャスト生成、クイズ作成。
  • Copilotは複数のタブにわたって質問に答え、閲覧履歴を利用できる。
サイト内本文

Conductor:マルチエージェントAIワークフローのための決定論的オーケストレーション

Conductor は、Microsoft がオープンソース化した CLI ツールで、YAML でマルチエージェントワークフローを定義し、LLM による動的オーケストレーションではなく決定論的ルーティングを採用することでコストとレイテンシを削減します。混合モデル、並列実行、人間によるゲート、スクリプトステップ、Web ダッシュボードをサポートし、コードレビューや研究合成などの構造化ワークフローに最適です。

  • 決定論的オーケストレーション:YAML で定義されたワークフロートポロジ、ルーティングにトークンを消費せず、コストと不確実性を低減。
  • 混合モデル:エージェントごとに異なるモデルとプロバイダ(Claude、GPT など)を指定可能。
サイト内本文

Microsoft EdgeのCopilot、開いているすべてのタブを一度に読み取り、LinkedInでの投稿作成が可能に

MicrosoftはEdgeのCopilot AIチャットボットをアップグレードし、開いているすべてのタブを一度に読み取り、製品比較や記事の要約を可能にしました。新機能には長期記憶、タブをAIポッドキャストに変換するツール、クイズモードが含まれます。

  • Edge Copilotは開いているすべてのタブを同時に読み取り、コンテキストを把握。
  • 製品比較、記事要約、LinkedIn投稿作成に対応。
サイト内本文

Microsoft EdgeのCopilotアップデート:AIが全タブから情報を収集、学習モードやポッドキャスト生成など新機能続々

Microsoft Edgeに大規模なAIアップデートが実施され、Copilotが開いているすべてのタブから情報を収集できるようになりました。質問、製品比較、記事の要約などに対応。MicrosoftはCopilot Modeを廃止し、そのエージェント機能を「Browse with Copilot」に統合します。その他、「学習と研究」モード、タブをAIポッドキャストに変換するツール、AIライティングアシスタント、閲覧履歴アクセス、長期記憶、再設計された新タブページ、モバイル画面共有などの機能が追加されます。

  • Copilotが全タブから情報を収集し、質問や比較、要約が可能に。
  • MicrosoftはCopilot Modeを廃止し、エージェント機能を「Browse with Copilot」に統合。
サイト内本文

Everything Claude Code:AIエージェントツールのパフォーマンス最適化システム

Everything Claude Code は、AIエージェントツール向けのパフォーマンス最適化システムであり、Anthropicハッカソンで受賞しました。スキル、本能、メモリ最適化、継続的学習、セキュリティスキャン、研究優先の開発という完全なシステムを提供します。Claude Code、Codex、Cursor、OpenCode、Gemini、GitHub Copilotなど、複数のAIエージェントツールをサポートし、10ヶ月以上の集中的な実運用で進化してきました。最新のv2.0.0-rc.1では、ダッシュボードGUI、オペレーターワークフロー、ECC 2.0アルファが導入されています。

  • Everything Claude Code はAIエージェントツール向けの包括的なパフォーマンス最適化システムです。
  • スキル、本能、メモリ最適化、継続的学習、セキュリティスキャンなどを含み、複数の主要なAIエージェントツールをサポートします。
サイト内本文

無料のPatronus – AIトラフィックを監視・制御するデバイス上ファイアウォール

Patronus Protectは、デバイス上でAIトラフィックをローカルに監視・制御するAIファイアウォールで、データ主権とプライバシーを確保します。Gemini、Copilot、Ollamaなど複数のプロバイダをサポートし、2026年第2四半期に監視、第3四半期に保護、第4四半期に統合の3フェーズでリリース予定です。主な特徴は可観測性、ゼロトラスト、保護、プライバシーバイデザインです。

  • Patronus Protectはクラウドに依存しないデバイス上AIファイアウォールで、リアルタイム検出と実行を実現。
  • OpenAI、Claude、Geminiなどの主要AIサービスに対応したクロスプロバイダ保護を提供。
サイト内本文

VSCode Copilot Chatにおけるリモートコード実行の脆弱性

研究者がVSCode Copilotのエージェントモードでプロンプトインジェクションの脆弱性を発見。applyPatchツールのTOCTOU脆弱性を悪用し、ユーザーの確認をバイパスして任意のファイル書き込みを実現し、.git/configやシェル設定ファイルを上書きすることでリモートコード実行が可能。

  • Copilotエージェントモードにプロンプトインジェクションの脆弱性があり、悪意のあるGitHub Issueを自動処理する。
  • applyPatchツールにTOCTOU脆弱性:ファイル名変更操作で宛先パスがチェックされない。
サイト内本文

非倫理的なAI企業をボイコットしよう——今すぐ行動を

最近の出来事を受けて、消費者はAI大手に影響力を行使すべき時です。ChatGPTをClaudeに置き換え、Microsoft Copilotの使用を避けましょう。

  • 最近の出来事が非倫理的なAI企業のボイコットを促している
  • ChatGPTをClaudeに置き換える
サイト内本文

Show HN: すべてのMCP互換AIツールに一つのメモリレイヤーを

SubVaultはMCPサーバーで、Claude、Cursor、CopilotなどのAIツールに永続的なメモリを提供します。会話から構造化された知識を抽出し、決定事項、事実、人間関係、プロジェクトコンテキストをセッション間で記憶します。情報は権威性、新しさ、関連性でスコアリングされます。早期アクセス期間中は無料で、セットアップは30秒で完了します。

  • SubVaultはMCP互換のAIツールに永続的なメモリを提供し、会話から構造化知識を抽出します。
  • 情報を権威性、新しさ、関連性でスコアリングし、最も関連性の高いコンテキストのみを提供します。
サイト内本文

RoBrain:AIエージェントの繰り返しミスを防ぐ共有AIメモリ

RoBrainは、AIエージェントを使用するチーム向けのオープンソースの共有メモリです。各開発者のセッションでのすべての決定と却下された代替案を自動的にキャプチャし、新しい決定が以前のものと矛盾する場合にフラグを立てます。チームは元の根拠に基づいて過去の決定を意図的に再検討でき、ゼロから議論し直す必要がありません。Claude Code、Cursor、Copilotに対応しています。

  • 決定、理由、却下されたオプションをキャプチャする共有AIメモリ。
  • Claude Code、Cursor、Copilot間で動作。
サイト内本文

ダンジョン&デスクトップ:GitHub Copilot CLI で手続き型生成ローグライクを構築する

あるHubberがGitHub Copilot CLIを使って、任意のコードベースをユニークなローグライクダンジョンに変える拡張機能を構築した方法を紹介します。BSPアルゴリズムによる手続き型生成、/delegateコマンドの活用法、インストール方法などを詳しく解説。

  • GitHub Dungeons は、リポジトリの最新コミットハッシュをシードとしてBSPでダンジョンを生成するターミナルゲームです。
  • Copilot CLI の /delegate を使うと、タスクを非同期で処理でき、開発者はゲームデザインに集中できます。
サイト内本文

Cplt:AIコーディングエージェントまたはプレーンシェルをカーネルレベルのサンドボックス内で実行

Cplt は、AI コーディングエージェント(GitHub Copilot CLI、OpenCode、Google Gemini CLI など)やプレーンシェルをカーネルレベルで隔離するサンドボックスラッパーです。macOS では Apple Seatbelt、Linux では Landlock LSM + seccomp-BPF を使用し、ファイルシステム、環境変数、ネットワークへのアクセスを制限して機密情報を保護します。

  • AI コーディングエージェント向けのカーネルレベルサンドボックス。macOS と Linux に対応。
  • .env ファイル、SSH 鍵、クラウド認証情報、Git フックなどのアクセスをデフォルトでブロック。
サイト内本文

SocialReasoning-Bench:AIエージェントがユーザーの最善の利益のために行動するかを測定

マイクロソフトリサーチが、プリンシパル・エージェント設定におけるAIエージェントの社会的推論能力を評価するベンチマーク「SocialReasoning-Bench」を発表。テストの結果、最先端モデルはタスクを完了するものの、多くの場合ユーザーにとって最適な結果を得られず、明示的な指示があっても改善されないことが判明。ベンチマークは成果最適性とデューデリジェンスの指標を用いて、エージェントがユーザーの最善の利益のために行動する能力を測定する。

  • SocialReasoning-Benchはカレンダー調整とマーケットプレイス交渉の2つのシナリオでAIエージェントをテストする。
  • 現在のモデルはタスク完了率はほぼ100%だが、成果最適性は低く、多くの場合、ユーザーにとって最適でない結果を受け入れる。
サイト内本文

AIエージェント開発のためのエージェントパターン

経験豊富な開発者向けの、AIコーディングアシスタントを活用するためのリファレンスサイト。各ページは単一の概念を扱い、ツールに依存しない原則とGitHub CopilotやClaude Codeの実践例を提供します。

  • 経験豊富な開発者向けのAIエージェント開発パターン
  • 各ページは「何か」「どう動くか」「いつ使うか」「注意点」を解説
サイト内本文

Copilot BuilderがAI溶接を可能に

MillerWeldsのCopilot Builder with Blue iQ(NovAI搭載)は、AIを活用して溶接の効率と精度を向上させます。

  • MillerWeldsが溶接支援ツールCopilot Builderを発表
  • NovAIによるAI技術を搭載したBlue iQシステムを採用
サイト内本文

Budi – ローカルファーストのAIコーディングコストトラッカー(Rust、ローカルログを追跡、プロキシ不要)

Budiは、オープンソース(MITライセンス)のローカルファーストなAIコーディングエージェント向けコストトラッカーです。Cursor、Claude Code、Codex、Copilot Chatなどのエージェントが既にディスクに書き込んだトランスクリプトファイルを追跡することで動作し、プロキシやネットワークインターセプションは不要です。リポジトリ、ブランチ、チケットごとのコスト帰属、エディタ内のライブステータスバー、セッションヘルスチェック、オプションのチームダッシュボードを提供します。すべてのプロンプト、コード、応答はデフォルトでマシンに留まります。

  • ローカルファースト:プロキシなしでCursor、Claude Code、Codex、Copilot Chatの使用を追跡。
  • 詳細な帰属:リポジトリ、ブランチ、チケット単位でコストを帰属。モデル、ファイル、カスタムタグでフィルタリング可能。
サイト内本文

Gawk Dev:AIツールのライブフィード追跡

Gawk は、Claude、Cursor、Copilot、Windsurf、OpenAI など 38 の検証済みソースを追跡する AI コーディングツール向けのライブステータス・アクティビティモニターです。全体の運用状況、リアルタイムイベントストリーム、各種メトリクスを表示します。

  • 38 の AI コーディングツールとサービスをリアルタイム監視
  • Claude、Cursor、Copilot、Windsurf、OpenAI などの主要プラットフォームをカバー
サイト内本文

Memgraph Ingester:AIエージェントを高速化

Memgraph Ingester は、Java コードベースの構造とエンジニアリングコンテキストを Memgraph に取り込み、クエリ可能な知識グラフとして提供します。AIエージェントはテキスト検索ではなくグラフクエリを通じてコードとプロジェクト知識を推論でき、精度向上、コスト削減、分析高速化を実現します。並列取り込み、ウォッチモード、Claude・Codex・Gemini・GitHub Copilot との連携をサポートします。

  • コードグラフ(ソース構造)とメモリグラフ(エンジニアリングコンテキスト)をプロジェクト単位で作成。
  • JavaParser による Java 25 構文対応、クラスパス指定でシンボル解決を強化。
サイト内本文

ClaudeがOutlook、Word、Excel、PowerPoint間でユーザーを追跡可能に

AnthropicはClaudeのMicrosoft 365での範囲を拡大し、Outlookサポートを追加するとともに、Word、Excel、PowerPointの統合を一般提供開始。これにより、Claudeは単一の会話内でアプリ間のコンテキストを維持できるようになる。

  • ClaudeがOutlookの公開ベータ版サポートを追加し、Word、Excel、PowerPoint統合を一般提供。
  • アプリ間のコンテキスト永続化により、タスクの再説明なしでシームレスなワークフロー移行が可能に。
サイト内本文

AI時代における低忠実度(LoFi)シグナルの役割の変化

Microsoft Security Community Blogが、AI時代における低忠実度シグナルの新たな役割について、脅威インテリジェンスと防御における重要性を強調して論じています。

  • 低忠実度シグナルはAIの進歩により新たな重要性を帯びている。
  • Microsoft Security Blogがこの変化を分析。
サイト内本文

バイトダンス、AI拡大に300億ドル以上を計画、中国製チップに大きく賭ける

バイトダンスは2026年のAI支出計画を2000億元(約300億ドル)に引き上げ、従来計画から少なくとも25%増加させる。TikTokの親会社は中国製チップへの依存を強めている。それでも、Google、Amazon、Microsoft、Metaが合計で計画する7250億ドルには及ばない。

  • バイトダンスの2026年AI予算を2000億元(300億ドル)に増額、少なくとも25%増
  • AIインフラに中国製チップを採用し始める
サイト内本文

企業ナビゲーション