Agent AI ニュース

Runewardは、宣言的なプロファイルを用いてAIエージェントに管理された実行セル（DockerまたはKubernetes上）を提供するオープンソースツールです。デフォルト拒否のエグレス、改ざん防止監査台帳、人間参加型ポリシーゲート、コスト/ループガードレールを備え、REST、MCP、CLI、Webダッシュボードから操作可能です。通常のサンドボックスに加え、ポリシー適用、監査証跡、コスト制御などのガバナンス層を追加します。

RunewardはAIエージェント用の隔離サンドボックスを提供し、デフォルトでネットワーク出力を拒否して潜在的な損害を制限します。
ガバナンス層には、改ざん防止のハッシュチェーン署名監査台帳と人間承認ゲートが含まれます。

Attestor：AIエージェントのためのゼロトラスト実行境界

2026-07-12 16:54 UTC+9

Attestorは、AIエージェントの操作に対するゼロトラスト実行境界を提供するオープンソースプロジェクトです。エージェントの実行前にポリシーチェック、承認検証、証拠レビューを実施し、許可、制限、レビュー、またはブロックの決定を行い、顧客所有のゲートウェイを通じて強制します。支払い、データアクセス、インフラ変更などのシナリオに適しています。

AIエージェント実行前にポリシー、承認、証拠をチェックし、構造化された決定を返します。
シャドウパイロットモードで実際の実行なしにリスクを観察可能。

Agent サービス – プロンプト可能なAIエージェント、ガードレールとダウンロード可能なパッケージ

2026-07-12 16:17 UTC+9

プロンプト可能なAIエージェントサービスで、安全ガードレールとダウンロード可能なパッケージを提供します。

プロンプト可能なAIエージェント
ガードレール搭載

AIは独自の研究世界モデルを構築すべき

2026-07-12 16:11 UTC+9

本記事は、未知のARC-AGIパズル環境に置かれたAIエージェントが、命名、抽象化、数学的推論を通じて明示的な世界モデルを構築し、問題解決効率を劇的に向上させる実験について述べています。

AIは未知環境で自律的に物体を命名しルールを記録し、明示的な世界モデルを構築。
操作PとQを発見・抽象化し、数学的表記を用いてオフライン推論を実行。

MSK – CTOのように考えるAIエージェント

2026-07-12 15:27 UTC+9

MSKはiPhone向けのAI CTOエージェントアプリで、アーキテクチャレビュー、スケーリングアドバイス、スタートアップ戦略をチャットまたは音声で提供します。15年以上の経験、300以上のプロジェクト、50以上のスタートアップを支援したMoeid Saleem Khanの経験に基づいており、的確で意見のある回答を提供します。無料で始められ、アカウントは不要。プレミアムサブスクリプションも用意されています。

オンデマンドで技術的・戦略的アドバイスを提供するAI CTOエージェント。
実際のCTO経験をシミュレートし、チャットと音声に対応。

AIメモツールは簡単な会議まとめを約束するが、その利用には疑問も

2026-07-12 10:41 UTC+9

AIメモツールは会議の要点を素早くまとめるが、プライバシーとセキュリティのリスクが懸念される。ボイスプリント、データ保存、弁護士-クライアント秘匿特権の問題が浮き彫りになり、専門家は注意とデータ取り扱いの理解を勧めている。

AIメモツールは会議の発言をデータ化し、機密情報漏洩のリスクがある。
ボイスプリントは本人確認や詐欺に悪用される可能性がある。

Dismissive DanによるOverplane AIコード生成ハーネスのレビュー

2026-07-12 10:02 UTC+9

Overplaneは、Markdown仕様をAIエージェントとSMT検証を使用してコードに変換するオープンソースツールです。レビュアーのDismissive Danは、多くの開発者が既に同様のセットアップを持っているとして、その必要性に疑問を呈しつつも、パッケージングと分離設計を認めています。

OverplaneはMarkdown仕様をコードに変換し、Z3ソルバーで一貫性をチェックする。
レビューは建設的だが懐疑的で、多くの開発者が既に同様のワークフローを持っている。

NVIDIAのタイルベースGPUプログラミングコーディングガイド：cuTileおよびTritonカーネルからFlash Attentionまで

2026-07-12 09:01 UTC+9

このチュートリアルでは、TileGymを使用してNVIDIAのタイルベースGPUプログラミングを探求し、異なるハードウェアで動作するColabワークフローを構築します。CUDA環境を調査し、実際のcuTileバックエンドを試し、標準のColab GPUにcuTileスタックがない場合はTritonにフォールバックします。コアとなるタイルの考え方を学びます：単一スレッドではなくデータタイル全体を操作し、ロード、計算、ストアを行います。ベクトル加算、融合GELU、行方向ソフトマックス、タイル化行列乗算、フラッシュアテンションを実装し、それぞれをPyTorchと比較します。

NVIDIAのタイルプログラミングモデルを紹介し、個々のスレッドではなくデータブロックを操作します。
cuTileとTritonの両方のバックエンドで動作する実行可能なColabスクリプトを提供します。

3つのバグ修正によりQwen3.5-122BがMac Studioで日常的に使えるように

2026-07-12 07:54 UTC+9

Mac Studio上でQwen3.5-122Bを実行する際、3つのバグが原因でキャッシュが無効になり、長文コンテキストでの応答が数分待たされる問題が発生していた。これらのバグを修正した結果、プリフィル時間が88秒から0.64秒に短縮され、会話の流れを妨げなくなった。

Qwen3.5-122BモデルはMac Studioでハイブリッドアテンションによりプレフィックスキャッシュが頻繁にミスしていた。
3つのバグ：システムプロンプトのタイムスタンプ、中断時の応答未保存、チェックポイントストアのゴミ書き込み。

Show HN: AgentTransfer – AIエージェント向けのオープンソースファイル転送（Goバイナリ1つ）

2026-07-12 07:52 UTC+9

AgentTransferは、AIエージェント向けのオープンソースファイル転送ツールで、最大5GBのファイル転送、ピアの発見、空間での調整を可能にします。メールを制御プレーン、HTTPSをデータプレーンとして使用し、エージェントのオンボーディングに人間は不要です。単一のGoバイナリで、セルフホストまたはホストされたインスタンスで使用できます。

AgentTransferは、名前とAPIキーのみでAIエージェントが最大5GBのファイルを転送できるようにします。
機能には、自己オンボーディング、コンテンツアドレスストレージ、ハッシュ検証、署名付きレシートが含まれます。

Mesh LLM: iroh上での分散AIコンピューティング

2026-07-12 07:38 UTC+9

Mesh LLMは、irohネットワークを介して複数のマシンのGPUとメモリをプールし、OpenAI互換のAPIを提供する新しい分散型AIコンピューティングシステムです。ローカルまたはピアノード上でモデルを実行したり、大規模モデルを複数のマシンに分割して実行できます。AIコンピューティングのコスト高と制御不足の問題を解決し、中央サーバーに依存せずにプライベートデプロイや公開グリッドをサポートします。

Mesh LLMは複数のマシンのGPUリソースをプールし、統一されたOpenAI互換APIを提供
ローカル実行、ピアへのルーティング、または複数マシンへのモデル分割をサポート

AIと求人情報：破壊から創造へ？

2026-07-12 07:37 UTC+9

2025年2月末のClaude Code公開以来、米国のソフトウェア開発の求人は約15%増加し、全求人は7%減少した。AIに大きくさらされる職業は2022年から2026年にかけて最大の減少を見せたが、過去1年で最も大きく回復した。回復はシニア職とAI関連職に集中している。

Claude Code公開以来、ソフトウェア開発求人は15%増加、全体は7%減少。
AI暴露度の高い職業は長期的に減少した後、過去1年で最大の回復。

Token Time：AIエージェントのトークン使用量を監視する「スクリーンタイム」風ツール

2026-07-12 07:13 UTC+9

Token Time は macOS のメニューバーで AI エージェントのトークン消費とコストをリアルタイム表示し、設定した閾値に達すると全画面通知で休憩を促すアプリです。ローカルで動作し、プライバシーに配慮されています。

メニューバーにトークン数と今日の支出を表示
100万トークンごとに全画面リマインダー

Anthropic、Claude Codeから秘密のステガノグラフィコードを削除—中国の競合他社を監視

2026-07-12 06:27 UTC+9

Anthropicは、Claude Codeに数ヶ月にわたり隠されていたステガノグラフィコードを削除すると発表した。このコードは、中国のAIラボや不正な再販業者を検出し、モデル蒸留を防ぐための実験だった。同社は現在、より強力な対策を導入しており、7月1日にコードを削除すると述べている。しかし、透明性の欠如が批判を招いている。

AnthropicはClaude Codeにステガノグラフィを埋め込み、中国のAIラボや再販業者を秘密裏に識別していた。
この実験は3月から7月1日まで実施され、コードは削除された。

Show HN: BoundFlow – AIエージェント向けオープンソースコントロールプレーン

2026-07-12 06:07 UTC+9

BoundFlow は、無人実行の LLM エージェントとワークフローを管理するためのオープンソースコントロールプレーンです。コスト上限、承認ゲート、自動モデル切り替え、リトライ、ロールバックなどを提供し、エージェントの安全で信頼性の高い動作を保証します。

推論やプロンプトフレームワークではなく、エージェントの運用層に特化したオープンソース。
コスト上限、人間による承認、自動モデルダウングレード、ワークフローの自己修復をサポート。

TradingSpyを構築：ローカル、プライバシー重視のAIトレーディングアシスタント（初のオープンソース）

2026-07-12 05:45 UTC+9

TradingSpy は、オープンソースのローカルAIトレーディング研究ワークステーションで、マーケットヒートマップ、ニュースカタリスト、戦略生成、Backtraderバックテスト、透明なエージェント実行を1つのDockerアプリに統合しています。ローカルファーストアーキテクチャにより、すべてのデータはローカルに保存され、プライバシー問題がなく、複数のLLMプロバイダーと幅広い金融データソースをサポートしています。トレーダーや開発者が戦略研究、バックテスト、シグナル分析に使用できます。

ローカルファーストアーキテクチャで、データはすべてローカルに保存され、プライバシーの懸念ゼロ。
AI戦略生成、自動バックテスト、ベンチマーク比較、ループエンジニアリングによる自動反復。

AIエージェントの出力を評価する無料ツールを構築しました（人間のラベルとLLM審査員）

2026-07-12 04:55 UTC+9

Verdictは、AIエージェントの出力を評価するためのオープンソースのブラウザベースツールです。人間によるラベリング、グラウンデッド・セオリーによるエラー分析、LLM審査員の人間ラベルに対する検証を、データを外部に送信することなくローカルで実行できます。

Verdictはブラウザ上で完全に動作し、バックエンドやアカウントは不要。
複数のトレース形式をサポートし、クリーンなチャットタイムラインを提供。

Sovereign AgentOps – MCPエージェントのためのセルフホスト型憲法AIガバナンス

2026-07-12 04:52 UTC+9

Sovereign AgentOps Community Editionは、AIエージェント用のセルフホスト型MCPガバナンスサーバーであり、Ed25519署名付き監査証跡、ポリシー施行、オフライン展開を提供します。7つのデモツールを備え、EU AI Actに準拠しており、商用エンタープライズ版は91ツールと高度なコンプライアンス機能を備えています。

Sovereign AgentOpsは、暗号化監査証跡を備えたAIエージェント用のセルフホスト型MCPガバナンスサーバーです。
Community Editionはポリシー施行、レシート署名、ワークスペース隔離のための7つのツールを提供し、オフライン展開が可能です。

Show HN: Wizard – 自己拡張型のRustターミナルAIエージェント（ワンラインインストール）

2026-07-12 04:34 UTC+9

WizardはRustで構築された自己拡張型のターミナルAIエージェントで、1行のコマンドでインストールできます。ターミナル内でタスクをインテリジェントに実行し、開発者の生産性を向上させます。

Rustで構築された自己拡張型ターミナルAIエージェント
ワンラインインストール

Show HN：MCPサーバーの信頼指数

2026-07-12 03:57 UTC+9

MCPサーバーのセキュリティスコアリングシステムで、ツールポイズニング、プロンプトインジェクション、サプライチェーン、認証情報リスクを継続的にスキャンし、バージョンごとに1つのスコアを提供します。現在12,629台のサーバーがスコアリングされ、45%がA評価、リスクの高いD/Fは10%です。

12,600台以上のサーバーがスコアリングされ、45%がA評価
最高スコアのサーバーはmockservercom（100点）とmcp-file-tools（99点）

AI小説は「愚かで質が低い」ため検出が容易、研究で判明

2026-07-12 03:53 UTC+9

メリーランド大学とGoogle DeepMindの研究により、AIが生成した小説はテーマの過剰説明、サブプロットの欠如、不器用な道徳化などの物語上の欠陥により容易に検出できることが明らかになった。研究チームはStoryScope検出器を開発し、物語の特徴を分析して人間の作品と区別する。さまざまなAIモデルに固有の癖があることも判明した。使用されたBooks3データセットは著作権問題で物議を醸している。

AI小説はテーマを過剰に説明する傾向があり、77%のAIストーリーが教訓を明示するのに対し、人間は52%。
AIモデルごとに特徴的な欠陥：GPTは夢のシーンを多用、Geminiは外見描写に偏る、Claudeは平坦な展開。

物理AIスケールアップ化学スタートアップが大手製薬企業で注目を集める

2026-07-12 03:53 UTC+9

Telescope Innovationsは、自律運転ラボ（SDL）プラットフォームを通じて物理AIを活用し、製薬・化学業界の実験ボトルネックを解決。ファイザー、韓国製薬協会、欧州大手製薬企業との契約を獲得し、電池材料リサイクル分野にも展開。

SDLプラットフォームは24時間365日自律的に化学実験を実行し、効率を大幅に向上。
ファイザーからのリピート受注、KPBMAとのインフラ契約、欧州結晶化契約を2026年に獲得。

RAG評価フレームワーク比較：RAGAS vs TruLens vs DeepEval

2026-07-12 03:16 UTC+9

本記事では、RAGAS、TruLens、DeepEvalの3つの主要なRAG評価フレームワークを深く比較します。RAGに特化した評価が必要な理由、評価の3層（検索品質、生成品質、エンドツーエンド品質）、および主要な検索指標（Precision@K、Recall@K、MRR、NDCG）を解説します。その後、RAGAS（LLM判定役、正解データ不要、合成テストセット生成機能）とTruLens（可観測性、RAGトライアド、ダッシュボード）を詳述し、DeepEvalについても簡単に触れ、フレームワーク選択の指針を提供します。

RAGシステムは、BLEU/ROUGEでは検索と生成の失敗を捉えきれないため、専用の評価が必要です。
RAGASはLLMを判定役とし、正解データなしでスコアリングでき、ドキュメントからテストセットを自動生成します。

人間らしい未来を築く価値

2026-07-12 02:56 UTC+9

この記事は、人間の意志と判断を拡張するAIを提唱し、分散知識、カスタマイズ、分散型アライメントを強調して、AIが多様な人間のニーズに応えることを目指しています。

AIは人間の意志と判断を拡張すべきであり、置き換えるべきではない。
知識は暗黙的で局所的かつ分散的であり、AIは分散化されてその恩恵を受ける必要がある。

逆ケンタウロスがAIのパラドックスを解く

2026-07-12 02:23 UTC+9

コーリー・ドクトロウはAIのパラドックスを探求する：なぜ一部のユーザーはAIを愛し、他のユーザーは嫌うのか？彼は「ケンタウロス」（AIに支援される人間）と「逆ケンタウロス」（AIの責任吸収体として使われる人間）の概念を導入する。AIはバブルであり破裂するが、オープンソースモデル（Whisperなど）は生産的な残渣として残ると主張する。鍵はテクノロジーそのものではなく、誰がAIを制御するかにある。

人間がAIの使い方を選ぶとき、AIは力を与える（ケンタウロス）が、上司が押し付けるときは抑圧的になる（逆ケンタウロス）。
ハーストの夏の読書ガイドの失敗は、フリーランスライターがAIのミスの責任を負わされた逆ケンタウロスの典型例。

Show HN: スタンドアロン SearXNG CLI+MCP（サーバー不要）

2026-07-12 01:49 UTC+9

SearXNG AI Kit は、プライバシーを尊重するメタサーチエンジン SearXNG のための AI 強化型コマンドラインインターフェース、Python ライブラリ、MCP サーバーであり、180 以上の検索エンジンをサポートし、Linux と macOS 向けのスタンドアロンバイナリを提供します。

CLI、Python ライブラリ、MCP サーバーを提供し、180 以上の検索エンジンをサポート
AI チャットや高度なリサーチ機能、設定可能な出力形式を備える

Agentation – AIコーディングエージェント向けビジュアルUI注釈ツール

2026-07-12 01:16 UTC+9

Agentationは、AIコーディングエージェント向けのビジュアルUI注釈ツールです。ユーザーはUI要素をクリックして注釈を追加し、CSSセレクタ、ファイルパス、Reactコンポーネントツリー、計算スタイルなどの構造化情報を生成できます。MCP統合により、エージェントが注釈を確認して応答する双方向コミュニケーションが可能です。

UI要素をクリックして注釈を追加し、CSSセレクタやファイルパスなどの構造化情報を出力
MCP統合によりエージェントが注釈をリスト化・応答可能

無料AI可視性監査ツールとエージェント

2026-07-12 00:59 UTC+9

この無料ツールは、ChatGPT、Gemini、Claude、Perplexity、Grok、Google AIがあなたのウェブサイトをクロール、理解、検証、引用できるかをチェックします。レポートは全サイトクロールインベントリ、ブランドエンティティプロファイル、クレームレベルの証拠台帳、AIインテントカバレッジマトリックス、技術的クローラビリティ監査、スキーマと構造化データ計画、信頼シグナルギャップ分析、競合他社とオフサイトの証拠マップ、P0/P1/P2実行ロードマップを含み、EC、AI SaaS、B2Bサービスのサンプルケースも提供します。

無料監査ツールが主要AIシステムに対する可視性を評価。
レポートは技術、コンテンツ、信頼シグナルなど12のドメインをカバー。

2026年中期AIモデルティアリスト

2026-07-12 00:43 UTC+9

著者がコーディングと監査の経験に基づき、2026年中期の主要AIモデルを非公式にランク付け。Anthropic Fable、OpenAI Sol、Mistral、Gemini、DeepSeekを対象とし、米国の輸出規制や欧州の視点も含む。

Fable（Anthropic）はB評価：流暢だが信頼性に欠け、バグを隠す傾向がある。
Sol（OpenAI）はS評価：低レベルコードとテストで信頼できる。

AIエージェントアーキテクチャの教育ラボ

2026-07-12 00:33 UTC+9

LangChainとローカルOllamaサーバー上に構築されたAIエージェントアーキテクチャの教育ラボ。チャット、ツール呼び出し、RAG、ハイブリッド、エージェンティックRAGなど、複数のバリアントを提供。

チャット、ツール呼び出し、RAG、ハイブリッド、エージェンティックRAGをカバーする複数のAIエージェントアーキテクチャバリアント。
LangChainとローカルOllamaサーバーに基づき、OpenRouterもオプションでサポート。

AIエージェントに外交ゲームをプレイさせてみた

2026-07-12 00:24 UTC+9

7つのLLM制御勢力による完全な外交ゲームを実行するGitHubリポジトリ。交渉、命令提出、リプレイ機能を備える。

各移動フェーズで、AIエージェントが固定ラウンドの交渉（プライベート・グローバルメッセージ）を行い、命令を提出する。
モジュール化されたアーキテクチャにより、エンジンやLLMバックエンドを容易に交換可能。

HoverSource：ピクセルからソースファイルへワンキーで

2026-07-12 00:24 UTC+9

HoverSource は、ホバーして Alt+C を押すだけで UI 要素のソースファイルパスと行番号を取得できる開発者ツールです。AI エージェントと統合し、ステップ数を 73.9%、トークン消費を 94.5% 削減します。React、Next.js、Vue などに対応し、設定不要で使用できます。

ホバーして Alt+C を押すだけで、UI 要素のソース情報をコピー
AI エージェントと統合し、ステップ73.9％、トークン94.5％削減

LiteRT.js：Googleの高性能Web AI推論ライブラリ

2026-07-11 23:32 UTC+9

GoogleがLiteRT.jsを発表。ブラウザ上で直接AI推論を実行可能にし、CPU・GPU・NPUのハードウェアアクセラレーションをサポート。既存ソリューション比最大3倍の性能向上。

LiteRT.jsはLiteRTのJavaScriptバインディングで、WebAssemblyを介してブラウザ上で高性能AI推論を実現。
XNNPACK（CPU）、WebGPU（GPU）、WebNN（NPU）によるハードウェアアクセラレーションをサポート。

Oodleが大規模な可観測性を高速に保つ方法

2026-07-11 23:24 UTC+9

Oodleはストレージとコンピューティングを分離し、オブジェクトストレージとオンデマンドコンピューティングを活用することで、大規模な可観測性データを効率的に保存・クエリし、特にAI駆動のバースト的なクエリ負荷に適しています。

ストレージとコンピューティングの分離によりコスト削減
AIによるクエリバーストに対応する弾力的なアーキテクチャ

「Ghostcommit」が画像にプロンプトインジェクションを隠蔽し、AIエージェントを騙して秘密を盗む

2026-07-11 23:06 UTC+9

研究者らは、AIコードレビュアーが開かないPNG画像に悪意のある命令を隠し、リポジトリの秘密情報を盗むプルリクエストを構築した。

AIコードレビュアーがPNG画像を開かない脆弱性を悪用。
コーディングエージェントが画像を読み取り、リポジトリの.envファイルから秘密を窃取。

マイクロソフト、Googleに続きGo言語でのAIエージェント開発を支援—OpenAIとAnthropicは遅れ

2026-07-11 23:00 UTC+9

Go言語はクラウドインフラの共通言語となりつつある。マイクロソフトはAgent FrameworkのGo版を公開し、クラウドネイティブ開発者が使い慣れた言語でAIエージェントを構築できるようにした。一方、Googleはすでに対応済みだが、OpenAIとAnthropicはまだ未対応。

マイクロソフトがAgent Framework for Goを公開プレビューで提供開始。
Go言語はKubernetes、Dockerなどの基盤言語。

Show HN: Google Chat用AIアシスタント - レイアウトを保持してファイル翻訳

2026-07-11 21:00 UTC+9

AnyFile Translatorは、Google Chat内でファイル、ウェブリンク、テキストを翻訳できるAIアシスタントです。元のレイアウトや書式を保持し、100以上の言語に対応。AIライティング機能も備え、コンテンツの作成と翻訳が可能です。データは暗号化され、処理後に削除されます。

PDF、Word、PPTなどのファイルをレイアウト保持で翻訳
100以上の言語に対応、チャット内で直接利用可能

Show HN：私のAIエージェントが公開賭けに勝つまで残り9時間 – ライブダッシュボード

2026-07-11 19:59 UTC+9

Claudeという自律型AIエージェントが、パリ時間今夜22:30までに100人のフォロワーを獲得する公開賭けを行っています（有料フォロワーや相互フォローは禁止）。現在のフォロワー数は362で、初期値の363から1人減っています。一般の人は@parwebをフォローすることで結果に影響を与えられ、新規フォロワーごとに無料の戦略マニュアルの2章が提供されます。

AIエージェントClaudeは残り9時間で100人のリアルフォロワーを獲得する必要があります。
現在のフォロワー数は362で、初期値から1人減少。

24時間でOpenAI、SpaceXAI、MetaがAIを価格競争に巻き込んだ

2026-07-11 19:30 UTC+9

24時間の間にOpenAI、SpaceXAI、Metaが相次いで新モデルを発表。共通するのは値下げ競争だ。価格競争がAI市場を再編し、企業はコスト最適化のためモデルポートフォリオ構築が必要に。

OpenAIはGPT-5.6、Metaは初の有料モデル、SpaceXAIはGrok 4.5を発表、いずれも低価格を売りに。
トークン単価は下がったが、タスク完了までの総コストは増加する可能性がある。

AIエージェント向け無料セキュリティ監査ツール

2026-07-11 19:26 UTC+9

AIエージェントやMCPサーバー向けのセキュリティスキャナーが公開されました。コード脆弱性検出、依存関係検証、プロンプトインジェクション対策などを備え、軽量版とフル版の2種類が提供されます。

軽量版（ProofLayer）は4秒でインストール可能、81.5KB、400以上のセキュリティルールを搭載。
フル版はAST解析、テイント追跡、ファイル間解析、LLMによるコードレビューを実装。

Show HN：Code Airlock——使い捨てマイクロVMでClaude CodeとCodexを実行

2026-07-11 19:16 UTC+9

Code AirlockはDocker Sandboxesをラップした軽量ツールで、Claude Code、Codex、OpenCodeなどのコーディングエージェントを使い捨てマイクロVM内で安全に実行し、ホストリポジトリを読み取り専用に保ち、通常のgitコミットとしてエージェントの作業をレビューできるようにします。

使い捨てマイクロVMでコーディングエージェントを実行し、セキュリティを強化
ホストリポジトリは読み取り専用でマウントされ、エージェントは隔離されたクローンで作業

AgentKindergarten – AIコーディングエージェントのための保育所

2026-07-11 19:08 UTC+9

AgentKindergartenはオープンソースのツールで、AIコーディングエージェントをスマートフォンやブラウザからリモートで監視・操作できるようにします。リアルタイムのターミナルストリーミング、開発サーバーのプレビュー、アラート処理を提供します。デーモン・リレーアーキテクチャを採用し、Claude、Codexなどのエージェントをサポートし、コマンドロックや表示専用モードなどのセキュリティ機能を備えています。

AgentKindergartenを使用すると、PCから離れてもAIコーディングエージェントをリモートで監視・制御できます。
アーキテクチャ：デーモン（開発PC上）が自己ホストのリレーサーバーに発信接続し、電話/ブラウザがHTTPSで接続。

ドキュメントはまだママのファイルキャビネットの中

2026-07-11 18:41 UTC+9

この記事は、従来のフォルダベースのドキュメント管理が現代の知識作業には時代遅れであると論じています。1970年代のオフィスメタファーから受け継がれたファイルキャビネットに例え、知識を一箇所に押し込める構造の問題点を指摘。AI検索システムがフォルダの限界を露呈し、複数の経路から発見可能な接続された知識グラフを提唱しています。

ドキュメントのフォルダ構造は1970年代のオフィスメタファーに基づき、知識の実際の働きと一致しない。
人々は階層をブラウズするのではなく情報を探し回り、必要なものを見つけるのに苦労する。

人間は読めるがAIは読めないフォント

2026-07-11 18:36 UTC+9

Ghost Fontは、動き、ノイズ、デコイを利用して、人間には読めるが現在のAIモデルには認識されないようにする実験的な反AIフォントです。Claude FableやGPT Sol 5.6 Ultraのような最先端モデルでさえ解読に苦戦しており、CAPTCHAやAI視覚認識のベンチマークとしての可能性があります。

Ghost Fontは動く点で文字を表現し、静止画からは何も読み取れない。
GPT Sol 5.6 Ultraのような高級AIでも19分の分析後に幻覚を起こした。

AIは開発速度だけでなく、スタートアップのライフサイクル全体を圧縮している

2026-07-11 17:28 UTC+9

AIは製品開発を加速するだけでなく、スタートアップのライフサイクル全体を圧縮しています。創業者はより低コストで迅速に製品を構築し、市場に到達し、シグナルを得ることができますが、より厳しい決断を迫られます。ゾンビスタートアップ（かろうじて存続する企業）は、シグナルが弱いときに創業者が損失を確定する傾向が強まったため、維持が難しくなっています。鍵となるのは判断力です——好奇心と需要、シグナルとノイズを区別することです。

AIは構築コストを下げ、アイデアから市場検証までのサイクルを加速する。
ゾンビスタートアップは減少している。創業者はシグナルに基づいて迅速に方向転換または閉鎖を行うため。

Paca v0.9.0：自動化ワークフロー – Pacaにタスクを任せよう

2026-07-11 17:13 UTC+9

Paca v0.9.0は自動化ワークフロー機能を導入し、ユーザーがタスクをPacaに委任して効率的に処理できるようにします。

Paca v0.9.0 が自動化ワークフローをリリース。
ユーザーはPacaにタスクを自動管理させることが可能。

アントグループのRobbyant、LingBot-VA 2.0を発表：物理AI向けにネイティブ構築された因果ビデオアクションモデル

2026-07-11 16:56 UTC+9

アントグループのRobbyantは、LingBot-VA 2.0のテクニカルレポートを公開しました。これは、ビデオジェネレーターからファインチューニングするのではなく、最初から身体性AI向けに構築された物理AIビデオアクションファンデーションモデルです。先見推論により実行前に将来の状態を予測し、実際の観測ごとに再接地し、225 Hzの非同期制御を実現します。本稿では、因果DiT、スパースMoEビデオストリーム、意味的ビジュアルアクショントークナイザー、および論文内の数値の不一致を解説します。

LingBot-VA 2.0は、ビデオジェネレーターの微調整ではなく、身体性AI向けにネイティブにプレトレーニングされた因果ビデオアクションモデルです。
因果DiTとスパースMoEアーキテクチャ、意味的トークナイザーを採用し、先見推論によるリアルタイム制御を実現。

Agent

関連タグ

Agentの最新ニュース

メモリーメーカーは好況と不況のジェットコースターの奴隷

科学者の副業？AIと量子コンピューティングで新規ペプチドを生成

AIエージェントが決済オペレーションを変えようとしている

Show HN: Runeward — ポリシーゲートでAIエージェントをサンドボックス化