LangChain AI ニュース

ソース分布

LangChain Blog36
Hacker News AI4
arXiv Machine Learning3
KDnuggets2
Machine Learning Mastery2
arXiv AI1
Latent Space1
NVIDIA Blog1

トピック分布

Agent50
研究32
モデル18
政策10
チップ8
スタートアップ1

タイムライン

2026-06-1713
2026-06-306
2026-06-254
2026-07-024
2026-07-084
2026-07-094
2026-07-033
2026-06-162

最新動向

AIエージェントアーキテクチャの教育ラボ

2026-07-12 00:33 UTC+9

LangChainとローカルOllamaサーバー上に構築されたAIエージェントアーキテクチャの教育ラボ。チャット、ツール呼び出し、RAG、ハイブリッド、エージェンティックRAGなど、複数のバリアントを提供。

チャット、ツール呼び出し、RAG、ハイブリッド、エージェンティックRAGをカバーする複数のAIエージェントアーキテクチャバリアント。
LangChainとローカルOllamaサーバーに基づき、OpenRouterもオプションでサポート。

OpenWiki Brains：AIエージェントのためのプロアクティブメモリ

2026-07-11 01:46 UTC+9

OpenWiki Brainsは、LangChainが提供する新しいフレームワークで、Gmail、Notion、Gitなどのソースに接続し、ローカルWikiを自動更新することで、AIエージェントにプロアクティブなメモリを提供します。

OpenWiki Brainsは外部ソースをエージェントが利用可能なローカルWikiに変換します。
パーソナルブレイン（個人向け）とコードブレイン（コード文書化）の2つのモードがあります。

Perplexity Agent API、LangGraph、LangSmithを使用した監査可能なVCリサーチエージェントの構築

2026-07-10 00:58 UTC+9

Perplexity Agent API、LangGraph、LangSmithを使用して、引用付きの投資メモを90秒で生成するベンチャーキャピタルリサーチエージェントの構築方法を学びます。エージェントは、チーム、財務、製品、市場の4つの並列リサーチノードを実行し、7つのセクションからなるメモを合成します。すべての主張は一次情報源に遡ることができ、出力は監査可能です。また、3つの検索プロバイダーの比較と、同様のエージェントを構築するためのポイントを提供します。

Perplexity Agent API、LangGraph、LangSmithを使用したエージェントは、約90秒、約0.40ドルで引用付きの投資メモの初稿を生成します。
4つの並列リサーチノード（チーム、財務、製品、市場）が証拠を収集し、ツールを持たない合成器がメモを作成します。

LLMオーケストレーションフレームワーク比較：LangChain vs. LlamaIndex vs. 生API呼び出し

2026-07-10 00:38 UTC+9

LangChain、LlamaIndex、生API呼び出しのLLMアプリケーションにおける利点とトレードオフを比較し、適切な抽象化レベルの選択フレームワークを提供する。

LangChainは複雑なワークフローとエージェントのオーケストレーションに優れるが、オーバーヘッドとデバッグの複雑さが増す可能性がある。
LlamaIndexはRAG（検索拡張生成）に特化し、強力なデータ取り込みとインデックス機能を備える。

LangChainとNVIDIA、NemoClaw Deep Agents Blueprintを発表

2026-07-09 00:04 UTC+9

LangChainとNVIDIAが協業し、LangChain Deep Agents Code、NVIDIA Nemotron 3 Ultra、OpenShellを組み合わせた、オープンでガバナンスが効くエンタープライズエージェント向けブループリント「NemoClaw」を発表。評価では、リーディングパフォーマンスを約10分の1の推論コストで実現。

NemoClawブループリントは、LangChainのエージェントフレームワーク、NVIDIAのオープンモデルNemotron 3 Ultra、セキュアなランタイムOpenShellを統合。
LangChainのエージェント評価スイートでスコア0.86、コスト4.48ドルを達成。競合モデルの43.48ドルに対し、推論コストを約10分の1に削減。

モデルではなくハーネスを調整する：Nemotron 3 Ultra実践ガイド

2026-07-09 00:00 UTC+9

Nemotron 3 Ultraのハーネス（足場）のみを調整することで、Deep Agentsスイートで最高0.86を達成し、Opus 4.8の最高0.87にほぼ匹敵し、コストは約10分の1に削減。本稿では、評価駆動のアプローチ、プロンプトエンジニアリング、ミドルウェアの最適化、効果がなかった点について詳述する。

ハーネスのみの調整で、Nemotron 3 UltraはDeep Agentsで最高0.86を達成し、Opus 4.8の0.87に迫り、1回の実行コストは約10分の1。
評価はハーネス作業のトレーニングデータ：各変更はトレース駆動ループを経て、まず低コストでスクリーニングし、試行を繰り返して勝利が確認でき、後退がない場合のみ保持。

NVIDIA Nemotron、LangChain Deep Agents Harnessでベンチマーク首位を達成

2026-07-09 00:00 UTC+9

NVIDIA Nemotron 3 Ultraは、最も広く採用されているAIエージェントオーケストレーションプラットフォームにおいて、トップクローズドモデルよりも低コストでリーディングパフォーマンスを提供。LangChainがNemotron 3 Ultra向けにDeep Agentsハーネスをチューニングした結果、オープンモデルで最高の精度を達成し、より多くのタスクを高いスループットで完了、実行あたりの推論コストは主要クローズドモデルの10分の1に抑えられました。

LangChainがNVIDIA Nemotron 3 Ultra向けにチューニングしたDeep Agentsハーネスは、オープンモデルで最高精度を達成。推論コストはクローズドモデルの10分の1。
パフォーマンス向上は全てモデル周辺環境のエンジニアリングによるもので、モデルの再トレーニングは不要。

NVIDIA NemoClaw 上の Deep Agents Code：最も機密性の高いコードのためのガバナンスブループリント

2026-07-09 00:00 UTC+9

Deep Agents Code が NVIDIA NemoClaw のガバナンスブループリントとして利用可能に。デフォルト拒否ネットワーク、人間による承認、監査ログにより、機密コードのモダナイゼーションを安全に実行。

Deep Agents Code (dcode) は NemoClaw ブループリントとして、オープンモデル Nemotron 3 Ultra を搭載し、ソース、モデル、監査証跡を完全に制御。
デフォルト拒否ネットワーク、人間による承認、完全な監査証跡により、規制対象チームに必要な管理機能を提供。

brAIn：NATSバス上のリアクティブAIエージェントノード、チャットループの代わりに

2026-07-08 23:50 UTC+9

brAIn は、従来のチャットループモデルを廃し、NATS パブ/サブバス上の長寿命デーモンノードアーキテクチャを採用した新しい AI エージェントフレームワークです。ノードはリアクティブで、関連するメッセージが到着したときのみ起動し、トークン消費を回避します。各ノードは独自の UI を持ち、分散デプロイが可能で、優先度プリエンプションや MCP クライアント統合などの機能を備えています。著者は、環境認識エージェント、Slack リスナー、IoT コントローラーなどの実際の使用例をデモで示し、LangGraph、AutoGen、ROS 2 などの既存ツールとのアーキテクチャ比較も行っています。

brAIn は NATS バスを使用した多対多通信を実現し、ノードは長寿命のデーモンプロセスとして動作し、イベント駆動で起動する。
各ノードは独立した UI を持ち、ローカルまたはリモートで実行可能で、複数マシンに分散配置できる。

[AINews] Lilian WengがRSIのためのハーネス工学に関する35本の論文を要約

2026-07-08 11:20 UTC+9

このAINews号は2026年7月6日から7日までの幅広いAI開発をカバーしています。ハイライトには、Lilian Wengによる再帰的自己改善のためのハーネス工学への深掘り、MetaのMuse ImageとMuse Videoの発表（エージェント生成ループを備える）、Anthropic、LangChain、Googleによるエージェントプラットフォームの主要製品アップデートが含まれます。その他注目点：NVIDIAのAudexオーディオモデル、Cohereのアラビア語ASR、Hugging FaceとNVIDIAとのロボティクス統合、Liquid AIのAntidoom（推論ループ失敗削減）、Anthropicの論争を呼んだJ-space解釈可能性研究。また、エージェントと法律AIのベンチマーク、研究自動化、推論効率の進歩もカバーしています。

Lilian Wengのブログ記事は、再帰的自己改善を直接の重み変更ではなくハーネス工学的アプローチに焦点を当て直し、目標と文脈の指定にハーネス工学が重要であると強調。
MetaのMuse ImageとMuse Videoは、計画、ツール使用、自己改善を伴うエージェント生成を示し、公開リーダーボードで急速に上位にランクイン。

エージェントの改善はデータマイニングの問題である

2026-07-08 00:05 UTC+9

LangChainがエージェントのトレースをマイニングして障害を発見し、フロンティアLLMよりも安価な評価モデルを微調整し、評価でパフォーマンスを向上させる方法。

トレースのマイニングは改善のためのシグナルを提供する
オープンモデルの微調整と複合エージェントシステムは大規模なトレースデータの処理を支援する

シュナイダーエレクトリックがLangSmithでエンタープライズLLMOps基盤を構築した方法

2026-07-08 00:00 UTC+9

シュナイダーエレクトリックはLangSmithを活用して、AI製品の可観測性、評価、展開を大規模に改善するエンタープライズLLMOps基盤を構築しました。350人の専門家からなるAIハブは60以上のエージェントを展開。可観測性（セルフホスト型LangSmith、製品ごとに1つのワークスペース）、評価（オフライン/オンライン評価と成熟度フレームワーク）、展開（製品ごとに独立したランタイム）の3本柱を紹介。内部AIアシスタントOne Jo、CSMコパイロット、文書処理エージェントの事例で大幅な効率向上を示しています。

シュナイダーエレクトリックはLangChainエコシステム上に60以上のAI製品を構築
セルフホスト型LangSmithでデータプライバシーとコンプライアンスを確保

Deep Agents：包括的なオープンソースエージェントハーネス

2026-07-03 13:33 UTC+9

Deep Agents は LangChain が開発したオープンソースのエージェントハーネスで、長期的かつ複数ステップのタスク向けに設計されています。サブエージェント、ファイルシステム、コンテキスト管理、シェルアクセス、永続メモリ、人間による承認などの機能を内蔵しています。モデルに依存せず、LangGraph 上に構築されており、LangSmith によるプロダクション対応も可能です。

LangGraph 上に構築された、意見が反映され拡張可能なエージェントハーネス。
サブエージェント、ファイルシステム、コンテキスト管理、シェルアクセス、永続メモリ、人間参加型の承認を内蔵。

複雑なタスクを実行 – Claude FableモデルによるLangChainリポジトリ分析

2026-07-03 08:01 UTC+9

5つのClaudeモデル（Opus、Fable、Sonnet、Sonnet 4.6、Haiku）をLangChain Pythonモノレポの完全監査で比較した詳細な実験。FableはOpusと同じA-の評価を得たが、実行可能なマイルストーンとクイックウィンの生成で優れていた。各モデルの強みと弱みを示し、マルチモデルパイプラインを推奨。

5つのClaudeモデルがLangChainの4フェーズ監査でテストされた。
FableはA-を獲得し、最も実用的な改善計画を作成した。

コーディングエージェントの請求書が倍増した。修正方法はこちら。

2026-07-03 02:29 UTC+9

コーディングエージェント（Claude Code、Cursor、Copilotなど）の利用が急増し、請求書が制御不能になっています。本記事では、「トークンマキシング」現象の背後にある断片化の問題を分析し、可視化、コスト標準化、最適化、ガバナンスの4段階のソリューションを提示し、マルチツール環境でのAIコスト管理を支援します。

コーディングエージェントの請求書は、ツールの断片化によって制御不能になり、各ツールの記録形式が統一されていない。
LangSmithは統一されたトレースモデルを提供し、ツール間でセッションのコストと効率を比較できる。

2026年に知っておくべき10のエージェンティックAIフレームワーク

2026-07-02 23:00 UTC+9

2026年のエージェンティックAIフレームワーク10選を包括的に紹介。LangGraph、CrewAI、OpenAI Agents SDK、Google ADK、PydanticAI、smolagents、Mastra、Microsoft Agent Framework、Strands Agents、LlamaIndex Workflowsを取り上げ、それぞれの強み、最適なユースケース、開発者へのトレードオフを分析。

LangGraphは複雑なステートマシンと人間参加型のワークフローに最適な制御を提供。
CrewAIは役割ベースのマルチエージェントプロトタイプを迅速に構築。

OpenWiki：コーディングエージェントのためのオープンソースリポジトリドキュメント

2026-07-02 02:58 UTC+9

OpenWikiはコードベースのドキュメントを自動生成・維持するオープンソースエージェントです。コーディングエージェントがリポジトリのコンテキストを効率的に取得できるようにします。

OpenWikiはコードベースのWikiを自動生成し、更新を維持します。
エージェントの指示ファイルに参照を追加し、エージェントが必要に応じてドキュメントを取得できるようにします。

Deep AgentsでのRLMの使用方法

2026-07-02 00:38 UTC+9

再帰的言語モデル（RLM）は、エージェントがコードを書いてコンテキストチャンクに対してサブエージェントをディスパッチすることで、コンテキスト腐敗を修正します。Deep Agentsは現在、動的サブエージェントと軽量コードインタプリタを通じてRLMをサポートし、エージェントが大規模入力に対してgrep、map、reduceのようにプログラム的に作業を分散できるようにします。OOLONGベンチマークでは、RLMは長いコンテキストタスクでターンバイターンエージェントよりも優れた成績を示しました。

RLMはコードを使用してコンテキストチャンクに対して再帰的にサブエージェントを呼び出し、コンテキストウィンドウの制限を回避します。
Deep Agentsは動的サブエージェントとコードインタプリタでRLMを実装します。

PendoがLangSmithを使用してNovusをユーザー行動からコード修正までトレースする方法

2026-07-02 00:00 UTC+9

Pendoは、行動データとセッションリプレイをコード修正に変換するAIプロダクトエージェントNovusのデバッグ、評価、モニタリングにLangSmithを活用しました。LangSmithの本番トレーシングにより、PendoはNovusを数日で本番稼働させ、成功率90%以上を達成し、新ユースケースの特定に25%の時間短縮、顧客が気づく前に60%のAI問題を捕捉しました。

Novusはライブアプリケーションのユーザビリティ問題を検出し修正するプロダクトエージェントです。
LangSmithトレースは、エージェントの意思決定のデバッグ、コスト監視、プロンプト改善に役立ちました。

Harbor x LangChain：エージェント評価のための統一スタック

2026-07-01 00:22 UTC+9

Harborは長期実行・ステートフルなエージェントのための新しい評価ハーネスで、LangChainのDeep Agents、LangSmithサンドボックス、可観測性と統合し、スケーラブルで隔離された評価を提供します。本記事ではHarborの仕組みと、レジストリやプラグインを介したLangGraphエージェントの統合方法を解説します。

Harborはlanggraph.jsonレジストリとmake_graphファクトリでエージェントを接続し、モデルに依存しません。
LangSmithサンドボックスは各試行に隔離環境を提供し、水平スケーリングで数百の並列実行が可能です。

Wikiメモリ

2026-06-30 23:46 UTC+9

本記事では、エージェントが生のソースデータをコンパクトで永続的、構造化された知識層に変換する「Wikiメモリ」パターンを紹介します。RAGとは異なり、高レベルの合成を事前計算します。DeepWiki、KarpathyのLLM Wiki、FactoryのAutoWikiなどの例を挙げ、生データ、圧縮形式、メンテナンスに関する未解決の質問について議論し、ファイルとエージェントが一般的な答えであると結論付けています。

Wikiメモリは、エージェントを使用して生データを再利用可能な知識ベースに圧縮するパターンで、RAGとは異なる。
例：コードドキュメント用のDeepWiki、汎用ファイル用のKarpathyのLLM Wiki、FactoryのAutoWiki。

家電レベルのエネルギー異常検知とLLM駆動の推奨のためのエージェンティックAIパイプライン

2026-06-30 13:00 UTC+9

本論文では、オフィスビルにおける家電レベルのエネルギー監視のために、深層時系列予測、変分異常検知、LLM推論を組み合わせたエンドツーエンドのエージェンティックパイプラインを提案する。システムはハイブリッドSSA-LSTM予測モデルと家電別LSTM VAEアテンションを用いて異常を検出し、3段階のLangChainパイプライン（コンテキスト、診断、レポートエージェント）で診断を生成する。16シナリオのベンチマーク評価では、最高バックエンドが90.4/100を獲得し、ローカル7Bモデルが全シナリオに合格した。

SSA-LSTM予測とLSTM VAEアテンションを組み合わせた異常検知パイプライン
3段階のLangChainエージェントパイプライン：コンテキスト、診断、レポートエージェント、動的検索機能

エージェントツール使用のベンチマーク

2026-06-30 10:27 UTC+9

LangChain は、LLM のツール使用能力を評価するための4つの新しいテスト環境を公開しました。関数呼び出し、計画、推論などのスキルをカバーします。テストでは、GPT-4、Claude 2.1、GPT-3.5、およびオープンソースモデル（Mistral 7b など）を比較。主な発見：GPT-4 は関係データタスクで最高得点だが、長い軌道では失敗；Claude 2.1 は3つのタスクで GPT-4 と同等；オープンソースモデルは複数関数の組み合わせが苦手；計画は依然として困難。

LangChain が LLM のツール使用を評価する4つのベンチマークを発表（タイプライター（単一・26ツール）、関係データ、マルチバース算数）。
GPT-4 は関係データタスクで最高得点だが、単純な長期的タスクでも失敗。

抽出ベンチマーク：GPT-4、Claude、オープンソースLLMのチャットログからの構造化データ抽出比較

2026-06-30 10:27 UTC+9

LangChainは、チャットログから構造化情報を抽出するLLMの能力を評価するための新しいベンチマークデータセットを公開しました。データセットの作成プロセス、評価指標、GPT-4、Claude-2、Code Llama 2などのモデルのベンチマーク結果を詳述します。実験により、GPT-4が多くの指標で最良であり、オープンソースモデルは構造化出力に課題があることが示されました。

LangChainがチャットログの構造化抽出ベンチマークデータセットを公開。
GPT-4がClaude-2やオープンソースモデルをほとんどの指標で上回る。

Deep Agentsにおける動的サブエージェントの導入

2026-06-30 01:17 UTC+9

動的サブエージェントにより、AIエージェントはツール呼び出しではなくコードを使用して作業を大規模にオーケストレーションできます。Deep Agentsのプログラムによるオーケストレーションがどのようにカバレッジを保証し、ファンアウトを処理し、一般的なオーケストレーションパターンとリアルタイムトレースを使用して信頼性の高いマルチステップの複雑なエージェントパイプラインを実現するかを学びます。

動的サブエージェントは、ツール呼び出しに代えてコードによるプログラム的オーケストレーションを使用し、大規模な信頼性を向上させます。
確定的なカバレッジと複雑なオーケストレーション（ループ、分岐、並行処理）を可能にし、マルチフェーズパイプラインやファンアウト＋合成が信頼性高く実行できます。

LangSmithを活用したCandidlyのステートアウェアエージェントハーネスの構築方法

2026-06-30 01:09 UTC+9

Candidlyは、入力出力隠れマルコフモデル（IO-HMM）を用いて会話トレースからユーザーのエンゲージメント状態をリアルタイムに推測し、それに基づく応答ポリシーにより離脱率を低減するエージェントハーネスを構築しました。4つの状態（Engaged、Detailed、Guided、Disengaging）を識別し、離脱状態の割合を23%から11%に削減します。

CandidlyはIO-HMMを使用し、軽量なトレース特徴からユーザー状態をモデル化し、結果予測でAUC 0.90を達成。
4つのエンゲージメント状態（Engaged 53%、Detailed 7%、Guided 17%、Disengaging 23%）が発見され、解決率は78%から30%まで異なる。

ディープエージェントのプロンプトキャッシング

2026-06-27 02:13 UTC+9

Deep Agentsがプロンプトキャッシングを活用し、追加設定不要で主要モデルプロバイダーのLLMトークンコストを最大80%削減する方法をご紹介します。

プロンプトキャッシングは、プロンプト処理後のモデル状態を保存することで、推論トークンコストを41〜80%削減します。
プロバイダーごとにキャッシュ制御のサポートが異なり、プロバイダーに依存しない最適化は困難です。

2026年6月：LangChainニュースレター — Fleetオンコールコパイロット、Deep Agentsルーブリックなど

2026-06-26 02:42 UTC+9

LangSmithの新機能：アラートトリアージ用のFleetオンコールコパイロット、エージェントのコンピュータ使用、音声トレースデバッグ、実験ステータストラッキング。さらにDeep Agentsルーブリック、プログラムによるサブエージェント、新しいLangSmithデプロイメントコース、そしてシカゴ、ベルリン、ワシントンDC、ラスベガスでのイベント。

Fleet On-Call Copilot：コード、トレース、ランブックを活用してアラートをトリアージし、更新ドラフトを作成するプリビルドエージェントテンプレート。
コンピュータ使用：エージェントが隔離された仮想コンピュータを使用してコード、ファイル、認証API呼び出しを実行可能に。

最高のAIエージェントがシンプルである理由：SierraのZack Reneau-WedeenがMax Agencyポッドキャストで語る

2026-06-25 23:36 UTC+9

Max Agencyポッドキャストで、Zack Reneau-WedeenはAIエージェントの未来について語り、シンプルなアーキテクチャ、成果ベースの価格設定、組織図の押し付けを避けることを提唱。Sierraでの顧客向けエージェント構築の経験から得た洞察を共有。

シンプルなエージェントアーキテクチャが複雑なマルチエージェントシステムより優れている
成果ベースの価格設定が高価値タスクのインセンティブを調整

KlarnaのAIアシスタントが8500万のアクティブユーザー向けにカスタマーサポートを大規模に再定義した方法

2026-06-25 05:08 UTC+9

KlarnaはLangGraphとLangSmithを活用したAIアシスタントにより、700人のフルタイムスタッフ相当の業務を処理し、顧客問い合わせ解決時間を80％短縮、反復的なサポートタスクの約70％を自動化しました。

KlarnaのAIアシスタントはLangGraphとLangSmithで構築され、250万以上の会話を処理し、700人のフルタイムスタッフに相当する作業を実行。
平均顧客問い合わせ解決時間を80％削減し、反復的なサポートタスクの約70％を自動化。

LangSmithとLangChain OSSがEU AI Actの要件を満たす方法

2026-06-25 04:56 UTC+9

EU AI Actの遵守期限は2026年8月2日です。本記事では、EU AI ActがハイリスクAIシステムに求める要件と、LangSmithおよびLangChain OSSが各要件をどのように満たすかを説明します。

EU AI ActはハイリスクAIシステムにリスク管理、自動ログ記録、透明性、人間による監視、市販後監視を要求します。
LangSmithはエンドツーエンドのトレーシングでエージェントの入力、推論、ツール呼び出し、出力をすべてキャプチャします。

AIエージェントにメモリを組み込む方法

2026-06-25 01:11 UTC+9

AIエージェントにメモリを追加する実践的なガイド。短期・長期記憶の概念、トレース分析、LangSmithツールを使ったメモリループの実装により、エージェントが実行間で学習し改善する方法を解説します。

メモリによりエージェントはユーザーの好みや修正を記憶し、繰り返しの指示を減らせる。
短期記憶は現在のタスク、長期記憶は事実やスキルを保持する。

Pythonでブラウザを使用するAIエージェントを構築する

2026-06-22 21:00 UTC+9

この記事では、Playwright、browser-use、LangGraphを使用して、実際のWebサイトを閲覧・操作できるAIエージェントをPythonで構築する方法を解説します。トピックは、PlaywrightがSeleniumよりも優れている理由（30～50%高速、永続的WebSocket、内蔵自動待機、リアルなイベント）、環境設定手順、動的ページのスクレイピング、複数ステップのフォーム入力、アンチボット検出対策、セッション永続化、Dockerへのデプロイです。コード例を通じて、Webサイトをナビゲートし、フォームに記入し、構造化データを抽出し、LLMで意思決定を行う実用的なブラウザエージェントを作成します。

Playwrightは、永続的なWebSocket接続によりSeleniumより30～50%高速で、内蔵の自動待機と実際のマウス/キーボードイベントを備えている。
環境設定はPython 3.10+、OpenAI APIキー、pipインストール（Playwrightブラウザバイナリを含む）のみで完了する。

LangSmith、コード不要のエージェントビルダーを発表

2026-06-19 02:32 UTC+9

LangSmith は、メモリ、ガイド付きプロンプト、MCP ツールを備えた AI エージェントをコード不要で作成できるエージェントビルダーをリリース。会話形式のガイダンス、組み込みメモリ、サブエージェントにより、エージェント開発のハードルを下げ、内部生産性向上のユースケースに適しています。

LangSmith Agent Builder はコード不要で、メモリとガイド付きプロンプト作成を提供。
エージェントはプロンプト、ツール、トリガー、サブエージェントの4つのコアコンポーネントで構成。

NAVI-Orbital: 地球観測のためのゼロショット視覚言語モデルの初の軌道上実証

2026-06-18 13:00 UTC+9

本論文は、低軌道宇宙船に展開されたソフトウェアシステムNAVI-Orbitalを紹介する。2026年4月16日、NAVI-Orbitalは、視覚言語モデルが完全にオンボードで自律的なマルチモーダル推論を実行する初の軌道上実証を達成した。Gemma 3モデルを使用して各シーンを分類し、テキスト記述を生成し、自然言語対話でオペレーターに応答する。グラフベースのステートマシン（LangGraph）によって調整される。地上ベンチマークで88.16%の精度を達成し、軌道上でも未校正のYAM-9画像を処理。セマンティック圧縮により帯域幅プロファイルを逆転させる可能性を示す。

初の軌道上ゼロショット視覚言語モデルによる自律マルチモーダル推論
Gemma 3とLangGraphを使用した自然言語によるタスク再割り当てと対話

AIアシスタントを自作した方法とその理由

2026-06-17 23:00 UTC+9

本稿では、既存のツールを使わずにカスタムAIアシスタントを自作した理由、アーキテクチャ、技術スタック、LLMやLangChain、メモリ管理、ツール統合を含む実装プロセスを詳述している。

自作AIアシスタントは、制御力、データプライバシー、ワークフローのカスタマイズにおいて優れる。
スタックはGPT-4o、LangChain、SQLite永続メモリ、DuckDuckGo検索などのツールで構成。

マルチエージェント大規模言語モデルシステムにおける並行処理異常の検証済み検出と防止

2026-06-17 13:00 UTC+9

本研究は、マルチエージェントLLMシステムにおける状態共有に起因する並行処理異常に対処し、TLA+を用いて4つの異常タイプを形式化し、機械検証済みの一貫性階層L0～L4を構築した。274のVerus証明義務により、検出器の健全性と完全性が証明された。3つのRustランタイムがL0～L1を実装し、ByteDanceのdeer-flowやLangGraphにおける実際の異常を再現し、検証済みの修正を提供した。

マルチエージェントLLMシステムにおける4つの並行処理異常をTLA+仕様として形式化
274のVerus義務を用いて機械チェックされた一貫性階層L0～L4を初めて構築

Factory社がLangSmithを活用してフィードバックループを自動化し、反復速度を2倍に向上

2026-06-17 03:11 UTC+9

Factory AIはLangSmithの可観測性とフィードバックAPIを活用して製品フィードバックループを最適化し、反復速度を2倍に向上させ、開発サイクルの大幅な短縮を実現しました。

FactoryはLangSmithをAWS CloudWatchと統合し、可観測性とデバッグを強化。
LangSmithのFeedback APIにより、プロンプト最適化を自動化し、手作業を削減。

Open SWEの紹介：オープンソースの非同期コーディングエージェント

2026-06-17 03:08 UTC+9

Open SWEは、オープンソースでクラウドホスト型のコーディングエージェントであり、GitHubのタスク（計画、コーディング、テスト、PR作成）を自律的に処理します。マルチエージェントアーキテクチャ、ヒューマンインザループ制御、非同期実行を特徴としています。

Open SWEは、GitHubと直接統合するオープンソースの非同期クラウドコーディングエージェントです。
マルチエージェントアーキテクチャ（プランナー、プログラマー、レビューア）を使用してコード品質を確保します。

Monte Carlo：LangGraph と LangSmith でデータ+AI 可観測性エージェントを構築

2026-06-17 03:08 UTC+9

Monte Carlo は LangGraph を基盤に AI トラブルシューティングエージェントを構築し、LangSmith でデバッグすることで、データチームが問題をより迅速に解決できるようにしました。このエージェントは複数の調査経路を並列に探索し、根本原因分析を加速します。

Monte Carlo は LangGraph を使用して動的グラフを作成し、トラブルシューティングを自動化・並列化。
LangSmith は開発初期からプロンプトの可視化と迅速な反復を可能にした。

LangSmith ベンチマークの共有

2026-06-17 03:07 UTC+9

LangSmithは、公開ベンチマークと評価データセットの共有機能を開始し、開発者が異なるLLMアーキテクチャのパフォーマンスを同じタスクで比較できるようにしました。最初のベンチマークはLangChainドキュメントのQ&Aデータセットで、langchain-benchmarksパッケージもリリースされました。記事では、さまざまなモデルとアーキテクチャのパフォーマンスを分析し、デバッグ方法を提供しています。

LangSmithは評価データセットと結果の共有をサポートし、コミュニティ駆動のベンチマークを容易にします。
最初のベンチマークはLangChainドキュメントのQ&Aデータセットで、RAGシステムの総合的な回答能力をテストします。

LangSmith: 製品ホームページの刷新とリソースタグによる整理の改善

2026-06-17 03:07 UTC+9

LangSmith のホームページは、可観測性、評価、プロンプトエンジニアリングの3つのセクションに再編成されました。また、リソースタグが改善され、アプリケーションやカスタムタグで柔軟にリソースをグループ化できます。オンボーディングガイドと今後のABACにより、ユーザビリティが向上します。

ホームページは可観測性、評価、プロンプトエンジニアリングの3セクションに分割。
リソースタグは「アプリケーション」またはカスタムタグで柔軟なグループ化が可能。

エージェントエンジニアリング：新たな分野

2026-06-17 03:06 UTC+9

エージェントエンジニアリングは、プロダクト思考、エンジニアリング、データサイエンスを統合し、反復的な構築、テスト、出荷、観察、改善のサイクルを通じて非決定論的なLLMシステムを信頼性の高い本番体験に変える新しい分野です。Clay、Vanta、LinkedIn、Cloudflareなどの企業が実践しています。

エージェントエンジニアリングは反復プロセス：構築、テスト、出荷、観察、改善、繰り返し。
プロダクト思考（スコープと動作の定義）、エンジニアリング（インフラ構築）、データサイエンス（測定と改善）を組み合わせる。

LangSmithでファインチューニングされたオープンソースモデルをテストする

2026-06-17 03:06 UTC+9

LangSmithを使用してファインチューニングされたオープンソースLLMを評価・比較する方法を紹介。複数のモデルをテストし、評価を自動化して最適なAIを選択します。

LangSmithはUIとAPIを提供し、評価データセットの作成が容易。
Llama2-7b（78k行）とLlama2-13b（10k行）をSQL生成用にファインチューニング。

エージェント改善ループにおける人間の判断

2026-06-17 03:04 UTC+9

AIエージェントは、チームが長年培ってきた知識と判断を反映するときに最も効果的に機能します。この記事では、トレーダー向けコパイロットの例を用いて、ワークフロー設計、ツール設計、コンテキストエンジニアリングに人間の判断を組み込む方法を解説し、自動評価とモニタリングによる改善ループを紹介します。

エージェントには専門家の暗黙知が必要
ワークフロー、ツール、コンテキストの設計に人間の判断を組み込む

Deep Agentsのコンテキスト管理

2026-06-17 03:04 UTC+9

Deep Agents SDKは、オフロード、要約、ファイルシステム抽象化を通じて、長時間実行されるAIタスクのコンテキストを管理し、コンテキスト腐敗を防ぎます。本記事では、3つの圧縮技術（大規模ツール結果のオフロード、大規模ツール入力のオフロード、要約）の仕組みと実践ガイドを紹介します。

Deep Agents SDKは、LLMのメモリ制限に対処するため、コンテキスト圧縮技術（オフロードと要約）を採用。
3つの圧縮技術は異なる閾値でトリガー：大規模結果のオフロード（20Kトークン超）、大規模入力のオフロード（85%超）、要約（85%超でオフロード不可）。

ループ工学の芸術

2026-06-17 01:59 UTC+9

信頼性の高いAIエージェントを構築するには、単に優れたモデルを使うだけでなく、ループを慎重に設計することが重要です。この記事では、エージェントループ、検証ループ、イベント駆動ループ、山登りループという4つのネストされたループを紹介し、LangChainプリミティブを使って各レベルを実装する方法を示します。エージェントをエコシステムに組み込み、継続的に改善することで、模倣困難な競争優位を構築できます。

エージェントループ：モデルがツールを繰り返し呼び出してタスクを完了する基本ループ。
検証ループ：出力を評価しフィードバックすることで品質を保証する。

Fleetが汎用チャットと専門エージェントの両方を提供する理由

2026-06-17 00:50 UTC+9

Fleetは、アドホックなタスクと繰り返し発生する責任の両方をサポートします。汎用チャットと専門エージェントがどのようにチームの作業委任を支援するかをご覧ください。

一時的なタスクには汎用チャット、繰り返しのタスクには専門エージェントを使用。
専門エージェントは、指示、ツール、モデル、サブエージェント、スキル、トリガー、永続的なメモリを設定可能。

覚えておいて、再読み込みは不要：トークン効率的な自律実験のためのステートフルReActエージェント

2026-06-16 13:00 UTC+9

本研究は、従来の無状態自律実験パターンを、LangGraphを用いたステートフルReActエージェントに再構築し、毎回の反復でコンテキストを再構築する必要性を排除。ハイパーパラメータ調整で90%、コード最適化で52%のトークン削減を達成しつつ、最適化品質を維持する。

無状態の自律実験は毎回反復で全履歴を再読み込みし、O(n²)のトークンコストが発生する。
提案するステートフルエージェントはLangGraphの永続状態とツール呼び出しインターフェースにより、反復あたりのコストをO(1)に削減。

Fireworksでコスト100分の1のトレースジャッジを構築

2026-06-16 02:06 UTC+9

LangChainとFireworksはオープンモデルをファインチューニングし、プロダクショントレースから知覚エラーシグナルを抽出。フロンティアモデル並みの性能をわずかなコストで実現。

LangSmithは毎日数十億のトークンのトレースデータを処理。
Qwenモデルをファインチューニングして「知覚エラー」を検出、性能は最先端と同等以上でコストは100分の1。

LangChain

ソース分布

トピック分布

タイムライン

最新動向

AIエージェントアーキテクチャの教育ラボ

OpenWiki Brains：AIエージェントのためのプロアクティブメモリ

Perplexity Agent API、LangGraph、LangSmithを使用した監査可能なVCリサーチエージェントの構築

LLMオーケストレーションフレームワーク比較：LangChain vs. LlamaIndex vs. 生API呼び出し

LangChainとNVIDIA、NemoClaw Deep Agents Blueprintを発表

モデルではなくハーネスを調整する：Nemotron 3 Ultra実践ガイド

NVIDIA Nemotron、LangChain Deep Agents Harnessでベンチマーク首位を達成

NVIDIA NemoClaw 上の Deep Agents Code：最も機密性の高いコードのためのガバナンスブループリント

brAIn：NATSバス上のリアクティブAIエージェントノード、チャットループの代わりに

[AINews] Lilian WengがRSIのためのハーネス工学に関する35本の論文を要約

エージェントの改善はデータマイニングの問題である

シュナイダーエレクトリックがLangSmithでエンタープライズLLMOps基盤を構築した方法

Deep Agents：包括的なオープンソースエージェントハーネス

複雑なタスクを実行 – Claude FableモデルによるLangChainリポジトリ分析

コーディングエージェントの請求書が倍増した。修正方法はこちら。

2026年に知っておくべき10のエージェンティックAIフレームワーク

OpenWiki：コーディングエージェントのためのオープンソースリポジトリドキュメント

Deep AgentsでのRLMの使用方法

PendoがLangSmithを使用してNovusをユーザー行動からコード修正までトレースする方法

Harbor x LangChain：エージェント評価のための統一スタック

Wikiメモリ

家電レベルのエネルギー異常検知とLLM駆動の推奨のためのエージェンティックAIパイプライン

エージェントツール使用のベンチマーク

抽出ベンチマーク：GPT-4、Claude、オープンソースLLMのチャットログからの構造化データ抽出比較

Deep Agentsにおける動的サブエージェントの導入

LangSmithを活用したCandidlyのステートアウェアエージェントハーネスの構築方法

ディープエージェントのプロンプトキャッシング

2026年6月：LangChainニュースレター — Fleetオンコールコパイロット、Deep Agentsルーブリックなど

最高のAIエージェントがシンプルである理由：SierraのZack Reneau-WedeenがMax Agencyポッドキャストで語る

KlarnaのAIアシスタントが8500万のアクティブユーザー向けにカスタマーサポートを大規模に再定義した方法

LangSmithとLangChain OSSがEU AI Actの要件を満たす方法

AIエージェントにメモリを組み込む方法

Pythonでブラウザを使用するAIエージェントを構築する

LangSmith、コード不要のエージェントビルダーを発表

NAVI-Orbital: 地球観測のためのゼロショット視覚言語モデルの初の軌道上実証

AIアシスタントを自作した方法とその理由

マルチエージェント大規模言語モデルシステムにおける並行処理異常の検証済み検出と防止

Factory社がLangSmithを活用してフィードバックループを自動化し、反復速度を2倍に向上

Open SWEの紹介：オープンソースの非同期コーディングエージェント

Monte Carlo：LangGraph と LangSmith でデータ+AI 可観測性エージェントを構築

LangSmith ベンチマークの共有

LangSmith: 製品ホームページの刷新とリソースタグによる整理の改善

エージェントエンジニアリング：新たな分野

LangSmithでファインチューニングされたオープンソースモデルをテストする

エージェント改善ループにおける人間の判断

Deep Agentsのコンテキスト管理

ループ工学の芸術

Fleetが汎用チャットと専門エージェントの両方を提供する理由

覚えておいて、再読み込みは不要：トークン効率的な自律実験のためのステートフルReActエージェント

Fireworksでコスト100分の1のトレースジャッジを構築

企業ナビゲーション

OpenAI

Anthropic

DeepSeek

Google

Meta

Microsoft

NVIDIA

Mistral

Hugging Face

LangChain