ディープエージェントのプロンプトキャッシング
Deep Agentsがプロンプトキャッシングを活用し、追加設定不要で主要モデルプロバイダーのLLMトークンコストを最大80%削減する方法をご紹介します。
- プロンプトキャッシングは、プロンプト処理後のモデル状態を保存することで、推論トークンコストを41〜80%削減します。
- プロバイダーごとにキャッシュ制御のサポートが異なり、プロバイダーに依存しない最適化は困難です。
Technical tool blog; verify individual post terms before full body display.
Deep Agentsがプロンプトキャッシングを活用し、追加設定不要で主要モデルプロバイダーのLLMトークンコストを最大80%削減する方法をご紹介します。
LangSmithの新機能:アラートトリアージ用のFleetオンコールコパイロット、エージェントのコンピュータ使用、音声トレースデバッグ、実験ステータストラッキング。さらにDeep Agentsルーブリック、プログラムによるサブエージェント、新しいLangSmithデプロイメントコース、そしてシカゴ、ベルリン、ワシントンDC、ラスベガスでのイベント。
Max Agencyポッドキャストで、Zack Reneau-WedeenはAIエージェントの未来について語り、シンプルなアーキテクチャ、成果ベースの価格設定、組織図の押し付けを避けることを提唱。Sierraでの顧客向けエージェント構築の経験から得た洞察を共有。
KlarnaはLangGraphとLangSmithを活用したAIアシスタントにより、700人のフルタイムスタッフ相当の業務を処理し、顧客問い合わせ解決時間を80%短縮、反復的なサポートタスクの約70%を自動化しました。
EU AI Actの遵守期限は2026年8月2日です。本記事では、EU AI ActがハイリスクAIシステムに求める要件と、LangSmithおよびLangChain OSSが各要件をどのように満たすかを説明します。
AIエージェントにメモリを追加する実践的なガイド。短期・長期記憶の概念、トレース分析、LangSmithツールを使ったメモリループの実装により、エージェントが実行間で学習し改善する方法を解説します。
LangSmith は、メモリ、ガイド付きプロンプト、MCP ツールを備えた AI エージェントをコード不要で作成できるエージェントビルダーをリリース。会話形式のガイダンス、組み込みメモリ、サブエージェントにより、エージェント開発のハードルを下げ、内部生産性向上のユースケースに適しています。
Factory AIはLangSmithの可観測性とフィードバックAPIを活用して製品フィードバックループを最適化し、反復速度を2倍に向上させ、開発サイクルの大幅な短縮を実現しました。
Open SWEは、オープンソースでクラウドホスト型のコーディングエージェントであり、GitHubのタスク(計画、コーディング、テスト、PR作成)を自律的に処理します。マルチエージェントアーキテクチャ、ヒューマンインザループ制御、非同期実行を特徴としています。
Monte Carlo は LangGraph を基盤に AI トラブルシューティングエージェントを構築し、LangSmith でデバッグすることで、データチームが問題をより迅速に解決できるようにしました。このエージェントは複数の調査経路を並列に探索し、根本原因分析を加速します。
LangSmithは、公開ベンチマークと評価データセットの共有機能を開始し、開発者が異なるLLMアーキテクチャのパフォーマンスを同じタスクで比較できるようにしました。最初のベンチマークはLangChainドキュメントのQ&Aデータセットで、langchain-benchmarksパッケージもリリースされました。記事では、さまざまなモデルとアーキテクチャのパフォーマンスを分析し、デバッグ方法を提供しています。
LangSmith のホームページは、可観測性、評価、プロンプトエンジニアリングの3つのセクションに再編成されました。また、リソースタグが改善され、アプリケーションやカスタムタグで柔軟にリソースをグループ化できます。オンボーディングガイドと今後のABACにより、ユーザビリティが向上します。
エージェントエンジニアリングは、プロダクト思考、エンジニアリング、データサイエンスを統合し、反復的な構築、テスト、出荷、観察、改善のサイクルを通じて非決定論的なLLMシステムを信頼性の高い本番体験に変える新しい分野です。Clay、Vanta、LinkedIn、Cloudflareなどの企業が実践しています。
LangSmithを使用してファインチューニングされたオープンソースLLMを評価・比較する方法を紹介。複数のモデルをテストし、評価を自動化して最適なAIを選択します。
AIエージェントは、チームが長年培ってきた知識と判断を反映するときに最も効果的に機能します。この記事では、トレーダー向けコパイロットの例を用いて、ワークフロー設計、ツール設計、コンテキストエンジニアリングに人間の判断を組み込む方法を解説し、自動評価とモニタリングによる改善ループを紹介します。
Deep Agents SDKは、オフロード、要約、ファイルシステム抽象化を通じて、長時間実行されるAIタスクのコンテキストを管理し、コンテキスト腐敗を防ぎます。本記事では、3つの圧縮技術(大規模ツール結果のオフロード、大規模ツール入力のオフロード、要約)の仕組みと実践ガイドを紹介します。
信頼性の高いAIエージェントを構築するには、単に優れたモデルを使うだけでなく、ループを慎重に設計することが重要です。この記事では、エージェントループ、検証ループ、イベント駆動ループ、山登りループという4つのネストされたループを紹介し、LangChainプリミティブを使って各レベルを実装する方法を示します。エージェントをエコシステムに組み込み、継続的に改善することで、模倣困難な競争優位を構築できます。
Fleetは、アドホックなタスクと繰り返し発生する責任の両方をサポートします。汎用チャットと専門エージェントがどのようにチームの作業委任を支援するかをご覧ください。
LangChainとFireworksはオープンモデルをファインチューニングし、プロダクショントレースから知覚エラーシグナルを抽出。フロンティアモデル並みの性能をわずかなコストで実現。
この記事では、AIエージェントの定義を探求し、エージェントはLLMを使用してアプリケーションの制御フローを決定するシステムであると提案しています。著者はAndrew Ngの見解に同意し、エージェントの能力はスペクトルであるとし、「エージェンティック」な行動の概念を紹介し、開発、運用、評価、監視への影響について議論しています。
LangChainはDeep Agentsを使用したGTMエージェントを構築し、リードの調査、ドラフト作成、アカウントインテリジェンスを自動化。リード転換率が250%向上し、セールス担当者1人あたり月40時間を節約しました。
LangSmith の新機能 Align Evals は、評価者を人間の好みに合わせて調整し、評価スコアと人間の判断の不一致を減らします。
本記事は、一見相反する2つのブログ記事(Cognitionチームの「マルチエージェントを構築するな」とAnthropicチームの「マルチエージェント研究システムの構築方法」)を分析し、それらが多くの共通点を持ち、マルチエージェントシステムをいつ、どのように構築するかについての洞察を提供することを示します。重要なポイントは、コンテキストエンジニアリングの重要性、「読む」主体のシステムが「書く」主体のものより容易であること、そして本番環境での信頼性とエンジニアリングの課題です。また、LangGraphやLangSmithなどのツールがこれらの課題にどう対処するかについても触れています。
ReplitがLangSmithの可観測性機能を活用して複雑なエージェントワークフローをデバッグし、トレースパフォーマンスの改善、検索機能、ヒューマンインザループスレッドを実現した方法をご紹介します。
Interrupt 2025は、LangChainが初めて開催した業界カンファレンスで、世界中から800名がサンフランシスコに集まりました。基調講演では、エージェントエンジニアリングの新たな学問としての位置づけ、マルチモデルLLMアプリケーション、信頼性の高いエージェントを構築するためのLangGraph、AI可観測性などがテーマとなりました。製品発表では、LangGraph Platform GA、Open Agent Platform、LangGraph Studio v2、LangGraph Pre-Builts、LangSmithの可観測性アップデート、Open Evals、LLM-as-Judgeのプライベートプレビューなどが行われました。
ペアワイズ評価とは何か、LLMアプリ開発に必要な理由、およびLangChainのLangSmithでの使用例を学びます。
Pinecone Serverless、LangChain、LangServeを使用して、プロダクション対応のRAGアプリを構築するチュートリアル。ベクトルストア管理、迅速なデプロイ、可観測性といった課題に対処します。
OpenEvalsとAgentEvalsは、LLM-as-judge、構造化データ、エージェント軌跡評価のためのビルド済み評価器を提供します。これらのオープンソースパッケージにより、開発者は評価ワークフローを迅速に構築し、LLMアプリケーションの信頼性を確保できます。
本記事では、信頼性の高いエージェントシステムを構築する上での核心的な課題、すなわち各ステップでLLMに適切なコンテキストを提供することについて深く考察しています。著者はワークフローとエージェント、宣言的アプローチと命令的アプローチを比較し、LangGraphフレームワークの設計思想を紹介しています。また、OpenAIのエージェントガイドを批判し、Anthropicの定義を称賛し、フレームワークの「フロア」と「シーリング」の概念について議論しています。
LangSmithは、人間による修正を数ショット例として保存し、プロンプトエンジニアリングなしで評価を人間の嗜好に合わせる自己改善型LLM評価器を導入。