AI News HubLIVE
公開記事 131収集記事 143信頼度 88更新頻度 30 分
稼働状態 正常ソース種別 公式全文利用権限 公式全文最終取り込み 2026-06-26ID aws-ml-blog状態 有効

Official cloud provider blog; confirm reuse terms before enabling full body display.

最新公開記事

Amazon S3からのインタラクティブPDFテキスト抽出を構築する

この記事では、Model Context Protocol(MCP)を使用してAmazon S3からリアルタイムにPDFテキストを抽出するサーバーを構築する方法を説明します。Amazon Textractとの比較、アーキテクチャ、実装手順、コスト分析、セキュリティ考慮事項を詳述します。

  • MCPサーバーを使用してS3のPDFからオンデマンドでテキスト抽出。
  • テキストベースのPDF向けで、開発や概念実証環境に最適。
サイト内本文

Cara、AWSと共に保険ブローカレッジ向けドメイン特化型AIを開拓

Caraは、AWS上に構築された保険ブローカレッジのバックオフィス業務を自動化するAIネイティブソリューションです。Amazon EKSとAmazon Bedrockを活用し、スケーラブルでセキュアなドメイン特化型AIワークフローを実現します。

  • Caraは保険ブローカレッジの反復業務を自動化し、人材不足に対応。
  • AWS上に構築され、Amazon EKSによるコンテナオーケストレーションとAmazon BedrockによるLLM推論を活用。
サイト内本文

金融コンプライアンスのための本番級AIエージェント:Stripeからの教訓

Stripeは年間1.4兆ドルの決済量を50カ国で処理し、Amazon Bedrock上のReActエージェントフレームワークを使用して、人間の監視を維持しながらレビュー処理時間を26%削減しました。本記事では、タスク分解、オーケストレーションパターン、プロンプトキャッシングによるコスト最適化を含む技術アーキテクチャ、インフラストラクチャの決定、および学んだ教訓を紹介します。

  • Stripeはコンプライアンスレビューを有向非巡回グラフとして構成されるサブタスクに分解し、品質と監査可能性を確保しました。
  • AIエージェントは人間のレビュー担当者に事前調査情報を提供し、最終決定権は人間が保持し、96%以上の有用性評価を達成しました。
サイト内本文

再構築ではなく改造:レガシーエンタープライズサービスを変革するエージェンティックオーバーレイ

本記事では、AWSと著者による技術協力の成果として、実用的なソリューションであるエージェンティックオーバーレイ(Agentic Overlays)を紹介します。エージェンティックオーバーレイは薄いラッパー層であり、従来のRESTベースのサービスをA2A対話に参加できるエージェントに変換し、同時にREST APIをModel Context Protocol(MCP)互換のツールとして公開します。企業はビジネスロジックの書き換え、コードの複製、並行インフラの運用を必要とせずに、既存のRESTサービスにA2A機能を追加でき、エージェントの乱立を削減できます。リファレンスアーキテクチャとサンプルコードも提供します。

  • エージェンティックオーバーレイはRESTサービスをA2Aエージェントに変換し、MCPツールを公開する薄いラッパー。
  • ビジネスロジックの書き換えや並行インフラ不要で、コストと複雑さを低減。
サイト内本文

NVIDIA Blackwell で Amazon SageMaker AI のモデルトレーニングを最適化

この記事では、Amazon SageMaker AI でトレーニングジョブを構成して、AWS 上の Blackwell アーキテクチャを最大限に活用する方法を説明します。Blackwell の拡張メモリを活用するバッチサイズとシーケンス長の選択、モデルサイズ(1B~64B パラメータ)に適した精度形式の選択、アクティベーションチェックポイントの戦略的適用について学びます。最後に、トレーニング構成を調整し、P6-B200 インスタンスで分散トレーニングジョブを起動するための実用的なフレームワークを提供します。

  • Blackwell の拡張メモリにより、より大きなバッチサイズ、より長いシーケンス長、簡素化されたモデルシャーディングが可能になります。
  • アクティベーションチェックポイントは、大規模モデル(〜14B+ パラメータ)の安定したトレーニングの前提条件です。
サイト内本文

Amazon SageMaker AI に SeedVR2 をデプロイして超解像を実現

この投稿では、SeedVR2 を Amazon SageMaker AI 上で使用して動画をアップスケーリングする方法を紹介します。ソリューションのアーキテクチャ、デプロイ手順、品質向上と処理効率を示すパフォーマンス比較について説明します。最後まで読めば、この超解像ソリューションを実装するための実践的な知識が得られます。

  • SeedVR2 は ByteDance のオープンソース動画復元モデルで、拡散モデルと GAN を組み合わせて効率的なアップスケーリングを実現します。
  • ソリューションはセキュリティ、ストレージ、SageMaker 処理パイプラインを含む3層の AWS アーキテクチャを採用しています。
サイト内本文

Amazon Bedrockを利用したAIエージェントによるセルフサービスAWS Health分析で実用的なヘルスインサイトを見つける

この投稿では、Model Context Protocol(MCP)を介して公開されたAIエージェントを使用してセルフサービスのヘルスイベント分析を提供する、オープンソースソリューションであるChaplin(Customer Health and Planned Lifecycle Intelligence Nexus)の構築方法を紹介します。

  • Chaplinは、MCPを介したAIエージェントを使用するセルフサービスAWS Healthイベント分析のためのオープンソースソリューションです。
  • TAMに依存するヘルスイベント解釈のボトルネックを解消します。
サイト内本文

AWSで最新のデータメッシュ戦略を用いたエージェンティックAIアプリケーションの構築

この記事では、AWS上でガバナンスが効いたサーバーレスデータメッシュを構築し、プロダクション環境のエージェンティックAIに必要な安全でスケーラブルなデータ基盤を提供する方法を紹介します。

  • エージェンティックAIでは、ツールの発見からクエリ実行までの各ステップで細粒度のアクセス制御が必要であり、従来のRAGガバナンスでは対応できません。
  • Amazon S3 Tables(Iceberg内蔵)とAWS Lake Formationにより、行/列/セルレベルのセキュリティを実現し、1秒あたりのトランザクション数が最大10倍向上します。
サイト内本文

Amazon Nova 2 Sonic で医療予約エージェントを構築する

この記事では、Amazon Nova 2 Sonic と Amazon Bedrock AgentCore を使用して、予約リマインダー会話を処理する音声エージェントの構築方法を学びます。エージェントは音声で患者を認証し、予約の管理(確認、キャンセル、再スケジュール)、来院前の健康情報の収集、必要に応じて人間のスタッフへのエスカレーションを行います。ルーティンコールを大規模に処理し、無断キャンセル率の低減に役立ちます。このサンプルは問題のエージェント側、つまり音声会話とツールオーケストレーションに焦点を当てています。テスト用のブラウザベースのインターフェースが含まれています。実際の電話回線に接続して発信するには、Amazon Connect Customer などのテレフォニーサービスを統合します。

  • Amazon Nova 2 Sonic のネイティブ音声間処理と Amazon Bedrock AgentCore のサーバーレスランタイムを活用。
  • 患者認証、予約管理、健康情報収集、人間へのエスカレーションを実現。
サイト内本文

SnowflakeとAmazon QuickSightによるAI駆動型BI

本記事では、SnowflakeのセマンティックビューとAmazon QuickSightのエンドツーエンド統合を構築する方法を、映画レビューデータを用いて説明します。自然言語クエリによるデータ探索と一貫したビジネスロジックの実現方法を紹介します。

  • セマンティックビューがデータレイヤーにビジネス定義を付与し、AI/BIシステム間で統一解釈を実現
  • Cortex Analystによる自然言語クエリでAI幻覚リスクを低減
サイト内本文

Loka が Amazon Nova 2 Sonic を使って自然で低遅延な音声エージェントを構築した方法

Loka は Amazon Nova 2 Sonic を活用して、従来の音声アシスタントの遅延や不自然さを解決する会話型 AI エージェントを構築しました。ネイティブな音声-to-音声処理により、高精度、低コスト、自然な対話を実現しています。

  • 従来の音声エージェントは 3 段階のパイプライン(音声認識→LLM→音声合成)により 3~5 秒の遅延が生じ、会話の流れを損ないコストが増大する。
  • Amazon Nova 2 Sonic はエンドツーエンドの音声処理を採用し、Big Bench Audio で 87.0 点、初回音声出力まで 1.39 秒、コストは約 0.27 ドル/時間。
サイト内本文

Amazon Bedrock AgentCore を使用したタンパク質研究コパイロットの構築

この記事では、自然言語クエリの解析、タンパク質埋め込みのベクトル類似性検索、AI生成の科学サマリーを組み合わせた対話型タンパク質研究アシスタントの構築方法を紹介します。

  • Strands Agents SDK を使用して3つの専用ツール(パーサー、検索、サマライザー)を調整し、Amazon Bedrock AgentCore にデプロイします。
  • ESM-C 300M タンパク質言語モデルを使用して埋め込みを生成し、Amazon Aurora PostgreSQL の pgvector でベクトル類似性検索を行います。
サイト内本文

共有インフラ、分離されたテナント:Amazon Bedrock AgentCore を使用したプールモデルマルチテナンシー

この記事では、Amazon Bedrock AgentCore を使用して本番環境対応のマルチテナント AI システムを構築するパターンを紹介します。複数のクリニックや病院にサービスを提供する医療 AI エージェントを通じて、テナント分離、サービス階層の差別化、コスト追跡、観測可能性を示します。

  • Amazon Bedrock AgentCore のネイティブ機能を活用して完全なテナント分離を実現。
  • 最小限のカスタムコードでサービス階層(ベーシック、プレミアムなど)を差別化。
サイト内本文

AIエージェントのためのペイ・パー・インテリジェンス構築:AmpersendがAmazon Bedrock AgentCore Paymentsを活用する方法

Ampersendは、Amazon Bedrock AgentCore Payments上にペイ・パー・インテリジェンスのルーティングレイヤーを構築し、AIエージェントがx402プロトコルを使用して自律的にモデルサービスに支払えるようにしました。この統合は、ウォレット管理、支出ガバナンス、2ホップ決済を処理し、開発期間を数ヶ月から2週間未満に短縮しました。

  • AmpersendはAmazon Bedrock AgentCore Paymentsと統合し、AIエージェントに自律的なペイ・パー・インテリジェンスを提供します。
  • ソリューションは2ホップ決済パターンを採用:エージェントがAmpersendに支払い、Ampersendがモデルプロバイダーに支払います。
サイト内本文

世界を埋め込む:大規模な検索可能な航空画像のためのマルチモーダルAI

本稿では、マルチモーダル埋め込み、LLMによるキャプション生成、AWS上のベクター検索を利用して、航空画像ライブラリを自然言語で検索可能な知識ベースに変換する方法について説明します。Amazon BedrockとAmazon OpenSearch Serverlessで構築された5段階のパイプラインにより、さまざまな埋め込みモデル、融合戦略、キャプション手法、検索方法を評価します。実験では、Amazon Nova Multimodal Embeddingsがベンチマーククエリで最高のF1スコアを達成しました。この作業は、検索可能な画像製品であるVexcel Intelligenceへと発展しました。

  • 航空画像検索は、マルチビュー、ラベル付きデータセットの欠如、意味的あいまいさなどの課題に直面。
  • 5段階のアーキテクチャで、取り込み、埋め込み、インデックス作成、検索、評価を実施。
サイト内本文

Amazon SageMaker AI処理ジョブでのComfyUIワークフローの実行

この投稿では、Amazon SageMaker AI処理ジョブでComfyUIワークフローをデプロイし、1回のバッチで数百の高品質画像を生成する方法を説明します。AWS CDKを使用したインフラのセットアップ、GPUアクセラレーション処理の構成、大規模な画像生成の自動化について学びます。このソリューションは独自のComfyUIワークフローに適合させることができます。

  • SageMaker処理ジョブでComfyUIをデプロイし、バッチ画像生成を実現。
  • AWS CDKを使用してVPC、S3バケット、Lambdaトリガーなどのインフラを構築。
サイト内本文

Amazon Bedrock AgentCore で Web 検索機能を提供開始

Amazon Bedrock AgentCore の Web 検索機能が一般提供を開始しました。このフルマネージドな MCP 互換の機能により、AI エージェントはリアルタイムの Web 情報を取得できます。Amazon 自社の Web インデックスを基盤とし、クエリは AWS 内で完結するため、プライバシーも確保されています。

  • AI エージェントの知識が古くなる問題を解決し、リアルタイム情報を取得可能。
  • Amazon 自社の Web インデックスを利用し、数百億のドキュメントをカバー、数分で更新。
サイト内本文

Adobe Marketing Agent for Amazon Quick でキャンペーンワークフローを加速

この記事では、Model Context Protocol(MCP)を使用して Adobe Marketing Agent を Amazon Quick と統合する方法を説明します。設定手順、認証、マーケティングデータへの接続、自然言語でのキャンペーンインサイトの取得方法を詳しく解説します。

  • MCP を使用して Adobe Marketing Agent を Amazon Quick と統合し、自然言語でマーケティングインサイトを取得。
  • ブランドコネクタの設定、ツール権限の管理、接続の公開。
サイト内本文

SageMaker 詳細メトリクスと CloudWatch 上の Insights ダッシュボードを使用した生成 AI 推論のモニタリングとデバッグ

Amazon SageMaker AI は、GPU ヘルス、トークンレベルのレイテンシー、KV キャッシュプレッシャー、アベイラビリティゾーン間のトラフィック分散など、100 以上の詳細な推論メトリクスを発するようになりました。これらのメトリクスは、CloudWatch の組み込み SageMaker Insights ダッシュボードに表示され、PromQL クエリをサポートします。この記事では、詳細な可観測性を有効にする方法、ダッシュボードの操作方法、およびメトリクスを外部ツールに接続する方法について説明します。

  • SageMaker 推論エンドポイントは、デフォルトで 100 以上の詳細な OpenTelemetry メトリクスを CloudWatch に発します。
  • 新しい SageMaker Insights ダッシュボードは、パフォーマンス、キャパシティ、信頼性の 3 つのビューを提供し、レイテンシーやリソースの問題を迅速に特定できます。
サイト内本文

Amazon Bedrock AgentCore Harness が一般提供開始:アイデアから本番グレードのエージェントまでわずか数分

Amazon Bedrock AgentCore Harness が一般提供を開始しました。開発者はわずか2回のAPI呼び出しで完全な機能を備えたエージェントを作成・実行できます。隔離されたランタイム環境、組み込みメモリ、ツール統合、スキルライブラリ、リアルタイムトレーシングを提供し、オーケストレーションコードやコンテナ構築は不要です。

  • CreateHarness と InvokeHarness の2つのAPI呼び出しでエージェントを迅速に作成・実行
  • ファイルシステムとシェルを備えた隔離環境でコードを安全に実行
サイト内本文

Amazon SageMaker AI 非同期推論がインラインリクエストペイロードをサポート

本日、Amazon SageMaker AI 非同期推論のインラインペイロードサポートを発表します。顧客は InvokeEndpointAsync API のリクエスト本文に直接推論ペイロードを送信できるようになり、呼び出しごとに Amazon S3 に入力データをアップロードする必要がなくなります。

  • 新しい Body パラメータにより、最大128KBのインラインペイロードを直接送信可能。InputLocation とは排他的。
  • クライアントコードが簡素化され、S3 クライアントや IAM 権限、入力バケット管理が不要に。
サイト内本文

Amazon Quick の自律エージェントで毎日何時間も取り戻す

Amazon Quick に、継続的にあなたの代わりに作業する新しい自律エージェント、最も重要な作業を優先するアクティビティフィード、そして単一の質問であらゆるデータソースからインサイトを見つける機能が追加されました。

  • Quick の新しい自律エージェントは、バックグラウンドで継続的にタスクを処理します。
  • アクティビティフィードは、アプリ間のコミュニケーションを統合して優先順位付けします。
サイト内本文

データとAIエージェントのためのコンテキストインテリジェンスの大規模展開

AWSニューヨークサミットで、AWSは、AWS Context(近日公開)、AWS Glue Data Catalogのビジネスコンテキストとセマンティック検索(プレビュー)、Amazon S3 Annotations(一般提供開始)などの一連のイノベーションを発表しました。これらは、AIエージェントに信頼できるコンテキストを提供し、データレイク、データウェアハウス、データベース、ストリーム、そして文書化されていない組織知識に散在するコンテキストに安全にアクセスできるようにします。ナレッジグラフ、ID認識アクセス、オープンスタンダードを通じて、組織は共有・管理可能なコンテキストレイヤーを構築し、AIエージェントの意思決定能力を向上させることができます。

  • AWS Contextは既存のデータ間の関係を自動的にナレッジグラフにマッピングし、AIエージェントが実行時に管理されたデータ関係やビジネスルールにアクセスできるエージェント検索を提供します。
  • AWS Glue Data Catalogにビジネスコンテキストとセマンティック検索(プレビュー)が追加され、技術メタデータをビジネス記述や用語で強化し、スキルアセットでエージェントに追加のガイダンスを提供します。
サイト内本文

Amazon Bedrock AgentCoreの新機能:より広範な知識と継続的な学習を備えたエージェントの構築

Amazon Bedrock AgentCoreは、エージェントを組織、ウェブ、有料の知識に接続するための新機能と、継続的な改善のための最適化機能、強化されたポリシー制御を導入します。

  • エージェントは、マネージドナレッジベース、ウェブ検索、およびAgentCore決済による有料コンテンツへのネイティブアクセスを取得します。
  • 最適化機能には、失敗/意図/軌跡のインサイト、推奨事項、A/Bテストが含まれ、継続的な改善を実現します。
サイト内本文

Amazon Bedrock Guardrails InvokeGuardrailChecks API でエージェンティックAIアプリケーションを保護する

本日、Amazon Bedrock Guardrails の新しいAPIを発表します。このAPIを使用すると、ガードレールリソースを作成することなく、エージェンティックAIアプリケーションの任意の時点で個別の安全対策(セーフティチェック)を適用できます。この記事では、InvokeGuardrailChecks API の仕組みと、安全なマルチターンエージェンティックAIアプリケーションを構築する方法を説明します。

  • InvokeGuardrailChecks APIは、ガードレールリソースを事前に作成せずに、エージェントループ内で柔軟にセーフティチェックを呼び出せる。
  • APIは検出のみモードで動作し、コンテンツフィルター、プロンプト攻撃検出、機密情報フィルターの数値スコアを返す。
サイト内本文

Amazon SageMaker AI がコンテナキャッシングを導入し、モデルスケーリングを高速化

Amazon SageMaker AI は、推論用のコンテナイメージキャッシングを発表し、スケールアウトイベントにおいて生成AIモデルのエンドツーエンドレイテンシーを最大2倍削減します。

  • コンテナキャッシングは、サポートされるアクセラレーターインスタンスタイプで自動的に有効になり、変更は不要です。
  • 新しいインスタンス起動時のコンテナイメージプルを排除し、起動レイテンシーを最大51%削減します。
サイト内本文

Amazon SageMaker AI で P-EAGLE を使用した投機的復号の並列化

この記事では、Amazon SageMaker AI 内で P-EAGLE を直接使用する方法を説明します。SageMaker JumpStart カタログから互換性のあるモデルを選択し、並列ドラフト仕様を構成し、高度に最適化されたリアルタイム SageMaker AI エンドポイントをデプロイして生成 AI アプリケーションを高速化する方法を示します。

  • P-EAGLE は、すべてのドラフトトークンを単一のフォワードパスで並列に予測し、逐次的なドラフトフェーズを排除します。
  • EAGLE-3 と比較して最大 1.69 倍のスループット向上。
サイト内本文

Amazon Bedrock で Gemma 4 モデルを導入

Google DeepMind が構築し Apache 2.0 ライセンスでリリースされた Gemma 4 ファミリーが Amazon Bedrock で利用可能になりました。このファミリーには、Gemma 4 31B、Gemma 4 26B-A4B、Gemma 4 E2B の 3 つの命令チューニング済みバリアントが含まれ、デンスおよび混合エキスパート(MoE)アーキテクチャをカバーしています。組み込みの推論、ネイティブ関数呼び出し、テキストと画像のマルチモーダル入力を提供します。Amazon Bedrock は完全マネージドサービスとしてこれらのモデルを提供し、データ保護、規制コンプライアンス、運用制御を保証します。

  • Gemma 4 ファミリーには 3 つのバリアント:31B デンス、26B-A4B MoE、E2B PLE。
  • 組み込み推論モード、関数呼び出し、テキスト/画像マルチモーダル入力をサポート。
サイト内本文

Strands Evalsを使用したAIエージェントの障害検出と根本原因分析

本記事では、Strands Evals SDKの検出器がAIエージェントの実行トレースから障害を自動的に識別し、根本原因分析を行うことで、診断時間を数時間から数分に短縮する方法を紹介します。検出関数の呼び出し方、構造化出力(分類された障害、信頼度、因果連鎖、修正推奨事項)の解釈方法、および評価パイプラインへの統合方法について学びます。

  • 検出器は2つのフェーズで動作:障害検出(9カテゴリの分類法に照らしてスパンをスキャン)と根本原因分析(原因と症状を結び付け、修正を推奨)。
  • detect_failuresとanalyze_root_cause関数で個別の出力を取得可能、diagnose_sessionで統一パイプラインを提供。
サイト内本文

Deep AgentsとBedrock AgentCoreでコンテキスト豊富なリサーチエージェントを構築する

本記事では、LangChain Deep AgentsとAmazon Bedrock AgentCoreを使用して、競合調査用リサーチエージェントを構築する方法を紹介します。エージェントは深い作業を隔離されたサブエージェントに委任することで、コンテキストウィンドウの制限を克服し、並列リサーチ、データ分析、セッションを超えたメモリ活用を実現します。

  • Deep Agentsが複数の専門サブエージェントをオーケストレーションし、各サブエージェントは独立したBedrock AgentCore MicroVMで実行される。
  • 3つのブラウザサブエージェントが競合サイトを並列調査し、アナリストサブエージェントがチャートとレポートを生成する。
サイト内本文

全ソース