AWS Machine Learning Blog AI 新聞來源

公開文章 131採集文章 143可信度 88刷新頻率 30 分鐘

健康狀態健康來源類型官方原文權限 官方原文最近入庫 2026-06-26ID aws-ml-blog運行狀態 已啟用

Official cloud provider blog; confirm reuse terms before enabling full body display.

最新公開文章

構建交互式PDF文本提取：從Amazon S3實時獲取文檔內容

2026-06-26 22:47 UTC+8

本文介紹如何構建一個基於MCP協議的服務器，從Amazon S3中實時提取PDF文本，實現按需文檔訪問。文章比較了該方案與Amazon Textract的適用場景，並提供了詳細的實施步驟、成本估算和安全考量。

使用MCP協議構建服務器，實現從S3實時提取PDF文本。
適用於文本型PDF，無需OCR，適合開發和概念驗證環境。

Cara攜手AWS為保險經紀公司打造領域專屬AI解決方案

2026-06-26 22:42 UTC+8

Cara是一款基於AWS構建的AI原生解決方案，專注於自動化保險經紀公司的後台流程。通過Amazon EKS和Amazon Bedrock的支持，Cara實現了領域專屬的AI工作流，為經紀公司帶來每個用户每週約10小時的時間節省，並支持數千併發用户。

Cara利用AI自動化保險經紀中重複性任務，解決行業人才短缺問題。
基於AWS構建，使用Amazon EKS管理容器編排，Amazon Bedrock提供大語言模型推理能力。

面向金融合規的生產級AI代理：來自Stripe的經驗教訓

2026-06-26 22:38 UTC+8

Stripe每年處理1.4萬億美元支付量，通過基於Amazon Bedrock的ReAct代理框架，將合規審查處理時間減少26%，同時保持人工監督。本文介紹其技術架構、基礎設施決策以及部署AI代理的經驗教訓，包括任務分解、編排模式和通過提示緩存優化成本。

Stripe使用ReAct代理框架將合規審查分解為子任務，通過有向無環圖編排，確保質量和可審計性。
AI代理為人類審查員提供預調查信息，最終決定權仍由人類掌握，實現了96%以上的有用性評級。

改造而非重建：用智能體覆蓋層改造遺留企業服務

2026-06-26 01:55 UTC+8

本文提出一種實用解決方案——智能體覆蓋層（Agentic Overlays），這是一種薄包裝層，可將傳統REST服務轉化為能夠參與智能體間通信（A2A）的智能體，同時將REST API暴露為與模型上下文協議（MCP）兼容的工具。企業無需重寫業務邏輯、複製代碼或維護並行基礎設施，即可為現有REST服務添加A2A能力，並減少基礎設施中的智能體氾濫。文章提供了參考架構和示例代碼。

智能體覆蓋層是薄包裝層，將REST服務轉變為A2A智能體，並暴露MCP工具。
無需重寫業務邏輯或維護並行基礎設施，降低成本和複雜性。

使用 NVIDIA Blackwell 優化 Amazon SageMaker AI 上的模型訓練

2026-06-26 00:41 UTC+8

本文介紹瞭如何在 Amazon SageMaker AI 上配置訓練作業，以充分利用 NVIDIA Blackwell 架構的優勢。您將學習如何選擇批大小和序列長度以利用 Blackwell 的擴展內存，為模型大小（1B 到 64B 參數）選擇合適的精度格式，並策略性地應用激活檢查點。最終，您將獲得一個實用的框架來調整訓練配置並在 P6-B200 實例上啓動分佈式訓練作業。

Blackwell 的擴展內存支持更大的批大小、更長的序列長度和簡化的模型分片。
激活檢查點對於大模型（~14B+ 參數）是穩定訓練的先決條件。

通過 Amazon SageMaker AI 部署 SeedVR2 實現超分辨率

2026-06-26 00:40 UTC+8

本文展示瞭如何使用 SeedVR2 和 Amazon SageMaker AI 實現視頻放大。我們介紹瞭解決方案架構、部署步驟，並進行了性能對比，突出了質量提升和處理效率。完成後，您將掌握實現該超分辨率解決方案的實用知識。

SeedVR2 是字節跳動開源視頻修復模型，結合擴散模型和 GAN 實現高效視頻放大。
解決方案採用三層 AWS 架構，包括安全、存儲和 SageMaker 處理管道。

使用由Amazon Bedrock支持的AI代理構建自助式AWS健康分析，以發現可操作的健康洞察

2026-06-26 00:38 UTC+8

本文介紹如何構建Chaplin（客户健康與計劃生命週期智能連接器），這是一個開源解決方案，利用通過模型上下文協議（MCP）暴露的AI代理，提供自助式健康事件分析。Chaplin允許團隊用自然語言提問，並從MCP兼容的AI助手獲得精確、上下文化的答案，無需依賴AWS支持進行常規分析。

Chaplin是一個開源解決方案，使用AI代理通過MCP提供自助式AWS健康事件分析。
它解決了運營團隊依賴TAM解釋健康事件的瓶頸問題。

在AWS上使用現代數據網格策略構建自主AI應用

2026-06-26 00:35 UTC+8

本文展示瞭如何在AWS上構建一個受治理的無服務器數據網格，為生產級自主AI提供安全、可擴展的數據基礎。架構通過S3 Tables（Iceberg）、S3 Vectors和AgentCore Gateway實現三層治理，解決自主AI多步驟數據訪問中的授權問題。

自主AI需要從工具發現到查詢執行的每一步都進行細粒度訪問控制，傳統RAG的單點治理模式無法滿足。
使用Amazon S3 Tables（內置Iceberg支持）和AWS Lake Formation實現行/列/單元格級安全，交易性能提升10倍。

使用 Amazon Nova 2 Sonic 構建醫療預約語音助手

2026-06-25 02:20 UTC+8

本文介紹如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 構建一個語音助手，用於處理醫療預約提醒對話。該助手能夠通過語音驗證患者身份、管理預約（確認、取消或改期）、收集就診前健康信息，並在必要時轉接人工客服。它可大規模處理常規電話，有助於降低失約率。示例聚焦於智能代理層面的語音對話與工具編排，並提供基於瀏覽器的測試界面。

使用 Amazon Nova 2 Sonic 的原生語音到語音模型，保留語氣等上下文信息。
通過 Amazon Bedrock AgentCore 實現無服務器運行時，集成七項醫療專用工具。

利用 Snowflake 和 Amazon QuickSight 實現 AI 驅動型商業智能

2026-06-25 02:19 UTC+8

本文介紹瞭如何構建 Snowflake 語義視圖與 Amazon QuickSight 之間的端到端集成，使用電影評論數據作為示例，展示如何通過自然語言查詢和分析數據，確保業務邏輯的一致性和減少 AI 幻覺。

語義視圖將業務定義直接附加到數據層，確保 AI 和 BI 系統統一解釋信息
通過 Cortex Analyst 進行自然語言查詢，降低 AI 幻覺風險

Loka 如何利用 Amazon Nova 2 Sonic 構建自然、低延遲的語音代理

2026-06-25 00:56 UTC+8

Loka 使用 Amazon Nova 2 Sonic 構建了對話式 AI 代理，通過原生語音到語音模型解決了傳統語音助手延遲高、不自然的問題，實現了低成本、高準確率的客户互動。

傳統語音代理因三步處理流程（語音轉文本、LLM 處理、文本轉語音）導致 3-5 秒延遲，破壞對話自然性，增加成本。
Amazon Nova 2 Sonic 採用端到端語音處理，Big Bench Audio 得分 87.0，首次響應時間 1.39 秒，每小時成本約 0.27 美元。

使用 Amazon Bedrock AgentCore 構建蛋白質研究助手

2026-06-24 00:39 UTC+8

本文展示瞭如何構建一個對話式蛋白質研究助手，它結合了自然語言查詢解析、蛋白質嵌入向量相似度搜索和AI生成的科學摘要，幫助研究人員高效地在大數據集中搜索結構相似的肽段。

使用 Strands Agents SDK 協調三個專用工具：解析器、搜索器和摘要器，部署到 Amazon Bedrock AgentCore。
利用 ESM-C 300M 蛋白質語言模型生成嵌入向量，通過 Amazon Aurora PostgreSQL 的 pgvector 進行向量相似度搜索。

共享基礎設施，隔離租户：使用 Amazon Bedrock AgentCore 實現池模型多租户

2026-06-23 23:43 UTC+8

本文介紹瞭如何使用 Amazon Bedrock AgentCore 構建生產級多租户 AI 系統的模式，通過醫療 AI 助手示例展示了租户隔離、服務層級差異化、成本追蹤和可觀測性等關鍵能力。

利用 Amazon Bedrock AgentCore 原生能力實現完整的租户隔離。
通過層級策略（如基礎版和高級版）實現服務差異化。

為AI代理構建按智能付費：Ampersend如何使用Amazon Bedrock AgentCore Payments

2026-06-23 01:53 UTC+8

Ampersend在Amazon Bedrock AgentCore Payments之上構建了一個按智能付費的路由層，使AI代理能夠使用x402協議自主支付模型服務費用。該集成處理錢包託管、支出治理和兩跳結算，將開發時間從數月縮短至兩週以內。

Ampersend與Amazon Bedrock AgentCore Payments集成，為AI代理提供自主按智能付費功能。
解決方案採用兩跳支付模式：代理向Ampersend支付，Ampersend再向模型提供商支付。

本文探討了如何利用多模態嵌入、大語言模型標註和向量搜索，將航拍圖像庫轉化為可自然語言搜索的知識庫。通過使用Amazon Bedrock和Amazon OpenSearch Serverless構建的五階段管道，評估了不同嵌入模型、融合策略、標註方法和搜索技術。實驗表明，Amazon Nova Multimodal Embeddings在基準查詢中獲得了最高的F1分數。該工作已發展為Vexcel Intelligence產品。

航拍圖像搜索面臨多視角、無標註數據集、語義模糊等挑戰。
採用五階段架構：定義區域、攝取圖像、嵌入與索引、搜索、評估。

在Amazon SageMaker AI處理作業上運行ComfyUI工作流

2026-06-23 00:28 UTC+8

本文介紹瞭如何在Amazon SageMaker AI處理作業上部署ComfyUI工作流，以批量生成高質量圖像。涵蓋使用AWS CDK設置基礎設施、配置GPU加速處理以及自動化大規模圖像生成的步驟。該解決方案可適應自定義工作流，幫助擴展創意管線。

教程演示了使用ComfyUI和SageMaker AI批量生成數百張圖像。
通過AWS CDK部署，包括數據棧、安全棧和ComfyUI棧。

Amazon Bedrock AgentCore 推出網頁搜索功能

2026-06-19 22:15 UTC+8

亞馬遜 Bedrock AgentCore 網頁搜索功能現已全面可用。該功能通過完全託管的 MCP 兼容接口，讓 AI 代理能夠獲取實時網頁信息。它基於亞馬遜自建的包含數百億文檔的網頁索引，保證查詢在 AWS 內部處理，無需管理第三方 API 或憑證。

網頁搜索功能解決了 AI 代理知識陳舊的問題，可獲取實時數據。
使用亞馬遜自建的網頁索引，覆蓋數百億文檔，分鐘級更新。

利用 Adobe Marketing Agent for Amazon Quick 加速營銷活動工作流程

2026-06-19 22:05 UTC+8

本文介紹瞭如何通過模型上下文協議（MCP）將 Adobe Marketing Agent 與 Amazon Quick 集成，使營銷人員能夠通過自然語言對話獲取受眾排名、忠誠度細分、旅程使用情況和衝突分析等關鍵洞察。文章詳細説明了先決條件、配置步驟、身份驗證、創建聊天代理以及驗證工作流程。

通過 MCP 將 Adobe Marketing Agent 與 Amazon Quick 集成，實現自然語言查詢營銷洞察。
配置品牌連接器、管理工具權限併發布連接。

使用 SageMaker 詳細指標和 CloudWatch Insights 儀表板監控和調試生成式 AI 推理

2026-06-19 07:31 UTC+8

Amazon SageMaker AI 現在提供超過 100 種詳細的推理指標，涵蓋 GPU 健康、令牌級延遲、KV 緩存壓力、可用區流量分佈等。這些指標通過內置的 SageMaker Insights 儀表板在 CloudWatch 中展示，支持 PromQL 查詢。本文介紹如何啓用詳細可觀測性、導航儀表板以及將指標連接到外部工具。

SageMaker 推理端點現在默認發出超過 100 種詳細的 OpenTelemetry 指標到 CloudWatch。
新的 SageMaker Insights 儀表板提供性能、容量和可靠性三個視圖，幫助快速定位延遲和資源問題。

Amazon Bedrock AgentCore Harness 現已正式上市：數分鐘內從創意到生產級智能體

2026-06-19 01:32 UTC+8

Amazon Bedrock AgentCore Harness 現已正式發佈，允許開發者通過兩次 API 調用即可創建並運行一個功能完整的智能體。該工具提供隔離的運行環境、內置記憶、工具集成、技能庫以及實時追蹤能力，無需編寫編排代碼或構建容器。

CreateHarness 和 InvokeHarness 兩個 API 調用即可快速創建和運行智能體
智能體擁有隔離的文件系統和 shell，可安全執行代碼和命令

Amazon SageMaker AI 異步推理現在支持內聯請求負載

2026-06-18 04:56 UTC+8

Amazon SageMaker AI 異步推理新增內聯負載支持，客户可直接在 InvokeEndpointAsync API 的請求體中發送推理負載，無需先上傳到 S3。對於不超過128KB的負載，此舉消除了網絡往返，簡化了客户端代碼，並減少了操作複雜度。

新增 Body 參數，允許直接發送最大128KB的內聯負載，與 InputLocation 互斥。
簡化客户端代碼，無需 S3 客户端、IAM 權限和輸入桶管理。

使用 Amazon Quick 中的自主代理每天節省數小時

2026-06-18 04:35 UTC+8

Amazon Quick 推出了自主代理，可連續為您工作，還有活動摘要幫助您優先處理最重要的工作，並能夠通過單個問題跨所有數據源尋找洞察，幫助用户每天節省時間。

Quick 中的新自主代理可連續在後台處理任務。
活動摘要整合並優先處理跨應用的通信。

為您的數據和AI代理提供規模化上下文智能

2026-06-18 01:17 UTC+8

在AWS紐約峯會上，AWS宣佈了一系列創新，包括AWS Context（即將推出）、AWS Glue數據目錄業務上下文與語義搜索（預覽版）以及Amazon S3註釋（正式可用），旨在為AI代理提供可信任的上下文，使其能夠安全地訪問分散在數據湖、數據倉庫、數據庫和流中的數據以及機構知識。這些服務通過知識圖譜、身份感知訪問和開放式標準，幫助組織構建一個共享、可治理的上下文層，從而提升AI代理的決策能力。

AWS Context通過知識圖譜自動映射數據關係，提供代理搜索，使AI代理能在運行時訪問治理後的數據關係和業務規則。
AWS Glue數據目錄新增業務上下文和語義搜索，支持用業務描述和術語豐富技術元數據，並通過技能資產為代理提供額外指導。

Amazon Bedrock AgentCore 新功能：構建具備更廣泛知識和持續學習能力的智能體

2026-06-17 23:29 UTC+8

Amazon Bedrock AgentCore 推出了新功能，可將智能體連接到組織、網絡和付費知識庫，並提供持續優化的功能和增強的策略控制。

智能體通過託管知識庫、網絡搜索和付費內容（通過AgentCore支付）獲得原生訪問權限。
優化功能包括失敗/意圖/軌跡洞察、建議和A/B測試，實現持續改進。

使用Amazon Bedrock Guardrails InvokeGuardrailChecks API保護您的Agentic AI應用

2026-06-17 06:46 UTC+8

Amazon Bedrock Guardrails推出了新的InvokeGuardrailChecks API，允許在Agentic AI應用的任意環節應用獨立的安全檢查，無需創建Guardrail資源。該API以僅檢測模式運行，返回數值分數，使您能夠自定義閾值和操作。本文介紹了API的工作原理及如何構建安全的多輪Agentic AI應用。

InvokeGuardrailChecks API無需預先創建Guardrail資源，可在Agent循環中靈活調用安全檢查。
API支持內容過濾、提示攻擊檢測和敏感信息過濾，返回嚴重性或置信度分數。

Amazon SageMaker AI 推出容器緩存，加速模型擴展

2026-06-17 04:16 UTC+8

Amazon SageMaker AI 宣佈容器鏡像緩存功能，可將擴展事件中的端到端延遲最多降低 2 倍，尤其適用於生成式 AI 模型。

容器緩存自動為支持的實例類型啓用，無需修改。
在新實例啓動時消除容器鏡像拉取步驟，端到端啓動延遲降低最多 51%。

在 Amazon SageMaker AI 上使用 P-EAGLE 實現推測解碼並行化

2026-06-17 01:47 UTC+8

本篇文章指導您如何在 Amazon SageMaker AI 中直接使用 P-EAGLE，展示如何從 SageMaker JumpStart 目錄中選擇兼容模型、配置並行草稿規格，並部署高度優化的實時 SageMaker AI 端點以加速生成式 AI 應用。

P-EAGLE 通過一次前向傳播並行預測所有草稿令牌，消除了傳統推測解碼的串行瓶頸。
相比 EAGLE-3，在真實基準測試中吞吐量提升高達 1.69 倍。

在 Amazon Bedrock 上推出 Gemma 4 模型

2026-06-16 04:24 UTC+8

Google DeepMind 構建的 Gemma 4 系列開放權重模型現已在 Amazon Bedrock 上可用。該系列包括三種指令微調變體：Gemma 4 31B、Gemma 4 26B-A4B 和 Gemma 4 E2B，涵蓋密集和混合專家（MoE）架構。它們提供內置推理、原生函數調用以及文本和圖像的多模態輸入。Amazon Bedrock 通過完全託管的服務提供這些模型，確保數據保護、監管合規和運營控制。

Gemma 4 系列包含三種變體：31B 密集、26B-A4B MoE 和 E2B PLE。
支持內置推理模式、函數調用和文本/圖像多模態輸入。

使用Strands Evals進行AI智能體故障檢測與根因分析

2026-06-16 02:07 UTC+8

本文介紹了Strands Evals SDK中的檢測器，它可以自動識別AI智能體執行軌跡中的故障並進行根因分析，將診斷時間從數小時縮短至數分鐘。文章詳細講解了如何調用檢測函數、解讀結構化輸出（包括分類故障、置信度、因果鏈和修復建議），以及如何將檢測集成到評估管線中實現自動化診斷。

檢測器分為兩階段：故障檢測（識別軌跡中的9大類故障）和根因分析（區分根本原因與下游症狀，並給出修復建議）。
通過detect_failures和analyze_root_cause函數可分別獲取故障和根因，diagnose_session提供一站式診斷。

使用Deep Agents和Bedrock AgentCore構建上下文豐富的研究型Agent

2026-06-15 21:56 UTC+8

本文介紹如何利用LangChain Deep Agents和Amazon Bedrock AgentCore構建一個能夠並行瀏覽網頁、執行數據分析並長期記憶研究結果的競爭情報研究Agent。通過將深度工作委託給隔離的子Agent，有效解決AI研究工作流中上下文窗口受限的問題。

Deep Agents負責編排多個專用子Agent，每個子Agent在獨立的Bedrock AgentCore MicroVM中運行。
研究型子Agent並行瀏覽競爭對手網站，分析性子Agent生成對比圖表和報告。

AWS Machine Learning Blog