AWS Machine Learning Blog AI 新聞來源

公開文章 131採集文章 143可信度 88刷新頻率 30 分鐘

健康狀態健康來源類型官方原文權限 官方原文最近入庫 2026-06-26ID aws-ml-blog運行狀態 已啟用

Official cloud provider blog; confirm reuse terms before enabling full body display.

最新公開文章

構建互動式PDF文本提取：從Amazon S3即時獲取文件內容

2026-06-26 22:47 UTC+8

本文介紹如何構建一個基於MCP協議的伺服器，從Amazon S3中即時提取PDF文本，實現按需文件訪問。文章比較了該方案與Amazon Textract的適用場景，並提供了詳細的實施步驟、成本估算和安全考量。

使用MCP協議構建伺服器，實現從S3即時提取PDF文本。
適用於文本型PDF，無需OCR，適合開發和概念驗證環境。

Cara攜手AWS為保險經紀公司打造領域專屬AI解決方案

2026-06-26 22:42 UTC+8

Cara是一款基於AWS構建的AI原生解決方案，專注於自動化保險經紀公司的後臺流程。透過Amazon EKS和Amazon Bedrock的支援，Cara實現了領域專屬的AI工作流，為經紀公司帶來每個使用者每週約10小時的時間節省，並支援數千併發使用者。

Cara利用AI自動化保險經紀中重複性任務，解決行業人才短缺問題。
基於AWS構建，使用Amazon EKS管理容器編排，Amazon Bedrock提供大語言模型推理能力。

面向金融合規的生產級AI代理：來自Stripe的經驗教訓

2026-06-26 22:38 UTC+8

Stripe每年處理1.4萬億美元支付量，透過基於Amazon Bedrock的ReAct代理框架，將合規審查處理時間減少26%，同時保持人工監督。本文介紹其技術架構、基礎設施決策以及部署AI代理的經驗教訓，包括任務分解、編排模式和透過提示快取最佳化成本。

Stripe使用ReAct代理框架將合規審查分解為子任務，透過有向無環圖編排，確保質量和可審計性。
AI代理為人類審查員提供預調查資訊，最終決定權仍由人類掌握，實現了96%以上的有用性評級。

改造而非重建：用智慧體覆蓋層改造遺留企業服務

2026-06-26 01:55 UTC+8

本文提出一種實用解決方案——智慧體覆蓋層（Agentic Overlays），這是一種薄包裝層，可將傳統REST服務轉化為能夠參與智慧體間通訊（A2A）的智慧體，同時將REST API暴露為與模型上下文協議（MCP）相容的工具。企業無需重寫業務邏輯、複製程式碼或維護並行基礎設施，即可為現有REST服務新增A2A能力，並減少基礎設施中的智慧體氾濫。文章提供了參考架構和示例程式碼。

智慧體覆蓋層是薄包裝層，將REST服務轉變為A2A智慧體，並暴露MCP工具。
無需重寫業務邏輯或維護並行基礎設施，降低成本和複雜性。

使用 NVIDIA Blackwell 最佳化 Amazon SageMaker AI 上的模型訓練

2026-06-26 00:41 UTC+8

本文介紹瞭如何在 Amazon SageMaker AI 上配置訓練作業，以充分利用 NVIDIA Blackwell 架構的優勢。您將學習如何選擇批大小和序列長度以利用 Blackwell 的擴充套件記憶體，為模型大小（1B 到 64B 引數）選擇合適的精度格式，並策略性地應用啟用檢查點。最終，您將獲得一個實用的框架來調整訓練配置並在 P6-B200 例項上啟動分散式訓練作業。

Blackwell 的擴充套件記憶體支援更大的批大小、更長的序列長度和簡化的模型分片。
啟用檢查點對於大模型（~14B+ 引數）是穩定訓練的先決條件。

透過 Amazon SageMaker AI 部署 SeedVR2 實現超解析度

2026-06-26 00:40 UTC+8

本文展示瞭如何使用 SeedVR2 和 Amazon SageMaker AI 實現影片放大。我們介紹瞭解決方案架構、部署步驟，並進行了效能對比，突出了質量提升和處理效率。完成後，您將掌握實現該超解析度解決方案的實用知識。

SeedVR2 是字節跳動開源影片修復模型，結合擴散模型和 GAN 實現高效影片放大。
解決方案採用三層 AWS 架構，包括安全、儲存和 SageMaker 處理管道。

使用由Amazon Bedrock支援的AI代理構建自助式AWS健康分析，以發現可操作的健康洞察

2026-06-26 00:38 UTC+8

本文介紹如何構建Chaplin（客戶健康與計劃生命週期智慧聯結器），這是一個開源解決方案，利用透過模型上下文協議（MCP）暴露的AI代理，提供自助式健康事件分析。Chaplin允許團隊用自然語言提問，並從MCP相容的AI助手獲得精確、上下文化的答案，無需依賴AWS支援進行常規分析。

Chaplin是一個開源解決方案，使用AI代理透過MCP提供自助式AWS健康事件分析。
它解決了運營團隊依賴TAM解釋健康事件的瓶頸問題。

在AWS上使用現代資料網格策略構建自主AI應用

2026-06-26 00:35 UTC+8

本文展示瞭如何在AWS上構建一個受治理的無伺服器資料網格，為生產級自主AI提供安全、可擴充套件的資料基礎。架構透過S3 Tables（Iceberg）、S3 Vectors和AgentCore Gateway實現三層治理，解決自主AI多步驟資料訪問中的授權問題。

自主AI需要從工具發現到查詢執行的每一步都進行細粒度訪問控制，傳統RAG的單點治理模式無法滿足。
使用Amazon S3 Tables（內建Iceberg支援）和AWS Lake Formation實現行/列/單元格級安全，交易效能提升10倍。

使用 Amazon Nova 2 Sonic 構建醫療預約語音助手

2026-06-25 02:20 UTC+8

本文介紹如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 構建一個語音助手，用於處理醫療預約提醒對話。該助手能夠透過語音驗證患者身份、管理預約（確認、取消或改期）、收集就診前健康資訊，並在必要時轉接人工客服。它可大規模處理常規電話，有助於降低失約率。示例聚焦於智慧代理層面的語音對話與工具編排，並提供基於瀏覽器的測試介面。

使用 Amazon Nova 2 Sonic 的原生語音到語音模型，保留語氣等上下文資訊。
透過 Amazon Bedrock AgentCore 實現無伺服器執行時，整合七項醫療專用工具。

利用 Snowflake 和 Amazon QuickSight 實現 AI 驅動型商業智慧

2026-06-25 02:19 UTC+8

本文介紹瞭如何構建 Snowflake 語義檢視與 Amazon QuickSight 之間的端到端整合，使用電影評論資料作為示例，展示如何透過自然語言查詢和分析資料，確保業務邏輯的一致性和減少 AI 幻覺。

語義檢視將業務定義直接附加到資料層，確保 AI 和 BI 系統統一解釋資訊
透過 Cortex Analyst 進行自然語言查詢，降低 AI 幻覺風險

Loka 如何利用 Amazon Nova 2 Sonic 構建自然、低延遲的語音代理

2026-06-25 00:56 UTC+8

Loka 使用 Amazon Nova 2 Sonic 構建了對話式 AI 代理，透過原生語音到語音模型解決了傳統語音助手延遲高、不自然的問題，實現了低成本、高準確率的客戶互動。

傳統語音代理因三步處理流程（語音轉文本、LLM 處理、文本轉語音）導致 3-5 秒延遲，破壞對話自然性，增加成本。
Amazon Nova 2 Sonic 採用端到端語音處理，Big Bench Audio 得分 87.0，首次響應時間 1.39 秒，每小時成本約 0.27 美元。

使用 Amazon Bedrock AgentCore 構建蛋白質研究助手

2026-06-24 00:39 UTC+8

本文展示瞭如何構建一個對話式蛋白質研究助手，它結合了自然語言查詢解析、蛋白質嵌入向量相似度搜尋和AI生成的科學摘要，幫助研究人員高效地在大數據集中搜尋結構相似的肽段。

使用 Strands Agents SDK 協調三個專用工具：解析器、搜尋器和摘要器，部署到 Amazon Bedrock AgentCore。
利用 ESM-C 300M 蛋白質語言模型生成嵌入向量，透過 Amazon Aurora PostgreSQL 的 pgvector 進行向量相似度搜尋。

共享基礎設施，隔離租戶：使用 Amazon Bedrock AgentCore 實現池模型多租戶

2026-06-23 23:43 UTC+8

本文介紹瞭如何使用 Amazon Bedrock AgentCore 構建生產級多租戶 AI 系統的模式，透過醫療 AI 助手示例展示了租戶隔離、服務層級差異化、成本追蹤和可觀測性等關鍵能力。

利用 Amazon Bedrock AgentCore 原生能力實現完整的租戶隔離。
透過層級策略（如基礎版和高階版）實現服務差異化。

為AI代理構建按智慧付費：Ampersend如何使用Amazon Bedrock AgentCore Payments

2026-06-23 01:53 UTC+8

Ampersend在Amazon Bedrock AgentCore Payments之上構建了一個按智慧付費的路由層，使AI代理能夠使用x402協議自主支付模型服務費用。該整合處理錢包託管、支出治理和兩跳結算，將開發時間從數月縮短至兩週以內。

Ampersend與Amazon Bedrock AgentCore Payments整合，為AI代理提供自主按智慧付費功能。
解決方案採用兩跳支付模式：代理向Ampersend支付，Ampersend再向模型提供商支付。

本文探討了如何利用多模態嵌入、大語言模型標註和向量搜尋，將航拍影像庫轉化為可自然語言搜尋的知識庫。透過使用Amazon Bedrock和Amazon OpenSearch Serverless構建的五階段管道，評估了不同嵌入模型、融合策略、標註方法和搜尋技術。實驗表明，Amazon Nova Multimodal Embeddings在基準查詢中獲得了最高的F1分數。該工作已發展為Vexcel Intelligence產品。

航拍影像搜尋面臨多視角、無標註資料集、語義模糊等挑戰。
採用五階段架構：定義區域、攝取影像、嵌入與索引、搜尋、評估。

在Amazon SageMaker AI處理作業上執行ComfyUI工作流

2026-06-23 00:28 UTC+8

本文介紹瞭如何在Amazon SageMaker AI處理作業上部署ComfyUI工作流，以批次生成高質量影像。涵蓋使用AWS CDK設定基礎設施、配置GPU加速處理以及自動化大規模影像生成的步驟。該解決方案可適應自定義工作流，幫助擴充套件創意管線。

教程演示了使用ComfyUI和SageMaker AI批次生成數百張影像。
透過AWS CDK部署，包括資料棧、安全棧和ComfyUI棧。

Amazon Bedrock AgentCore 推出網頁搜尋功能

2026-06-19 22:15 UTC+8

亞馬遜 Bedrock AgentCore 網頁搜尋功能現已全面可用。該功能透過完全託管的 MCP 相容介面，讓 AI 代理能夠獲取即時網頁資訊。它基於亞馬遜自建的包含數百億文件的網頁索引，保證查詢在 AWS 內部處理，無需管理第三方 API 或憑證。

網頁搜尋功能解決了 AI 代理知識陳舊的問題，可獲取即時資料。
使用亞馬遜自建的網頁索引，覆蓋數百億文件，分鐘級更新。

利用 Adobe Marketing Agent for Amazon Quick 加速營銷活動工作流程

2026-06-19 22:05 UTC+8

本文介紹瞭如何透過模型上下文協議（MCP）將 Adobe Marketing Agent 與 Amazon Quick 整合，使營銷人員能夠透過自然語言對話獲取受眾排名、忠誠度細分、旅程使用情況和衝突分析等關鍵洞察。文章詳細說明了先決條件、配置步驟、身份驗證、建立聊天代理以及驗證工作流程。

透過 MCP 將 Adobe Marketing Agent 與 Amazon Quick 整合，實現自然語言查詢營銷洞察。
配置品牌聯結器、管理工具許可權併發布連線。

使用 SageMaker 詳細指標和 CloudWatch Insights 儀表板監控和除錯生成式 AI 推理

2026-06-19 07:31 UTC+8

Amazon SageMaker AI 現在提供超過 100 種詳細的推理指標，涵蓋 GPU 健康、令牌級延遲、KV 快取壓力、可用區流量分佈等。這些指標透過內建的 SageMaker Insights 儀表板在 CloudWatch 中展示，支援 PromQL 查詢。本文介紹如何啟用詳細可觀測性、導航儀表板以及將指標連線到外部工具。

SageMaker 推理端點現在預設發出超過 100 種詳細的 OpenTelemetry 指標到 CloudWatch。
新的 SageMaker Insights 儀表板提供效能、容量和可靠性三個檢視，幫助快速定位延遲和資源問題。

Amazon Bedrock AgentCore Harness 現已正式上市：數分鐘內從創意到生產級智慧體

2026-06-19 01:32 UTC+8

Amazon Bedrock AgentCore Harness 現已正式釋出，允許開發者透過兩次 API 呼叫即可建立並執行一個功能完整的智慧體。該工具提供隔離的執行環境、內建記憶、工具整合、技能庫以及即時追蹤能力，無需編寫編排程式碼或構建容器。

CreateHarness 和 InvokeHarness 兩個 API 呼叫即可快速建立和執行智慧體
智慧體擁有隔離的檔案系統和 shell，可安全執行程式碼和命令

Amazon SageMaker AI 非同步推理現在支援內聯請求負載

2026-06-18 04:56 UTC+8

Amazon SageMaker AI 非同步推理新增內聯負載支援，客戶可直接在 InvokeEndpointAsync API 的請求體中傳送推理負載，無需先上傳到 S3。對於不超過128KB的負載，此舉消除了網路往返，簡化了客戶端程式碼，並減少了操作複雜度。

新增 Body 引數，允許直接傳送最大128KB的內聯負載，與 InputLocation 互斥。
簡化客戶端程式碼，無需 S3 客戶端、IAM 許可權和輸入桶管理。

使用 Amazon Quick 中的自主代理每天節省數小時

2026-06-18 04:35 UTC+8

Amazon Quick 推出了自主代理，可連續為您工作，還有活動摘要幫助您優先處理最重要的工作，並能夠透過單個問題跨所有資料來源尋找洞察，幫助使用者每天節省時間。

Quick 中的新自主代理可連續在後臺處理任務。
活動摘要整合並優先處理跨應用的通訊。

為您的資料和AI代理提供規模化上下文智慧

2026-06-18 01:17 UTC+8

在AWS紐約峰會上，AWS宣佈了一系列創新，包括AWS Context（即將推出）、AWS Glue資料目錄業務上下文與語義搜尋（預覽版）以及Amazon S3註釋（正式可用），旨在為AI代理提供可信任的上下文，使其能夠安全地訪問分散在資料湖、資料倉儲、資料庫和流中的資料以及機構知識。這些服務透過知識圖譜、身份感知訪問和開放式標準，幫助組織構建一個共享、可治理的上下文層，從而提升AI代理的決策能力。

AWS Context透過知識圖譜自動對映資料關係，提供代理搜尋，使AI代理能在執行時訪問治理後的資料關係和業務規則。
AWS Glue資料目錄新增業務上下文和語義搜尋，支援用業務描述和術語豐富技術後設資料，並透過技能資產為代理提供額外指導。

Amazon Bedrock AgentCore 新功能：構建具備更廣泛知識和持續學習能力的智慧體

2026-06-17 23:29 UTC+8

Amazon Bedrock AgentCore 推出了新功能，可將智慧體連線到組織、網路和付費知識庫，並提供持續最佳化的功能和增強的策略控制。

智慧體透過託管知識庫、網路搜尋和付費內容（透過AgentCore支付）獲得原生訪問許可權。
最佳化功能包括失敗/意圖/軌跡洞察、建議和A/B測試，實現持續改進。

使用Amazon Bedrock Guardrails InvokeGuardrailChecks API保護您的Agentic AI應用

2026-06-17 06:46 UTC+8

Amazon Bedrock Guardrails推出了新的InvokeGuardrailChecks API，允許在Agentic AI應用的任意環節應用獨立的安全檢查，無需建立Guardrail資源。該API以僅檢測模式執行，返回數值分數，使您能夠自定義閾值和操作。本文介紹了API的工作原理及如何構建安全的多輪Agentic AI應用。

InvokeGuardrailChecks API無需預先建立Guardrail資源，可在Agent迴圈中靈活呼叫安全檢查。
API支援內容過濾、提示攻擊檢測和敏感資訊過濾，返回嚴重性或置信度分數。

Amazon SageMaker AI 推出容器快取，加速模型擴充套件

2026-06-17 04:16 UTC+8

Amazon SageMaker AI 宣佈容器映象快取功能，可將擴充套件事件中的端到端延遲最多降低 2 倍，尤其適用於生成式 AI 模型。

容器快取自動為支援的例項型別啟用，無需修改。
在新例項啟動時消除容器映象拉取步驟，端到端啟動延遲降低最多 51%。

在 Amazon SageMaker AI 上使用 P-EAGLE 實現推測解碼並行化

2026-06-17 01:47 UTC+8

本篇文章指導您如何在 Amazon SageMaker AI 中直接使用 P-EAGLE，展示如何從 SageMaker JumpStart 目錄中選擇相容模型、配置並行草稿規格，並部署高度最佳化的即時 SageMaker AI 端點以加速生成式 AI 應用。

P-EAGLE 透過一次前向傳播並行預測所有草稿令牌，消除了傳統推測解碼的序列瓶頸。
相比 EAGLE-3，在真實基準測試中吞吐量提升高達 1.69 倍。

在 Amazon Bedrock 上推出 Gemma 4 模型

2026-06-16 04:24 UTC+8

Google DeepMind 構建的 Gemma 4 系列開放權重模型現已在 Amazon Bedrock 上可用。該系列包括三種指令微調變體：Gemma 4 31B、Gemma 4 26B-A4B 和 Gemma 4 E2B，涵蓋密集和混合專家（MoE）架構。它們提供內建推理、原生函式呼叫以及文本和影像的多模態輸入。Amazon Bedrock 透過完全託管的服務提供這些模型，確保資料保護、監管合規和運營控制。

Gemma 4 系列包含三種變體：31B 密集、26B-A4B MoE 和 E2B PLE。
支援內建推理模式、函式呼叫和文本/影像多模態輸入。

使用Strands Evals進行AI智慧體故障檢測與根因分析

2026-06-16 02:07 UTC+8

本文介紹了Strands Evals SDK中的檢測器，它可以自動識別AI智慧體執行軌跡中的故障並進行根因分析，將診斷時間從數小時縮短至數分鐘。文章詳細講解了如何呼叫檢測函式、解讀結構化輸出（包括分類故障、置信度、因果鏈和修復建議），以及如何將檢測整合到評估管線中實現自動化診斷。

檢測器分為兩階段：故障檢測（識別軌跡中的9大類故障）和根因分析（區分根本原因與下游症狀，並給出修復建議）。
透過detect_failures和analyze_root_cause函式可分別獲取故障和根因，diagnose_session提供一站式診斷。

使用Deep Agents和Bedrock AgentCore構建上下文豐富的研究型Agent

2026-06-15 21:56 UTC+8

本文介紹如何利用LangChain Deep Agents和Amazon Bedrock AgentCore構建一個能夠並行瀏覽網頁、執行資料分析並長期記憶研究結果的競爭情報研究Agent。透過將深度工作委託給隔離的子Agent，有效解決AI研究工作流中上下文視窗受限的問題。

Deep Agents負責編排多個專用子Agent，每個子Agent在獨立的Bedrock AgentCore MicroVM中執行。
研究型子Agent並行瀏覽競爭對手網站，分析性子Agent生成對比圖表和報告。

AWS Machine Learning Blog