AI News HubLIVE
公開文章 131採集文章 143可信度 88刷新頻率 30 分鐘
健康狀態 健康來源類型 官方原文權限 官方原文最近入庫 2026-06-26ID aws-ml-blog運行狀態 已啟用

Official cloud provider blog; confirm reuse terms before enabling full body display.

最新公開文章

構建互動式PDF文本提取:從Amazon S3即時獲取文件內容

本文介紹如何構建一個基於MCP協議的伺服器,從Amazon S3中即時提取PDF文本,實現按需文件訪問。文章比較了該方案與Amazon Textract的適用場景,並提供了詳細的實施步驟、成本估算和安全考量。

  • 使用MCP協議構建伺服器,實現從S3即時提取PDF文本。
  • 適用於文本型PDF,無需OCR,適合開發和概念驗證環境。
站內正文

Cara攜手AWS為保險經紀公司打造領域專屬AI解決方案

Cara是一款基於AWS構建的AI原生解決方案,專注於自動化保險經紀公司的後臺流程。透過Amazon EKS和Amazon Bedrock的支援,Cara實現了領域專屬的AI工作流,為經紀公司帶來每個使用者每週約10小時的時間節省,並支援數千併發使用者。

  • Cara利用AI自動化保險經紀中重複性任務,解決行業人才短缺問題。
  • 基於AWS構建,使用Amazon EKS管理容器編排,Amazon Bedrock提供大語言模型推理能力。
站內正文

面向金融合規的生產級AI代理:來自Stripe的經驗教訓

Stripe每年處理1.4萬億美元支付量,透過基於Amazon Bedrock的ReAct代理框架,將合規審查處理時間減少26%,同時保持人工監督。本文介紹其技術架構、基礎設施決策以及部署AI代理的經驗教訓,包括任務分解、編排模式和透過提示快取最佳化成本。

  • Stripe使用ReAct代理框架將合規審查分解為子任務,透過有向無環圖編排,確保質量和可審計性。
  • AI代理為人類審查員提供預調查資訊,最終決定權仍由人類掌握,實現了96%以上的有用性評級。
站內正文

改造而非重建:用智慧體覆蓋層改造遺留企業服務

本文提出一種實用解決方案——智慧體覆蓋層(Agentic Overlays),這是一種薄包裝層,可將傳統REST服務轉化為能夠參與智慧體間通訊(A2A)的智慧體,同時將REST API暴露為與模型上下文協議(MCP)相容的工具。企業無需重寫業務邏輯、複製程式碼或維護並行基礎設施,即可為現有REST服務新增A2A能力,並減少基礎設施中的智慧體氾濫。文章提供了參考架構和示例程式碼。

  • 智慧體覆蓋層是薄包裝層,將REST服務轉變為A2A智慧體,並暴露MCP工具。
  • 無需重寫業務邏輯或維護並行基礎設施,降低成本和複雜性。
站內正文

使用 NVIDIA Blackwell 最佳化 Amazon SageMaker AI 上的模型訓練

本文介紹瞭如何在 Amazon SageMaker AI 上配置訓練作業,以充分利用 NVIDIA Blackwell 架構的優勢。您將學習如何選擇批大小和序列長度以利用 Blackwell 的擴充套件記憶體,為模型大小(1B 到 64B 引數)選擇合適的精度格式,並策略性地應用啟用檢查點。最終,您將獲得一個實用的框架來調整訓練配置並在 P6-B200 例項上啟動分散式訓練作業。

  • Blackwell 的擴充套件記憶體支援更大的批大小、更長的序列長度和簡化的模型分片。
  • 啟用檢查點對於大模型(~14B+ 引數)是穩定訓練的先決條件。
站內正文

透過 Amazon SageMaker AI 部署 SeedVR2 實現超解析度

本文展示瞭如何使用 SeedVR2 和 Amazon SageMaker AI 實現影片放大。我們介紹瞭解決方案架構、部署步驟,並進行了效能對比,突出了質量提升和處理效率。完成後,您將掌握實現該超解析度解決方案的實用知識。

  • SeedVR2 是字節跳動開源影片修復模型,結合擴散模型和 GAN 實現高效影片放大。
  • 解決方案採用三層 AWS 架構,包括安全、儲存和 SageMaker 處理管道。
站內正文

使用由Amazon Bedrock支援的AI代理構建自助式AWS健康分析,以發現可操作的健康洞察

本文介紹如何構建Chaplin(客戶健康與計劃生命週期智慧聯結器),這是一個開源解決方案,利用透過模型上下文協議(MCP)暴露的AI代理,提供自助式健康事件分析。Chaplin允許團隊用自然語言提問,並從MCP相容的AI助手獲得精確、上下文化的答案,無需依賴AWS支援進行常規分析。

  • Chaplin是一個開源解決方案,使用AI代理透過MCP提供自助式AWS健康事件分析。
  • 它解決了運營團隊依賴TAM解釋健康事件的瓶頸問題。
站內正文

在AWS上使用現代資料網格策略構建自主AI應用

本文展示瞭如何在AWS上構建一個受治理的無伺服器資料網格,為生產級自主AI提供安全、可擴充套件的資料基礎。架構透過S3 Tables(Iceberg)、S3 Vectors和AgentCore Gateway實現三層治理,解決自主AI多步驟資料訪問中的授權問題。

  • 自主AI需要從工具發現到查詢執行的每一步都進行細粒度訪問控制,傳統RAG的單點治理模式無法滿足。
  • 使用Amazon S3 Tables(內建Iceberg支援)和AWS Lake Formation實現行/列/單元格級安全,交易效能提升10倍。
站內正文

使用 Amazon Nova 2 Sonic 構建醫療預約語音助手

本文介紹如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 構建一個語音助手,用於處理醫療預約提醒對話。該助手能夠透過語音驗證患者身份、管理預約(確認、取消或改期)、收集就診前健康資訊,並在必要時轉接人工客服。它可大規模處理常規電話,有助於降低失約率。示例聚焦於智慧代理層面的語音對話與工具編排,並提供基於瀏覽器的測試介面。

  • 使用 Amazon Nova 2 Sonic 的原生語音到語音模型,保留語氣等上下文資訊。
  • 透過 Amazon Bedrock AgentCore 實現無伺服器執行時,整合七項醫療專用工具。
站內正文

利用 Snowflake 和 Amazon QuickSight 實現 AI 驅動型商業智慧

本文介紹瞭如何構建 Snowflake 語義檢視與 Amazon QuickSight 之間的端到端整合,使用電影評論資料作為示例,展示如何透過自然語言查詢和分析資料,確保業務邏輯的一致性和減少 AI 幻覺。

  • 語義檢視將業務定義直接附加到資料層,確保 AI 和 BI 系統統一解釋資訊
  • 透過 Cortex Analyst 進行自然語言查詢,降低 AI 幻覺風險
站內正文

Loka 如何利用 Amazon Nova 2 Sonic 構建自然、低延遲的語音代理

Loka 使用 Amazon Nova 2 Sonic 構建了對話式 AI 代理,透過原生語音到語音模型解決了傳統語音助手延遲高、不自然的問題,實現了低成本、高準確率的客戶互動。

  • 傳統語音代理因三步處理流程(語音轉文本、LLM 處理、文本轉語音)導致 3-5 秒延遲,破壞對話自然性,增加成本。
  • Amazon Nova 2 Sonic 採用端到端語音處理,Big Bench Audio 得分 87.0,首次響應時間 1.39 秒,每小時成本約 0.27 美元。
站內正文

使用 Amazon Bedrock AgentCore 構建蛋白質研究助手

本文展示瞭如何構建一個對話式蛋白質研究助手,它結合了自然語言查詢解析、蛋白質嵌入向量相似度搜尋和AI生成的科學摘要,幫助研究人員高效地在大數據集中搜尋結構相似的肽段。

  • 使用 Strands Agents SDK 協調三個專用工具:解析器、搜尋器和摘要器,部署到 Amazon Bedrock AgentCore。
  • 利用 ESM-C 300M 蛋白質語言模型生成嵌入向量,透過 Amazon Aurora PostgreSQL 的 pgvector 進行向量相似度搜尋。
站內正文

共享基礎設施,隔離租戶:使用 Amazon Bedrock AgentCore 實現池模型多租戶

本文介紹瞭如何使用 Amazon Bedrock AgentCore 構建生產級多租戶 AI 系統的模式,透過醫療 AI 助手示例展示了租戶隔離、服務層級差異化、成本追蹤和可觀測性等關鍵能力。

  • 利用 Amazon Bedrock AgentCore 原生能力實現完整的租戶隔離。
  • 透過層級策略(如基礎版和高階版)實現服務差異化。
站內正文

為AI代理構建按智慧付費:Ampersend如何使用Amazon Bedrock AgentCore Payments

Ampersend在Amazon Bedrock AgentCore Payments之上構建了一個按智慧付費的路由層,使AI代理能夠使用x402協議自主支付模型服務費用。該整合處理錢包託管、支出治理和兩跳結算,將開發時間從數月縮短至兩週以內。

  • Ampersend與Amazon Bedrock AgentCore Payments整合,為AI代理提供自主按智慧付費功能。
  • 解決方案採用兩跳支付模式:代理向Ampersend支付,Ampersend再向模型提供商支付。
站內正文

嵌入世界:大規模可搜尋航拍影像的多模態AI

本文探討了如何利用多模態嵌入、大語言模型標註和向量搜尋,將航拍影像庫轉化為可自然語言搜尋的知識庫。透過使用Amazon Bedrock和Amazon OpenSearch Serverless構建的五階段管道,評估了不同嵌入模型、融合策略、標註方法和搜尋技術。實驗表明,Amazon Nova Multimodal Embeddings在基準查詢中獲得了最高的F1分數。該工作已發展為Vexcel Intelligence產品。

  • 航拍影像搜尋面臨多視角、無標註資料集、語義模糊等挑戰。
  • 採用五階段架構:定義區域、攝取影像、嵌入與索引、搜尋、評估。
站內正文

在Amazon SageMaker AI處理作業上執行ComfyUI工作流

本文介紹瞭如何在Amazon SageMaker AI處理作業上部署ComfyUI工作流,以批次生成高質量影像。涵蓋使用AWS CDK設定基礎設施、配置GPU加速處理以及自動化大規模影像生成的步驟。該解決方案可適應自定義工作流,幫助擴充套件創意管線。

  • 教程演示了使用ComfyUI和SageMaker AI批次生成數百張影像。
  • 透過AWS CDK部署,包括資料棧、安全棧和ComfyUI棧。
站內正文

Amazon Bedrock AgentCore 推出網頁搜尋功能

亞馬遜 Bedrock AgentCore 網頁搜尋功能現已全面可用。該功能透過完全託管的 MCP 相容介面,讓 AI 代理能夠獲取即時網頁資訊。它基於亞馬遜自建的包含數百億文件的網頁索引,保證查詢在 AWS 內部處理,無需管理第三方 API 或憑證。

  • 網頁搜尋功能解決了 AI 代理知識陳舊的問題,可獲取即時資料。
  • 使用亞馬遜自建的網頁索引,覆蓋數百億文件,分鐘級更新。
站內正文

利用 Adobe Marketing Agent for Amazon Quick 加速營銷活動工作流程

本文介紹瞭如何透過模型上下文協議(MCP)將 Adobe Marketing Agent 與 Amazon Quick 整合,使營銷人員能夠透過自然語言對話獲取受眾排名、忠誠度細分、旅程使用情況和衝突分析等關鍵洞察。文章詳細說明了先決條件、配置步驟、身份驗證、建立聊天代理以及驗證工作流程。

  • 透過 MCP 將 Adobe Marketing Agent 與 Amazon Quick 整合,實現自然語言查詢營銷洞察。
  • 配置品牌聯結器、管理工具許可權併發布連線。
站內正文

使用 SageMaker 詳細指標和 CloudWatch Insights 儀表板監控和除錯生成式 AI 推理

Amazon SageMaker AI 現在提供超過 100 種詳細的推理指標,涵蓋 GPU 健康、令牌級延遲、KV 快取壓力、可用區流量分佈等。這些指標透過內建的 SageMaker Insights 儀表板在 CloudWatch 中展示,支援 PromQL 查詢。本文介紹如何啟用詳細可觀測性、導航儀表板以及將指標連線到外部工具。

  • SageMaker 推理端點現在預設發出超過 100 種詳細的 OpenTelemetry 指標到 CloudWatch。
  • 新的 SageMaker Insights 儀表板提供效能、容量和可靠性三個檢視,幫助快速定位延遲和資源問題。
站內正文

Amazon Bedrock AgentCore Harness 現已正式上市:數分鐘內從創意到生產級智慧體

Amazon Bedrock AgentCore Harness 現已正式釋出,允許開發者透過兩次 API 呼叫即可建立並執行一個功能完整的智慧體。該工具提供隔離的執行環境、內建記憶、工具整合、技能庫以及即時追蹤能力,無需編寫編排程式碼或構建容器。

  • CreateHarness 和 InvokeHarness 兩個 API 呼叫即可快速建立和執行智慧體
  • 智慧體擁有隔離的檔案系統和 shell,可安全執行程式碼和命令
站內正文

Amazon SageMaker AI 非同步推理現在支援內聯請求負載

Amazon SageMaker AI 非同步推理新增內聯負載支援,客戶可直接在 InvokeEndpointAsync API 的請求體中傳送推理負載,無需先上傳到 S3。對於不超過128KB的負載,此舉消除了網路往返,簡化了客戶端程式碼,並減少了操作複雜度。

  • 新增 Body 引數,允許直接傳送最大128KB的內聯負載,與 InputLocation 互斥。
  • 簡化客戶端程式碼,無需 S3 客戶端、IAM 許可權和輸入桶管理。
站內正文

使用 Amazon Quick 中的自主代理每天節省數小時

Amazon Quick 推出了自主代理,可連續為您工作,還有活動摘要幫助您優先處理最重要的工作,並能夠透過單個問題跨所有資料來源尋找洞察,幫助使用者每天節省時間。

  • Quick 中的新自主代理可連續在後臺處理任務。
  • 活動摘要整合並優先處理跨應用的通訊。
站內正文

為您的資料和AI代理提供規模化上下文智慧

在AWS紐約峰會上,AWS宣佈了一系列創新,包括AWS Context(即將推出)、AWS Glue資料目錄業務上下文與語義搜尋(預覽版)以及Amazon S3註釋(正式可用),旨在為AI代理提供可信任的上下文,使其能夠安全地訪問分散在資料湖、資料倉儲、資料庫和流中的資料以及機構知識。這些服務透過知識圖譜、身份感知訪問和開放式標準,幫助組織構建一個共享、可治理的上下文層,從而提升AI代理的決策能力。

  • AWS Context透過知識圖譜自動對映資料關係,提供代理搜尋,使AI代理能在執行時訪問治理後的資料關係和業務規則。
  • AWS Glue資料目錄新增業務上下文和語義搜尋,支援用業務描述和術語豐富技術後設資料,並透過技能資產為代理提供額外指導。
站內正文

Amazon Bedrock AgentCore 新功能:構建具備更廣泛知識和持續學習能力的智慧體

Amazon Bedrock AgentCore 推出了新功能,可將智慧體連線到組織、網路和付費知識庫,並提供持續最佳化的功能和增強的策略控制。

  • 智慧體透過託管知識庫、網路搜尋和付費內容(透過AgentCore支付)獲得原生訪問許可權。
  • 最佳化功能包括失敗/意圖/軌跡洞察、建議和A/B測試,實現持續改進。
站內正文

使用Amazon Bedrock Guardrails InvokeGuardrailChecks API保護您的Agentic AI應用

Amazon Bedrock Guardrails推出了新的InvokeGuardrailChecks API,允許在Agentic AI應用的任意環節應用獨立的安全檢查,無需建立Guardrail資源。該API以僅檢測模式執行,返回數值分數,使您能夠自定義閾值和操作。本文介紹了API的工作原理及如何構建安全的多輪Agentic AI應用。

  • InvokeGuardrailChecks API無需預先建立Guardrail資源,可在Agent迴圈中靈活呼叫安全檢查。
  • API支援內容過濾、提示攻擊檢測和敏感資訊過濾,返回嚴重性或置信度分數。
站內正文

Amazon SageMaker AI 推出容器快取,加速模型擴充套件

Amazon SageMaker AI 宣佈容器映象快取功能,可將擴充套件事件中的端到端延遲最多降低 2 倍,尤其適用於生成式 AI 模型。

  • 容器快取自動為支援的例項型別啟用,無需修改。
  • 在新例項啟動時消除容器映象拉取步驟,端到端啟動延遲降低最多 51%。
站內正文

在 Amazon SageMaker AI 上使用 P-EAGLE 實現推測解碼並行化

本篇文章指導您如何在 Amazon SageMaker AI 中直接使用 P-EAGLE,展示如何從 SageMaker JumpStart 目錄中選擇相容模型、配置並行草稿規格,並部署高度最佳化的即時 SageMaker AI 端點以加速生成式 AI 應用。

  • P-EAGLE 透過一次前向傳播並行預測所有草稿令牌,消除了傳統推測解碼的序列瓶頸。
  • 相比 EAGLE-3,在真實基準測試中吞吐量提升高達 1.69 倍。
站內正文

在 Amazon Bedrock 上推出 Gemma 4 模型

Google DeepMind 構建的 Gemma 4 系列開放權重模型現已在 Amazon Bedrock 上可用。該系列包括三種指令微調變體:Gemma 4 31B、Gemma 4 26B-A4B 和 Gemma 4 E2B,涵蓋密集和混合專家(MoE)架構。它們提供內建推理、原生函式呼叫以及文本和影像的多模態輸入。Amazon Bedrock 透過完全託管的服務提供這些模型,確保資料保護、監管合規和運營控制。

  • Gemma 4 系列包含三種變體:31B 密集、26B-A4B MoE 和 E2B PLE。
  • 支援內建推理模式、函式呼叫和文本/影像多模態輸入。
站內正文

使用Strands Evals進行AI智慧體故障檢測與根因分析

本文介紹了Strands Evals SDK中的檢測器,它可以自動識別AI智慧體執行軌跡中的故障並進行根因分析,將診斷時間從數小時縮短至數分鐘。文章詳細講解了如何呼叫檢測函式、解讀結構化輸出(包括分類故障、置信度、因果鏈和修復建議),以及如何將檢測整合到評估管線中實現自動化診斷。

  • 檢測器分為兩階段:故障檢測(識別軌跡中的9大類故障)和根因分析(區分根本原因與下游症狀,並給出修復建議)。
  • 透過detect_failures和analyze_root_cause函式可分別獲取故障和根因,diagnose_session提供一站式診斷。
站內正文

使用Deep Agents和Bedrock AgentCore構建上下文豐富的研究型Agent

本文介紹如何利用LangChain Deep Agents和Amazon Bedrock AgentCore構建一個能夠並行瀏覽網頁、執行資料分析並長期記憶研究結果的競爭情報研究Agent。透過將深度工作委託給隔離的子Agent,有效解決AI研究工作流中上下文視窗受限的問題。

  • Deep Agents負責編排多個專用子Agent,每個子Agent在獨立的Bedrock AgentCore MicroVM中執行。
  • 研究型子Agent並行瀏覽競爭對手網站,分析性子Agent生成對比圖表和報告。
站內正文

全部來源