AI News HubLIVE
公開文章 131採集文章 143可信度 88刷新頻率 30 分鐘
健康狀態 健康來源類型 官方原文權限 官方原文最近入庫 2026-06-26ID aws-ml-blog運行狀態 已啟用

Official cloud provider blog; confirm reuse terms before enabling full body display.

最新公開文章

構建交互式PDF文本提取:從Amazon S3實時獲取文檔內容

本文介紹如何構建一個基於MCP協議的服務器,從Amazon S3中實時提取PDF文本,實現按需文檔訪問。文章比較了該方案與Amazon Textract的適用場景,並提供了詳細的實施步驟、成本估算和安全考量。

  • 使用MCP協議構建服務器,實現從S3實時提取PDF文本。
  • 適用於文本型PDF,無需OCR,適合開發和概念驗證環境。
站內正文

Cara攜手AWS為保險經紀公司打造領域專屬AI解決方案

Cara是一款基於AWS構建的AI原生解決方案,專注於自動化保險經紀公司的後台流程。通過Amazon EKS和Amazon Bedrock的支持,Cara實現了領域專屬的AI工作流,為經紀公司帶來每個用户每週約10小時的時間節省,並支持數千併發用户。

  • Cara利用AI自動化保險經紀中重複性任務,解決行業人才短缺問題。
  • 基於AWS構建,使用Amazon EKS管理容器編排,Amazon Bedrock提供大語言模型推理能力。
站內正文

面向金融合規的生產級AI代理:來自Stripe的經驗教訓

Stripe每年處理1.4萬億美元支付量,通過基於Amazon Bedrock的ReAct代理框架,將合規審查處理時間減少26%,同時保持人工監督。本文介紹其技術架構、基礎設施決策以及部署AI代理的經驗教訓,包括任務分解、編排模式和通過提示緩存優化成本。

  • Stripe使用ReAct代理框架將合規審查分解為子任務,通過有向無環圖編排,確保質量和可審計性。
  • AI代理為人類審查員提供預調查信息,最終決定權仍由人類掌握,實現了96%以上的有用性評級。
站內正文

改造而非重建:用智能體覆蓋層改造遺留企業服務

本文提出一種實用解決方案——智能體覆蓋層(Agentic Overlays),這是一種薄包裝層,可將傳統REST服務轉化為能夠參與智能體間通信(A2A)的智能體,同時將REST API暴露為與模型上下文協議(MCP)兼容的工具。企業無需重寫業務邏輯、複製代碼或維護並行基礎設施,即可為現有REST服務添加A2A能力,並減少基礎設施中的智能體氾濫。文章提供了參考架構和示例代碼。

  • 智能體覆蓋層是薄包裝層,將REST服務轉變為A2A智能體,並暴露MCP工具。
  • 無需重寫業務邏輯或維護並行基礎設施,降低成本和複雜性。
站內正文

使用 NVIDIA Blackwell 優化 Amazon SageMaker AI 上的模型訓練

本文介紹瞭如何在 Amazon SageMaker AI 上配置訓練作業,以充分利用 NVIDIA Blackwell 架構的優勢。您將學習如何選擇批大小和序列長度以利用 Blackwell 的擴展內存,為模型大小(1B 到 64B 參數)選擇合適的精度格式,並策略性地應用激活檢查點。最終,您將獲得一個實用的框架來調整訓練配置並在 P6-B200 實例上啓動分佈式訓練作業。

  • Blackwell 的擴展內存支持更大的批大小、更長的序列長度和簡化的模型分片。
  • 激活檢查點對於大模型(~14B+ 參數)是穩定訓練的先決條件。
站內正文

通過 Amazon SageMaker AI 部署 SeedVR2 實現超分辨率

本文展示瞭如何使用 SeedVR2 和 Amazon SageMaker AI 實現視頻放大。我們介紹瞭解決方案架構、部署步驟,並進行了性能對比,突出了質量提升和處理效率。完成後,您將掌握實現該超分辨率解決方案的實用知識。

  • SeedVR2 是字節跳動開源視頻修復模型,結合擴散模型和 GAN 實現高效視頻放大。
  • 解決方案採用三層 AWS 架構,包括安全、存儲和 SageMaker 處理管道。
站內正文

使用由Amazon Bedrock支持的AI代理構建自助式AWS健康分析,以發現可操作的健康洞察

本文介紹如何構建Chaplin(客户健康與計劃生命週期智能連接器),這是一個開源解決方案,利用通過模型上下文協議(MCP)暴露的AI代理,提供自助式健康事件分析。Chaplin允許團隊用自然語言提問,並從MCP兼容的AI助手獲得精確、上下文化的答案,無需依賴AWS支持進行常規分析。

  • Chaplin是一個開源解決方案,使用AI代理通過MCP提供自助式AWS健康事件分析。
  • 它解決了運營團隊依賴TAM解釋健康事件的瓶頸問題。
站內正文

在AWS上使用現代數據網格策略構建自主AI應用

本文展示瞭如何在AWS上構建一個受治理的無服務器數據網格,為生產級自主AI提供安全、可擴展的數據基礎。架構通過S3 Tables(Iceberg)、S3 Vectors和AgentCore Gateway實現三層治理,解決自主AI多步驟數據訪問中的授權問題。

  • 自主AI需要從工具發現到查詢執行的每一步都進行細粒度訪問控制,傳統RAG的單點治理模式無法滿足。
  • 使用Amazon S3 Tables(內置Iceberg支持)和AWS Lake Formation實現行/列/單元格級安全,交易性能提升10倍。
站內正文

使用 Amazon Nova 2 Sonic 構建醫療預約語音助手

本文介紹如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 構建一個語音助手,用於處理醫療預約提醒對話。該助手能夠通過語音驗證患者身份、管理預約(確認、取消或改期)、收集就診前健康信息,並在必要時轉接人工客服。它可大規模處理常規電話,有助於降低失約率。示例聚焦於智能代理層面的語音對話與工具編排,並提供基於瀏覽器的測試界面。

  • 使用 Amazon Nova 2 Sonic 的原生語音到語音模型,保留語氣等上下文信息。
  • 通過 Amazon Bedrock AgentCore 實現無服務器運行時,集成七項醫療專用工具。
站內正文

利用 Snowflake 和 Amazon QuickSight 實現 AI 驅動型商業智能

本文介紹瞭如何構建 Snowflake 語義視圖與 Amazon QuickSight 之間的端到端集成,使用電影評論數據作為示例,展示如何通過自然語言查詢和分析數據,確保業務邏輯的一致性和減少 AI 幻覺。

  • 語義視圖將業務定義直接附加到數據層,確保 AI 和 BI 系統統一解釋信息
  • 通過 Cortex Analyst 進行自然語言查詢,降低 AI 幻覺風險
站內正文

Loka 如何利用 Amazon Nova 2 Sonic 構建自然、低延遲的語音代理

Loka 使用 Amazon Nova 2 Sonic 構建了對話式 AI 代理,通過原生語音到語音模型解決了傳統語音助手延遲高、不自然的問題,實現了低成本、高準確率的客户互動。

  • 傳統語音代理因三步處理流程(語音轉文本、LLM 處理、文本轉語音)導致 3-5 秒延遲,破壞對話自然性,增加成本。
  • Amazon Nova 2 Sonic 採用端到端語音處理,Big Bench Audio 得分 87.0,首次響應時間 1.39 秒,每小時成本約 0.27 美元。
站內正文

使用 Amazon Bedrock AgentCore 構建蛋白質研究助手

本文展示瞭如何構建一個對話式蛋白質研究助手,它結合了自然語言查詢解析、蛋白質嵌入向量相似度搜索和AI生成的科學摘要,幫助研究人員高效地在大數據集中搜索結構相似的肽段。

  • 使用 Strands Agents SDK 協調三個專用工具:解析器、搜索器和摘要器,部署到 Amazon Bedrock AgentCore。
  • 利用 ESM-C 300M 蛋白質語言模型生成嵌入向量,通過 Amazon Aurora PostgreSQL 的 pgvector 進行向量相似度搜索。
站內正文

共享基礎設施,隔離租户:使用 Amazon Bedrock AgentCore 實現池模型多租户

本文介紹瞭如何使用 Amazon Bedrock AgentCore 構建生產級多租户 AI 系統的模式,通過醫療 AI 助手示例展示了租户隔離、服務層級差異化、成本追蹤和可觀測性等關鍵能力。

  • 利用 Amazon Bedrock AgentCore 原生能力實現完整的租户隔離。
  • 通過層級策略(如基礎版和高級版)實現服務差異化。
站內正文

為AI代理構建按智能付費:Ampersend如何使用Amazon Bedrock AgentCore Payments

Ampersend在Amazon Bedrock AgentCore Payments之上構建了一個按智能付費的路由層,使AI代理能夠使用x402協議自主支付模型服務費用。該集成處理錢包託管、支出治理和兩跳結算,將開發時間從數月縮短至兩週以內。

  • Ampersend與Amazon Bedrock AgentCore Payments集成,為AI代理提供自主按智能付費功能。
  • 解決方案採用兩跳支付模式:代理向Ampersend支付,Ampersend再向模型提供商支付。
站內正文

嵌入世界:大規模可搜索航拍圖像的多模態AI

本文探討了如何利用多模態嵌入、大語言模型標註和向量搜索,將航拍圖像庫轉化為可自然語言搜索的知識庫。通過使用Amazon Bedrock和Amazon OpenSearch Serverless構建的五階段管道,評估了不同嵌入模型、融合策略、標註方法和搜索技術。實驗表明,Amazon Nova Multimodal Embeddings在基準查詢中獲得了最高的F1分數。該工作已發展為Vexcel Intelligence產品。

  • 航拍圖像搜索面臨多視角、無標註數據集、語義模糊等挑戰。
  • 採用五階段架構:定義區域、攝取圖像、嵌入與索引、搜索、評估。
站內正文

在Amazon SageMaker AI處理作業上運行ComfyUI工作流

本文介紹瞭如何在Amazon SageMaker AI處理作業上部署ComfyUI工作流,以批量生成高質量圖像。涵蓋使用AWS CDK設置基礎設施、配置GPU加速處理以及自動化大規模圖像生成的步驟。該解決方案可適應自定義工作流,幫助擴展創意管線。

  • 教程演示了使用ComfyUI和SageMaker AI批量生成數百張圖像。
  • 通過AWS CDK部署,包括數據棧、安全棧和ComfyUI棧。
站內正文

Amazon Bedrock AgentCore 推出網頁搜索功能

亞馬遜 Bedrock AgentCore 網頁搜索功能現已全面可用。該功能通過完全託管的 MCP 兼容接口,讓 AI 代理能夠獲取實時網頁信息。它基於亞馬遜自建的包含數百億文檔的網頁索引,保證查詢在 AWS 內部處理,無需管理第三方 API 或憑證。

  • 網頁搜索功能解決了 AI 代理知識陳舊的問題,可獲取實時數據。
  • 使用亞馬遜自建的網頁索引,覆蓋數百億文檔,分鐘級更新。
站內正文

利用 Adobe Marketing Agent for Amazon Quick 加速營銷活動工作流程

本文介紹瞭如何通過模型上下文協議(MCP)將 Adobe Marketing Agent 與 Amazon Quick 集成,使營銷人員能夠通過自然語言對話獲取受眾排名、忠誠度細分、旅程使用情況和衝突分析等關鍵洞察。文章詳細説明了先決條件、配置步驟、身份驗證、創建聊天代理以及驗證工作流程。

  • 通過 MCP 將 Adobe Marketing Agent 與 Amazon Quick 集成,實現自然語言查詢營銷洞察。
  • 配置品牌連接器、管理工具權限併發布連接。
站內正文

使用 SageMaker 詳細指標和 CloudWatch Insights 儀表板監控和調試生成式 AI 推理

Amazon SageMaker AI 現在提供超過 100 種詳細的推理指標,涵蓋 GPU 健康、令牌級延遲、KV 緩存壓力、可用區流量分佈等。這些指標通過內置的 SageMaker Insights 儀表板在 CloudWatch 中展示,支持 PromQL 查詢。本文介紹如何啓用詳細可觀測性、導航儀表板以及將指標連接到外部工具。

  • SageMaker 推理端點現在默認發出超過 100 種詳細的 OpenTelemetry 指標到 CloudWatch。
  • 新的 SageMaker Insights 儀表板提供性能、容量和可靠性三個視圖,幫助快速定位延遲和資源問題。
站內正文

Amazon Bedrock AgentCore Harness 現已正式上市:數分鐘內從創意到生產級智能體

Amazon Bedrock AgentCore Harness 現已正式發佈,允許開發者通過兩次 API 調用即可創建並運行一個功能完整的智能體。該工具提供隔離的運行環境、內置記憶、工具集成、技能庫以及實時追蹤能力,無需編寫編排代碼或構建容器。

  • CreateHarness 和 InvokeHarness 兩個 API 調用即可快速創建和運行智能體
  • 智能體擁有隔離的文件系統和 shell,可安全執行代碼和命令
站內正文

Amazon SageMaker AI 異步推理現在支持內聯請求負載

Amazon SageMaker AI 異步推理新增內聯負載支持,客户可直接在 InvokeEndpointAsync API 的請求體中發送推理負載,無需先上傳到 S3。對於不超過128KB的負載,此舉消除了網絡往返,簡化了客户端代碼,並減少了操作複雜度。

  • 新增 Body 參數,允許直接發送最大128KB的內聯負載,與 InputLocation 互斥。
  • 簡化客户端代碼,無需 S3 客户端、IAM 權限和輸入桶管理。
站內正文

使用 Amazon Quick 中的自主代理每天節省數小時

Amazon Quick 推出了自主代理,可連續為您工作,還有活動摘要幫助您優先處理最重要的工作,並能夠通過單個問題跨所有數據源尋找洞察,幫助用户每天節省時間。

  • Quick 中的新自主代理可連續在後台處理任務。
  • 活動摘要整合並優先處理跨應用的通信。
站內正文

為您的數據和AI代理提供規模化上下文智能

在AWS紐約峯會上,AWS宣佈了一系列創新,包括AWS Context(即將推出)、AWS Glue數據目錄業務上下文與語義搜索(預覽版)以及Amazon S3註釋(正式可用),旨在為AI代理提供可信任的上下文,使其能夠安全地訪問分散在數據湖、數據倉庫、數據庫和流中的數據以及機構知識。這些服務通過知識圖譜、身份感知訪問和開放式標準,幫助組織構建一個共享、可治理的上下文層,從而提升AI代理的決策能力。

  • AWS Context通過知識圖譜自動映射數據關係,提供代理搜索,使AI代理能在運行時訪問治理後的數據關係和業務規則。
  • AWS Glue數據目錄新增業務上下文和語義搜索,支持用業務描述和術語豐富技術元數據,並通過技能資產為代理提供額外指導。
站內正文

Amazon Bedrock AgentCore 新功能:構建具備更廣泛知識和持續學習能力的智能體

Amazon Bedrock AgentCore 推出了新功能,可將智能體連接到組織、網絡和付費知識庫,並提供持續優化的功能和增強的策略控制。

  • 智能體通過託管知識庫、網絡搜索和付費內容(通過AgentCore支付)獲得原生訪問權限。
  • 優化功能包括失敗/意圖/軌跡洞察、建議和A/B測試,實現持續改進。
站內正文

使用Amazon Bedrock Guardrails InvokeGuardrailChecks API保護您的Agentic AI應用

Amazon Bedrock Guardrails推出了新的InvokeGuardrailChecks API,允許在Agentic AI應用的任意環節應用獨立的安全檢查,無需創建Guardrail資源。該API以僅檢測模式運行,返回數值分數,使您能夠自定義閾值和操作。本文介紹了API的工作原理及如何構建安全的多輪Agentic AI應用。

  • InvokeGuardrailChecks API無需預先創建Guardrail資源,可在Agent循環中靈活調用安全檢查。
  • API支持內容過濾、提示攻擊檢測和敏感信息過濾,返回嚴重性或置信度分數。
站內正文

Amazon SageMaker AI 推出容器緩存,加速模型擴展

Amazon SageMaker AI 宣佈容器鏡像緩存功能,可將擴展事件中的端到端延遲最多降低 2 倍,尤其適用於生成式 AI 模型。

  • 容器緩存自動為支持的實例類型啓用,無需修改。
  • 在新實例啓動時消除容器鏡像拉取步驟,端到端啓動延遲降低最多 51%。
站內正文

在 Amazon SageMaker AI 上使用 P-EAGLE 實現推測解碼並行化

本篇文章指導您如何在 Amazon SageMaker AI 中直接使用 P-EAGLE,展示如何從 SageMaker JumpStart 目錄中選擇兼容模型、配置並行草稿規格,並部署高度優化的實時 SageMaker AI 端點以加速生成式 AI 應用。

  • P-EAGLE 通過一次前向傳播並行預測所有草稿令牌,消除了傳統推測解碼的串行瓶頸。
  • 相比 EAGLE-3,在真實基準測試中吞吐量提升高達 1.69 倍。
站內正文

在 Amazon Bedrock 上推出 Gemma 4 模型

Google DeepMind 構建的 Gemma 4 系列開放權重模型現已在 Amazon Bedrock 上可用。該系列包括三種指令微調變體:Gemma 4 31B、Gemma 4 26B-A4B 和 Gemma 4 E2B,涵蓋密集和混合專家(MoE)架構。它們提供內置推理、原生函數調用以及文本和圖像的多模態輸入。Amazon Bedrock 通過完全託管的服務提供這些模型,確保數據保護、監管合規和運營控制。

  • Gemma 4 系列包含三種變體:31B 密集、26B-A4B MoE 和 E2B PLE。
  • 支持內置推理模式、函數調用和文本/圖像多模態輸入。
站內正文

使用Strands Evals進行AI智能體故障檢測與根因分析

本文介紹了Strands Evals SDK中的檢測器,它可以自動識別AI智能體執行軌跡中的故障並進行根因分析,將診斷時間從數小時縮短至數分鐘。文章詳細講解了如何調用檢測函數、解讀結構化輸出(包括分類故障、置信度、因果鏈和修復建議),以及如何將檢測集成到評估管線中實現自動化診斷。

  • 檢測器分為兩階段:故障檢測(識別軌跡中的9大類故障)和根因分析(區分根本原因與下游症狀,並給出修復建議)。
  • 通過detect_failures和analyze_root_cause函數可分別獲取故障和根因,diagnose_session提供一站式診斷。
站內正文

使用Deep Agents和Bedrock AgentCore構建上下文豐富的研究型Agent

本文介紹如何利用LangChain Deep Agents和Amazon Bedrock AgentCore構建一個能夠並行瀏覽網頁、執行數據分析並長期記憶研究結果的競爭情報研究Agent。通過將深度工作委託給隔離的子Agent,有效解決AI研究工作流中上下文窗口受限的問題。

  • Deep Agents負責編排多個專用子Agent,每個子Agent在獨立的Bedrock AgentCore MicroVM中運行。
  • 研究型子Agent並行瀏覽競爭對手網站,分析性子Agent生成對比圖表和報告。
站內正文

全部來源