2026-07-02 02:14 UTC+8站內改寫2 分鐘閱讀更新: 2026-07-02 02:27 UTC+8

在 AWS GovCloud（美國）上透過 Amazon Bedrock 執行 NVIDIA Nemotron 和 OpenAI GPT OSS 模型

AWS GovCloud（美國）區域新增對 OpenAI 開源 GPT OSS 模型（120B 和 20B）及 NVIDIA Nemotron 系列模型（Nano 9B v2、Nano 12B v2、Nano 30B、Super 120B）的支援，透過 Amazon Bedrock 提供統一的 API 訪問，推理過程完全在美國境內由美國公民運營的基礎設施上進行，滿足 FedRAMP、DoD SRG 等合規要求。

來源AWS Machine Learning Blog作者: Zohreh Norouzi

美國政府機構在 AWS GovCloud（美國）上執行工作負載時，需要與商業領域同步的 AI 能力，同時不能犧牲安全和合規控制。隨著開放權重基礎模型從實驗階段走向任務系統，每個模型決策都需滿足兩大要求：模型必須提供任務所需的能力，推理環境必須滿足機構的安全、合規和資料駐留義務。對於美國國防和情報界及其承包商而言，這些要求不可妥協。訪問先進的開放權重模型對於情報分析、任務規劃、採購和合同檔案審查、安全日誌分析及合規自動化等任務至關重要，且不得將敏感資料移出管轄邊界。

我們很高興在 AWS GovCloud（美國）中引入基於美國的先進開放權重模型。此次釋出後，Amazon Bedrock 支援 OpenAI 的開放權重 GPT OSS 模型（120B 和 20B）以及 NVIDIA Nemotron 模型（Nano 9B v2、Nano 12B v2、Nano 30B、Super 120B）。利用這些新模型，您可以使用多樣化、高效能的基礎模型構建和擴充套件生成式 AI 應用程式，透過統一的 API 在 OpenAI 和 NVIDIA 的最新模型以及其他領先 AI 模型之間靈活選擇，而無需更改應用程式碼。

AWS GovCloud（美國）提供一組隔離的 AWS 區域，專為託管敏感資料和監管工作負載而設計。這些區域位於美國境內，僅由美國公民管理，幫助客戶滿足 FedRAMP High（臨時運營授權）和 DoD 雲端計算安全要求指南（SRG）影響等級 2、4 和 5 等合規框架，還包括國際武器貿易條例（ITAR）和刑事司法資訊服務（CJIS）。

Amazon Bedrock 是一項完全託管的服務，用於訪問來自獨立模型提供商的 FM，推理完全在 AWS 運營的基礎設施上執行。使用 Amazon Bedrock，推理在 AWS GovCloud（美國）隔離邊界內部進行，由美國公民在美國領土上運營。

OpenAI 的開放權重 GPT OSS 模型和 NVIDIA Nemotron 開放權重模型現已在 AWS GovCloud（美國）的 Amazon Bedrock 上可用。此次釋出將兩個開放權重模型系列引入 AWS GovCloud（美國）區域：OpenAI gpt-oss-120b 和 gpt-oss-20b，以及 NVIDIA Nemotron 3 系列，包括 Nemotron 3 Super 120B 和 Nemotron 3 Nano 模型。利用這些模型，您可以構建代理式應用和任務工作流，如自動化安全控制評估、多文件情報綜合、合同與採購分析以及策略合規檢查，所有這些都在 AWS GovCloud（美國）合規邊界內執行。

模型介紹

NVIDIA Nemotron：NVIDIA Nemotron 系列提供小型語言模型（SLM）和大型語言模型（LLM）能力，專為代理式 AI 系統的計算效率和準確性而構建。Nemotron 3 Super 是 1200 億引數的開放混合專家（MoE）模型，每個 token 僅啟用 120 億引數，吞吐量比上一代高 5 倍，支援百萬 token 上下文視窗。Nemotron 3 Nano 是 300 億引數模型，每個 token 啟用約 30 億引數，吞吐量提升 4 倍，推理 token 生成減少 60%。

OpenAI GPT OSS：OpenAI 的 GPT OSS 模型是開放權重的文本到文本模型，專為推理、代理和開發任務設計，支援可調節的推理努力和外部工具整合。gpt-oss-120b（1200 億引數）適用於生產和高推理用例，gpt-oss-20b（200 億引數）適用於低延遲和本地場景。兩者均提供 128K token 上下文視窗和最多 16K 輸出 token。開放權重使組織能夠獨立評估模型架構、審查模型卡並執行基準測試，支援政府團隊的風險評估和零信任原則。

無伺服器推理與資料駐留

NVIDIA Nemotron 和 GPT OSS 模型由 Amazon Bedrock 的下一代推理引擎提供服務，採用零操作員訪問設計，確保客戶資料（推理提示和完成）不可見。Amazon Bedrock 提供兩個端點：bedrock-mantle（相容 OpenAI API）和 bedrock-runtime（支援 Guardrails 等功能）。區域內推理在 us-gov-west-1 可用，地理跨區域推理在 us-gov-west-1 和 us-gov-east-1 之間路由，所有流量始終停留在 AWS GovCloud（美國）邊界內。

服務層級

支援標準（按 token 付費）、優先順序（低延遲）和 Flex（低成本非時間敏感）三個層級，預留吞吐量暫不可用。預設使用標準按需推理。

入門指南

透過控制台遊樂場或 bedrock-mantle 端點開始使用。推薦使用 bedrock-mantle 端點，支援 OpenAI Python 和 TypeScript SDK。需要 AWS GovCloud（美國）賬戶並配置相應的 IAM 許可權。示例程式碼展示瞭如何透過 Secrets Manager 獲取 API 金鑰並呼叫模型。有關詳細步驟和完整程式碼，請參閱原始部落格。