AI News HubLIVE
站內改寫2 分鐘閱讀

在 AWS GovCloud(美國)上透過 Amazon Bedrock 執行 NVIDIA Nemotron 和 OpenAI GPT OSS 模型

AWS GovCloud(美國)區域新增對 OpenAI 開源 GPT OSS 模型(120B 和 20B)及 NVIDIA Nemotron 系列模型(Nano 9B v2、Nano 12B v2、Nano 30B、Super 120B)的支援,透過 Amazon Bedrock 提供統一的 API 訪問,推理過程完全在美國境內由美國公民運營的基礎設施上進行,滿足 FedRAMP、DoD SRG 等合規要求。

來源AWS Machine Learning Blog作者: Zohreh Norouzi

美國政府機構在 AWS GovCloud(美國)上執行工作負載時,需要與商業領域同步的 AI 能力,同時不能犧牲安全和合規控制。隨著開放權重基礎模型從實驗階段走向任務系統,每個模型決策都需滿足兩大要求:模型必須提供任務所需的能力,推理環境必須滿足機構的安全、合規和資料駐留義務。對於美國國防和情報界及其承包商而言,這些要求不可妥協。訪問先進的開放權重模型對於情報分析、任務規劃、採購和合同檔案審查、安全日誌分析及合規自動化等任務至關重要,且不得將敏感資料移出管轄邊界。

我們很高興在 AWS GovCloud(美國)中引入基於美國的先進開放權重模型。此次釋出後,Amazon Bedrock 支援 OpenAI 的開放權重 GPT OSS 模型(120B 和 20B)以及 NVIDIA Nemotron 模型(Nano 9B v2、Nano 12B v2、Nano 30B、Super 120B)。利用這些新模型,您可以使用多樣化、高效能的基礎模型構建和擴充套件生成式 AI 應用程式,透過統一的 API 在 OpenAI 和 NVIDIA 的最新模型以及其他領先 AI 模型之間靈活選擇,而無需更改應用程式碼。

AWS GovCloud(美國)提供一組隔離的 AWS 區域,專為託管敏感資料和監管工作負載而設計。這些區域位於美國境內,僅由美國公民管理,幫助客戶滿足 FedRAMP High(臨時運營授權)和 DoD 雲端計算安全要求指南(SRG)影響等級 2、4 和 5 等合規框架,還包括國際武器貿易條例(ITAR)和刑事司法資訊服務(CJIS)。

Amazon Bedrock 是一項完全託管的服務,用於訪問來自獨立模型提供商的 FM,推理完全在 AWS 運營的基礎設施上執行。使用 Amazon Bedrock,推理在 AWS GovCloud(美國)隔離邊界內部進行,由美國公民在美國領土上運營。

OpenAI 的開放權重 GPT OSS 模型和 NVIDIA Nemotron 開放權重模型現已在 AWS GovCloud(美國)的 Amazon Bedrock 上可用。此次釋出將兩個開放權重模型系列引入 AWS GovCloud(美國)區域:OpenAI gpt-oss-120b 和 gpt-oss-20b,以及 NVIDIA Nemotron 3 系列,包括 Nemotron 3 Super 120B 和 Nemotron 3 Nano 模型。利用這些模型,您可以構建代理式應用和任務工作流,如自動化安全控制評估、多文件情報綜合、合同與採購分析以及策略合規檢查,所有這些都在 AWS GovCloud(美國)合規邊界內執行。

模型介紹

NVIDIA Nemotron:NVIDIA Nemotron 系列提供小型語言模型(SLM)和大型語言模型(LLM)能力,專為代理式 AI 系統的計算效率和準確性而構建。Nemotron 3 Super 是 1200 億引數的開放混合專家(MoE)模型,每個 token 僅啟用 120 億引數,吞吐量比上一代高 5 倍,支援百萬 token 上下文視窗。Nemotron 3 Nano 是 300 億引數模型,每個 token 啟用約 30 億引數,吞吐量提升 4 倍,推理 token 生成減少 60%。

OpenAI GPT OSS:OpenAI 的 GPT OSS 模型是開放權重的文本到文本模型,專為推理、代理和開發任務設計,支援可調節的推理努力和外部工具整合。gpt-oss-120b(1200 億引數)適用於生產和高推理用例,gpt-oss-20b(200 億引數)適用於低延遲和本地場景。兩者均提供 128K token 上下文視窗和最多 16K 輸出 token。開放權重使組織能夠獨立評估模型架構、審查模型卡並執行基準測試,支援政府團隊的風險評估和零信任原則。

無伺服器推理與資料駐留

NVIDIA Nemotron 和 GPT OSS 模型由 Amazon Bedrock 的下一代推理引擎提供服務,採用零操作員訪問設計,確保客戶資料(推理提示和完成)不可見。Amazon Bedrock 提供兩個端點:bedrock-mantle(相容 OpenAI API)和 bedrock-runtime(支援 Guardrails 等功能)。區域內推理在 us-gov-west-1 可用,地理跨區域推理在 us-gov-west-1 和 us-gov-east-1 之間路由,所有流量始終停留在 AWS GovCloud(美國)邊界內。

服務層級

支援標準(按 token 付費)、優先順序(低延遲)和 Flex(低成本非時間敏感)三個層級,預留吞吐量暫不可用。預設使用標準按需推理。

入門指南

透過控制台遊樂場或 bedrock-mantle 端點開始使用。推薦使用 bedrock-mantle 端點,支援 OpenAI Python 和 TypeScript SDK。需要 AWS GovCloud(美國)賬戶並配置相應的 IAM 許可權。示例程式碼展示瞭如何透過 Secrets Manager 獲取 API 金鑰並呼叫模型。有關詳細步驟和完整程式碼,請參閱原始部落格。

在 AWS GovCloud(美國)上透過 Amazon Bedrock 執行 NVIDIA Nemotron 和 OpenAI GPT OSS 模型 | AI News Hub