Red Hat在2026年峯會上展示AI新技能
IBM在亞特蘭大舉行的Red Hat Summit上發佈了Red Hat AI 3.4,包括新的AI推理服務、開發者工具和安全性增強。該版本聚焦AI推理,支持多種GPU和雲平台,並引入治理、安全及開發者功能。
IBM在本週於亞特蘭大舉行的Red Hat Summit上發佈了Red Hat AI 3.4,這是其構建和部署AI的綜合產品套件的新版本。該套件包含多項新功能,包括Red Hat AI Inference on IBM Cloud服務、新的AI開發者工具、增強的安全性、Red Hat Hardened Images以及新的Dev Spaces框架等。
在AI熱潮的早期,重點主要放在使用大數據訓練大型語言模型和其他基礎模型上。但如今,焦點已轉向運行AI推理,即針對現實世界數據運行AI。AI推理對實時性能和延遲有不同要求,需要管理大量AI代理,並確保每個AI會話的安全性和模型治理。
IBM通過其Red Hat AI Inference Server應對這些挑戰。該服務器基於開源庫vLLM和llm-d,提供優化的高吞吐量和低延遲AI推理。其模型目錄包括IBM Granite 4.0 H Small、Mistral-Small-3.2-24B-Instruct、Llama 3.3 70B Instruct等,未來還將加入更多開放和自定義模型。
Red Hat AI Inference on IBM Cloud使IBM Cloud客户能夠快速部署Red Hat AI推理棧。IBM Cloud CTO Jason McGee表示:“企業渴望將AI投入運營,但從試點到生產的差距可能阻礙他們。通過Red Hat AI Inference on IBM Cloud,我們為客户提供了一個為實際工作負載而構建的託管平台,而不僅僅是實驗。”該服務目前處於有限發佈階段,預計下個月全面上市。
IBM還宣佈Red Hat AI Inference現在可以運行在其他Kubernetes發行版上,包括CoreWeave和Microsoft Azure的Kubernetes,為客户提供更多選擇。
Red Hat AI 3.4還包括以下新功能和增強:
- 治理型模型即服務(MaaS),管理內部和外部API模型的使用;
- 集中式提示詞註冊和管理;
- 內置模型和代理評估,取代碎片化的測試;
- 集成Chatterbox Labs的安全技術,篩查模型和代理的越獄、提示注入和偏見等風險;
- 通過MLflow和OpenTelemetry實現內置可觀測性,提供LLM調用的端到端追蹤;
- 支持SPIFFE/SPIRE的加密身份管理;
- 內置AutoRAG和AutoML自動化AI任務;
- 支持Nvidia Blackwell和AMD MI325X GPU。
IBM還改進了AI開發者工具。Red Hat Desktop的新版本包含了Podman Desktop,為開發容器化AI應用提供基礎。IBM/Red Hat還為開發者提供了構建隔離AI代理沙箱的新工具,幫助安全測試和迭代。更新的Red Hat Advanced Developer Suite引入了Red Hat Trusted Libraries和安全服務,以防止AI驅動的漏洞利用。
“向代理式AI的過渡擴展了現代應用開發的需求,”Red Hat產品管理高級總監James Labocki説。“我們正在幫助開發者加速並掌控他們的AI策略,就像他們對待核心IT應用一樣嚴格。”
此外,Red Hat OpenShift Dev Spaces更新後,現在整合了AWS Kiro編碼助手,與現有的Microsoft Copilot、Anthropic Claude CLI等集成。
最後,Red Hat Hardened Images提供了安全的組件集合,用於部署AI,目標是實現“零CVE”環境。Red Hat Enterprise Linux副總裁兼總經理Gunnar Hellekson表示:“我們的目標是消除安全噪音,為開發者提供一個無需修補或管理不必要軟件即可構建和擴展的基礎。”