Red Hat在2026年峰会上展示AI新技能
IBM在亚特兰大举行的Red Hat Summit上发布了Red Hat AI 3.4,包括新的AI推理服务、开发者工具和安全性增强。该版本聚焦AI推理,支持多种GPU和云平台,并引入治理、安全及开发者功能。
IBM在本周于亚特兰大举行的Red Hat Summit上发布了Red Hat AI 3.4,这是其构建和部署AI的综合产品套件的新版本。该套件包含多项新功能,包括Red Hat AI Inference on IBM Cloud服务、新的AI开发者工具、增强的安全性、Red Hat Hardened Images以及新的Dev Spaces框架等。
在AI热潮的早期,重点主要放在使用大数据训练大型语言模型和其他基础模型上。但如今,焦点已转向运行AI推理,即针对现实世界数据运行AI。AI推理对实时性能和延迟有不同要求,需要管理大量AI代理,并确保每个AI会话的安全性和模型治理。
IBM通过其Red Hat AI Inference Server应对这些挑战。该服务器基于开源库vLLM和llm-d,提供优化的高吞吐量和低延迟AI推理。其模型目录包括IBM Granite 4.0 H Small、Mistral-Small-3.2-24B-Instruct、Llama 3.3 70B Instruct等,未来还将加入更多开放和自定义模型。
Red Hat AI Inference on IBM Cloud使IBM Cloud客户能够快速部署Red Hat AI推理栈。IBM Cloud CTO Jason McGee表示:“企业渴望将AI投入运营,但从试点到生产的差距可能阻碍他们。通过Red Hat AI Inference on IBM Cloud,我们为客户提供了一个为实际工作负载而构建的托管平台,而不仅仅是实验。”该服务目前处于有限发布阶段,预计下个月全面上市。
IBM还宣布Red Hat AI Inference现在可以运行在其他Kubernetes发行版上,包括CoreWeave和Microsoft Azure的Kubernetes,为客户提供更多选择。
Red Hat AI 3.4还包括以下新功能和增强:
- 治理型模型即服务(MaaS),管理内部和外部API模型的使用;
- 集中式提示词注册和管理;
- 内置模型和代理评估,取代碎片化的测试;
- 集成Chatterbox Labs的安全技术,筛查模型和代理的越狱、提示注入和偏见等风险;
- 通过MLflow和OpenTelemetry实现内置可观测性,提供LLM调用的端到端追踪;
- 支持SPIFFE/SPIRE的加密身份管理;
- 内置AutoRAG和AutoML自动化AI任务;
- 支持Nvidia Blackwell和AMD MI325X GPU。
IBM还改进了AI开发者工具。Red Hat Desktop的新版本包含了Podman Desktop,为开发容器化AI应用提供基础。IBM/Red Hat还为开发者提供了构建隔离AI代理沙箱的新工具,帮助安全测试和迭代。更新的Red Hat Advanced Developer Suite引入了Red Hat Trusted Libraries和安全服务,以防止AI驱动的漏洞利用。
“向代理式AI的过渡扩展了现代应用开发的需求,”Red Hat产品管理高级总监James Labocki说。“我们正在帮助开发者加速并掌控他们的AI策略,就像他们对待核心IT应用一样严格。”
此外,Red Hat OpenShift Dev Spaces更新后,现在整合了AWS Kiro编码助手,与现有的Microsoft Copilot、Anthropic Claude CLI等集成。
最后,Red Hat Hardened Images提供了安全的组件集合,用于部署AI,目标是实现“零CVE”环境。Red Hat Enterprise Linux副总裁兼总经理Gunnar Hellekson表示:“我们的目标是消除安全噪音,为开发者提供一个无需修补或管理不必要软件即可构建和扩展的基础。”