更快的AI推理如何增强网络安全
随着攻击者利用AI提升攻击复杂性和适应性,网络安全领域的不对称性加剧。更快的人工智能推理使安全团队能够在相同操作窗口内进行更多推理、上下文检索和验证,从而提升产品竞争力。本文探讨了AI for Security和Security for AI两个方向,并举例说明Cerebras的快速推理如何帮助Armis和Operant AI等公司构建差异化安全产品。
网络安全一直是一场不对称的战争:攻击者数量众多,且行动速度远超防御团队。随着AI的加速发展,战场进一步倾斜。过去,安全团队根据专业水平对攻击者进行分类,95%的攻击者是“脚本小子”或针对组织的“路过式攻击”。如今,攻击者使用AI显著提升了攻击的复杂性和适应性,降低了知识和经验的门槛,使得更智能、更持久的网络攻击成为日常现实。
攻击者可以利用AI在侦察、钓鱼、恶意软件变异、漏洞发现和利用开发等方面更快地行动。同时,如果团队没有强大的验证、审查和修复工作流,低质量的AI编码助手可能会引入不安全的代码。企业也在部署AI副驾驶、AI应用程序和代理工作流,这些引发了新的安全问题:代理可以调用哪些工具?可以检索哪些数据?在返回答案之前应该检查什么?团队如何在不影响工作效率的情况下观察和管理这些系统?
答案不是在所有地方都添加AI,而是将AI应用于能够改善安全结果的地方。这始于质量:更好的发现、更好的优先级排序、更好的验证和团队可以信任的控制。但随着这些能力的成熟,延迟和输出速度成为战略约束。更快的推理让安全AI每秒能够进行更多的推理:更多的上下文检索、更多的工具使用、更多的自我检查和更多的验证,所有这些都在相同的操作窗口内完成。
对于网络安全构建者来说,这使得快速推理成为一个产品设计问题,而不仅仅是基础设施基准。创始人、产品负责人、工程团队和构建安全平台的AI团队必须决定在用户期望保持快速的工作流中,能够容纳多少上下文、推理、验证和控制。重点不是每个安全工作流都需要最快的模型,而是展示更快的推理在哪些方面改变了网络安全产品在生产中的能力:在相同的用户体验中,更多的上下文、更多的检查、更多的验证和更低摩擦的控制。
AI改变安全的两种方式以及速度的重要性
AI以两种相关但不同的方式改变网络安全。第一种是“AI for Security”:使用AI使安全产品和团队在检测、调查、优先级排序、测试和修复方面做得更好。第二种是“Security for AI”:保护企业投入生产的AI应用程序、代理、模型、数据流、提示、检索系统和工具调用。
两者都需要强大的模型质量和可信工作流。它们的不同之处在于延迟出现的位置。在AI for Security中,速度很重要,因为当事件、调查或开发工作流仍在进行时,需要进行更深入的推理。在Security for AI中,速度通常立即变得重要,因为控制直接位于用户、应用程序或代理的路径中。
AI for Security:速度在今天和未来都重要
对于AI for Security,首要任务仍然是质量:信号、上下文、验证和信任。随着产品从有用的摘要转向调查、验证和帮助修复的操作工作流,更快的推理变得越来越重要。
Security for AI:速度在今天和未来都重要
Security for AI具有更直接的延迟特征,因为控制通常位于内联位置。如果保护措施增加太多延迟,团队将绕过它。如果它快速且有用,它就可以成为AI应用程序安全部署的一部分。
实用架构:快速分类,智能升级
这些用例的共同点是,并非每个信号、交易、警报、代码更改或代理操作都需要相同级别的推理。在生产中,网络安全平台需要能够保持日常工作流响应迅速,同时为值得深入分析的时刻保留更深入的分析。
一个实用的模式是分层。规则、经典模型和小型语言模型处理第一遍:过滤、分类、去重和路由。然后,使用更强的推理模型作为升级点,处理少数值得深入分析的案例:可疑事件、高风险发现、关键代码路径、敏感工具调用和政策例外。
延迟和输出速度在两级都很重要。第一遍必须保持足够快以满足产品体验。升级路径必须足够快,以便更深入的推理不会成为另一个队列。在这种架构中,更快的推理不仅是一个快速响应的杠杆,也是一种在质量最重要的时刻融入更高质量思考的方式。
快速推理作为竞争优势
在拥挤的网络安全市场中,许多供应商会声称使用AI。区别在于该AI是否能够在实际的安全工作流中运行而不减慢速度。更快的推理让网络安全公司能够在用户体验中断之前检查更多上下文、推理更多假设、验证更多建议并解释更多决策。
更快的推理如何改变安全工作流
在AI for Security和Security for AI中,都出现相同的基本循环:收集上下文、推理、验证、建议或强制执行、验证。更快的推理通过减少延迟和增加系统在决策点之前能够完成的推理量来改进每一步。
Cerebras如何帮助网络安全构建者竞争
Cerebras帮助网络安全公司构建延迟和输出速度成为产品约束的产品。其晶圆级架构减少了传统GPU推理中许多数据移动和分布式系统开销。这使得更多的推理、验证和工具使用在真实安全工作流的时间预算内变得实用。
Cerebras提供比领先GPU解决方案快15倍的推理速度。对于网络安全构建者来说,这种速度创造了产品空间。它可以在工作流需要时支持更快的响应,但也支持更高质量的答案,当工作流从更多检查、更多上下文和更多验证中受益时,在建议到达用户之前。
这一点在AI改变安全的两种方式中都很重要。在AI for Security中,更快的推理可以使更深入的调查和修复更可用。在Security for AI中,它可以帮助内联控制保持足够快以用于生产。在分层架构中,它可以使升级到更强推理模型感觉像是产品的一部分,而不是单独的队列。
网络安全公司已经用Cerebras构建差异化产品
这种模式已经在我们的生态系统中可见。例子各不相同,但都展示了快速推理如何成为产品优势,因为安全AI朝着质量、验证、部署模型和延迟都重要的工作流发展。
Armis:AI for Security
Armis是AI for Security的例子:使用AI帮助安全和开发团队在软件生命周期中查找、优先级排序和修复风险。其价值主张是统一跨代码、依赖项、容器镜像、CI/CD工作流、配置、运行时信号和生产侧控制的应用程序安全上下文,使团队能够专注于最重要的问题。
来自Cerebras的快速推理通过使工作流更响应和更有用来提供帮助。更高的输出速度可以支持更深入的代码和依赖推理、更清晰的解释、优先级排序、复现步骤和修复指导,而开发人员仍在工作流中。好处不是为速度而速度,而是在给定的操作窗口内获得更多的上下文和验证。
Operant AI:Security for AI
Operant AI是Security for AI的例子:帮助组织保护生产中的AI应用程序、代理和API。其价值主张是对提示、输出、检索响应、工具调用和敏感数据流进行运行时防御,以便企业能够以更强的可见性、控制和治理部署AI。
来自Cerebras的快速推理使这些控制在生产中变得实用。当保护措施位于内联时,它需要检查交互、评估策略并标记或阻止风险行为,而不会造成不可接受的延迟。更高的输出速度为更多的策略推理、检查和可解释性创造了空间,同时保留了用户体验。
优势在于操作窗口内的可信情报
网络安全不会通过在所有工作流中添加AI而获胜。它将通过将AI应用于改善结果的地方、为工作选择正确的模型架构以及使智能足够快以适应关键时刻而获胜。
对于网络安全公司来说,这将推理速度转化为差异化竞争力:在相同的用户体验中,更多的上下文、更多的验证和更多的可信情报。
今天,这意味着低延迟的AI应用程序保护和更快的时间敏感安全操作中的推理。随着AI安全能力在代码、暴露管理、测试和修复方面的提升,延迟和输出速度将决定每个交互中可以容纳多少上下文、验证和修复。
这就是更快的推理在网络安全中重要的地方:不仅是在需要立即响应的时刻,而且在每个工作流中,每秒更多的推理可以在给定的操作窗口内产生更可信的安全结果。