AI News HubLIVE
站内改写5 分钟阅读

亚马逊Bedrock如何捕捉AI生成的钓鱼邮件

亚马逊Bedrock通过分析行为模式而非语法来检测AI生成的钓鱼邮件,其多阶段分析流程包括认证检查、AI模型分析、风险评分和自动路由,并结合防护栏确保安全。

来源AWS Machine Learning Blog作者: Radha Panchap

社会工程学通过钓鱼邮件仍然是发起网络攻击的最常见手段之一。AI生成的钓鱼邮件给管理电子邮件系统的安全团队带来了新的挑战,由于它们的高度复杂性,风险显著增加。现代社会工程师使用生成式AI和开源情报(OSINT)来制作数千条独特的消息,这些消息具有完美的语法、适当的上下文和个性化的细节。如今,钓鱼邮件的迹象可能是一封写得很完美、格式专业的消息。

以一家中型公司的IT安全工程师John为例,过去检测钓鱼邮件的规则很简单:标记拼写错误、捕捉通用称呼、隔离任何发件人域名不匹配的邮件。这些是早期钓鱼邮件的特征,当时攻击大规模发送数百万条通用、错误百出的邮件,依靠数量而非精准度来寻找受害者。安全过滤器正是为这些威胁而构建的,多年来它们一直有效。糟糕的语法、通用的问候语和不匹配的标识是让攻击者暴露的指标。

如今John监控的威胁环境与那些过滤器设计捕捉的完全不同。生成式AI改变了钓鱼邮件的工作原理。攻击现在语法正确、语境准确,并且针对目标进行了个性化。这些消息不会触发传统过滤器,因为这些过滤器并非为捕捉它们而设计。威胁不再可以通过外观识别,而是通过其知道的内容。现代AI系统运行OSINT操作,从专业网络、公司网站和公开可用的数字足迹中提取数据,绘制组织层级结构和关系。有了这些情报,社会工程师可以大规模处理大量数据集,生成针对你组织的语境准确且个性化的消息。这些通信甚至可以基于你的反应实时调整,转变语气或调整细节以保持对话一致。

亚马逊Bedrock是一项完全托管的服务,通过统一API提供来自领先AI公司的高性能基础模型(FMs),以及构建生成式AI应用所需的安全性、隐私和负责任AI能力。亚马逊Bedrock在你现有的安全基础设施之上增加了一层分析,超越了传统的表面级过滤。它理解上下文,并基于行为模式检测钓鱼尝试,而不是基于语法质量或格式。为了将这一理论付诸实践,让我们分解亚马逊Bedrock如何从邮件到达收件箱的那一刻起分析它。

亚马逊Bedrock使用预训练于大量数据的大规模通用AI模型。基础模型可以分析邮件内容中的行为模式,理解上下文关系,并识别可能表明消息是钓鱼尝试的异常。在实践中,这些能力可以构建为多阶段分析管道。每封邮件在到达用户收件箱之前,会经过认证、行为分析和风险评分。

亚马逊Bedrock提供两种集成能力来驱动你的AI驱动的钓鱼防御。预训练的基础模型带来复杂的自然语言理解,可以检测规则系统无法看到的细微操纵、上下文异常和冒充模式。第二个能力是亚马逊Bedrock防护栏,它提供可配置的安全措施,帮助将基础模型交互与组织的负责任AI策略和应用要求对齐,而无需自定义检测逻辑。这些能力可以集成到一个多阶段邮件分析管道中。

在解决方案的工作流中,每封消息首先经过标准认证检查(SPF、DKIM、DMARC)。这些协议确认发送服务器有权代表域发送,且消息在传输中未被篡改。由亚马逊Bedrock基础模型驱动的钓鱼检测工作流根据三个关键因素分析消息:用词选择、沟通风格偏差以及请求的上下文适当性。检测这些写作风格中的细微不一致和错位的请求,在传统安全控制之上增加了一层更深入的分析。AI分析还需要仔细治理,以确保其在定义的边界内负责任地运行。亚马逊Bedrock防护栏有助于过滤输入提示和模型输出。它们防止可能无意中泄露机密数据的响应,并检查分析结果是否符合你设置的策略。请记住,防护栏需要仔细配置和校准以满足你的应用需求。

实施亚马逊Bedrock防护栏进行分析时,通过内容过滤器、拒绝主题、词语过滤器和敏感信息过滤器,可以精细控制基础模型如何处理邮件内容。例如,安全工程师John可以配置防护栏自动编辑邮件分析过程中发现的敏感个人身份信息(PII),以防止基础模型生成可能无意中泄露机密数据的响应。

然而,安全分析的防护栏配置需要仔细校准。虽然内容过滤器可防止不当输入和输出,但过于严格的设置可能会阻止模型分析本应评估的可疑内容。如果社会工程师在邮件中包含攻击性语言以绕过过滤器,你的防护栏必须允许安全系统分析该内容。同时,防护栏仍必须在其他上下文中防止不当输入和输出。防护栏还提供上下文基础检查,使模型响应事实锚定在正在分析的邮件内容上,减少由模型幻觉引起的误报。这使得AI驱动的分析能够在定义边界内运行,同时检测复杂的模式。

本文介绍如何实施多阶段邮件分析管道,使用亚马逊Bedrock基础模型评估发件人行为模式、上下文适当性和通信异常,以在AI生成的钓鱼尝试到达用户之前识别它们。

以下框架展示了如何在现有邮件安全基础设施中实践,使处于John职位的人能够从被动过滤转向主动检测。在标准认证检查(SPF、DKIM、DMARC)确认邮件来自合法邮件服务器后,钓鱼检测工作流通过加入行为分析更进一步。系统从检查服务器是否授权,转向评估消息是否匹配你的同事通常的沟通方式。

在深入实施之前,先澄清每个组件的功能。行为分析从发件人基线追踪器开始,这是一个向你发送邮件的每个人的档案。发件人基线追踪器记录你的员工通常如何写作,以便亚马逊Bedrock分析管道有参考点进行比较。随着持续使用,钓鱼检测工作流将理解你的员工使用的词语、他们正式或随意的程度、他们通常要求什么以及他们通常与谁沟通。考虑John的环境:一个通常发送简短语句的同事突然写了一封正式邮件要求紧急电汇。分析管道会捕捉到这种转变,并标记出来供John的团队进一步检查。这有助于减少误报,节省John团队可能花费在筛选非真正威胁的标记邮件上的时间。

以下是邮件进入钓鱼检测工作流时这些组件如何协同工作的高级概述:

步骤1:输入防护栏和预处理 初始化EmailSecurityAnalyzer:

  • 设置亚马逊Bedrock客户端(Claude Sonnet 4.5模型)
  • 配置亚马逊Bedrock防护栏以进行PII保护和内容过滤
  • 初始化钓鱼示例知识库
  • 初始化发件人基线追踪器
  • 设置风险阈值(安全 = 70)

函数 analyze_email(email): // 步骤1:通过防护栏预处理 processed_email = apply_input_guardrails(email) 如果内容被阻止: 返回 需要人工审查

钓鱼检测工作流首先通过亚马逊Bedrock防护栏运行传入邮件,这些防护栏筛选敏感内容,并标记任何应在分析开始前进行人工审查的内容。

步骤2:带有上下文的提示构建 // 步骤2:构建分析提示 prompt = construct_prompt( email_content, sender_baseline_patterns, organizational_context, known_phishing_examples )

邮件通过该检查后,工作流通过结合邮件内容与发件人基线通信模式、组织上下文以及使用亚马逊Bedrock知识库的已知钓鱼示例来构建分析提示。这样,模型在评估消息时基于完整图景,而不是孤立地进行。

步骤3:带防护栏的AI驱动分析 // 步骤3:使用防护栏调用AI模型 analysis = bedrock_invoke_with_guardrails(prompt) 如果防护栏干预: 返回 已阻止并附理由

基础模型使用构建的提示处理邮件,同时防护栏确保分析在你定义的安全边界内进行。基础模型可以彻底检查可疑内容,而防护栏防止其生成在此过程中暴露敏感信息的输出。

步骤4:多因素风险评分 // 步骤4:计算风险分数 risk_score = weighted_average( content_anomaly_score, behavioral_deviation_score, context_alignment_score )

从该分析中,亚马逊Bedrock管道生成三个分数:一个用于内容异常,一个用于行为偏差,一个用于上下文对齐。管道将它们组合成一个0-100的风险分数,该分数决定邮件的路由。

步骤5:分类和自动路由 // 步骤5:分类和路由 risk_level = classify_risk(risk_score) action = route_email(risk_level) // 投递、隔离或阻止 返回 analysis_result

函数 route_email(risk_level): 如果 risk_level == 安全:投递到收件箱 如果 risk_level == 可疑:隔离以供审查 如果 risk_level == 危险:阻止并提醒安全团队

安全消息照常送达员工收件箱。可疑邮件被隔离,供安全团队审查。危险邮件被直接阻止。

通过反馈持续学习

函数 process_feedback(email, is_phishing): 如果 is_phishing: 添加到钓鱼知识库(email) 否则: 更新发件人基线(email) 添加到合法示例(email)

这些步骤在消息通过路由系统时以毫秒级发生。你现有的基础设施仍然处理消息路由和传递。分析作为检查层并行运行,在消息到达用户收件箱之前评估行为风险。

随着持续使用,钓鱼检测工作流不断学习,通过反馈循环更新发件人基线和知识库,减少误报并提高检测准确率。