2026-07-01 00:26 UTC+8站内改写1 分钟阅读更新: 2026-07-01 00:58 UTC+8

微调Amazon Nova模型实现电子邮件数据准确提取

本文介绍如何通过Amazon SageMaker AI微调Amazon Nova模型，解决电子邮件数据提取中的幻觉和成本问题，实现高达94.77%的提取准确率并降低50%成本。

在电子商务领域，每天处理数百万封电子邮件以提取结构化数据是一项巨大的挑战。包裹配送公司Parcel Perform在使用传统模型时遇到了幻觉、混淆相似字段和高昂的令牌成本等问题。通过与AWS生成式AI创新中心合作，他们采用了Amazon SageMaker AI对Amazon Nova模型进行微调，实现了高达94.77%的提取准确率，同时降低了50%的成本。

解决方案的核心是使用参数高效微调（PEFT）技术，通过低秩适应（LoRA）来定制模型。这种方法只需要有限的训练数据就能取得显著效果，同时保持计算效率。在实验中，团队使用了1,300个和4,900个训练样本，结果表明数据量的增加能进一步提升性能。微调后的模型能够准确区分订单号和追踪号等易混淆字段。

数据准备需要遵循Amazon Bedrock对话格式，每个样本包含电子邮件内容和对应的提取结果。训练数据上传到Amazon S3后，通过SageMaker AI创建微调任务，并设置适当的超参数，如最大长度、全局批次大小和学习率。完成训练后，模型可部署到Amazon Bedrock进行按需推理。评估结果显示，微调后所有模型的准确率提升了5.6至16.6个百分点。令人惊讶的是，较小的Nova Micro模型以94.77%的准确率超过了较大的Nova Lite模型。推理延迟降低了约32%，每推理一次节省约7.7秒。成本降低约50%，这得益于PEFT技术和按需定价模式。

综上所述，通过Amazon SageMaker AI微调Amazon Nova模型是一种高效、经济的解决方案，能够解决电子邮件数据提取中的关键问题。即使只有少量标注数据，团队也能获得显著的准确率提升。这一成功案例表明，任务特定的优化可以充分弥补基础模型大小的差异。