2026-07-01 00:26 UTC+8站內改寫1 分鐘閱讀更新: 2026-07-01 00:58 UTC+8

微調Amazon Nova模型實現電子郵件資料準確提取

本文介紹如何透過Amazon SageMaker AI微調Amazon Nova模型，解決電子郵件資料提取中的幻覺和成本問題，實現高達94.77%的提取準確率並降低50%成本。

在電子商務領域，每天處理數百萬封電子郵件以提取結構化資料是一項巨大的挑戰。包裹配送公司Parcel Perform在使用傳統模型時遇到了幻覺、混淆相似欄位和高昂的令牌成本等問題。透過與AWS生成式AI創新中心合作，他們採用了Amazon SageMaker AI對Amazon Nova模型進行微調，實現了高達94.77%的提取準確率，同時降低了50%的成本。

解決方案的核心是使用引數高效微調（PEFT）技術，透過低秩適應（LoRA）來定製模型。這種方法只需要有限的訓練資料就能取得顯著效果，同時保持計算效率。在實驗中，團隊使用了1,300個和4,900個訓練樣本，結果表明資料量的增加能進一步提升效能。微調後的模型能夠準確區分訂單號和追蹤號等易混淆欄位。

資料準備需要遵循Amazon Bedrock對話格式，每個樣本包含電子郵件內容和對應的提取結果。訓練資料上傳到Amazon S3後，透過SageMaker AI建立微調任務，並設定適當的超引數，如最大長度、全域性批次大小和學習率。完成訓練後，模型可部署到Amazon Bedrock進行按需推理。評估結果顯示，微調後所有模型的準確率提升了5.6至16.6個百分點。令人驚訝的是，較小的Nova Micro模型以94.77%的準確率超過了較大的Nova Lite模型。推理延遲降低了約32%，每推理一次節省約7.7秒。成本降低約50%，這得益於PEFT技術和按需定價模式。

綜上所述，透過Amazon SageMaker AI微調Amazon Nova模型是一種高效、經濟的解決方案，能夠解決電子郵件資料提取中的關鍵問題。即使只有少量標註資料，團隊也能獲得顯著的準確率提升。這一成功案例表明，任務特定的最佳化可以充分彌補基礎模型大小的差異。