微調Amazon Nova模型實現電子郵件資料準確提取
本文介紹如何透過Amazon SageMaker AI微調Amazon Nova模型,解決電子郵件資料提取中的幻覺和成本問題,實現高達94.77%的提取準確率並降低50%成本。
在電子商務領域,每天處理數百萬封電子郵件以提取結構化資料是一項巨大的挑戰。包裹配送公司Parcel Perform在使用傳統模型時遇到了幻覺、混淆相似欄位和高昂的令牌成本等問題。透過與AWS生成式AI創新中心合作,他們採用了Amazon SageMaker AI對Amazon Nova模型進行微調,實現了高達94.77%的提取準確率,同時降低了50%的成本。
解決方案的核心是使用引數高效微調(PEFT)技術,透過低秩適應(LoRA)來定製模型。這種方法只需要有限的訓練資料就能取得顯著效果,同時保持計算效率。在實驗中,團隊使用了1,300個和4,900個訓練樣本,結果表明資料量的增加能進一步提升效能。微調後的模型能夠準確區分訂單號和追蹤號等易混淆欄位。
資料準備需要遵循Amazon Bedrock對話格式,每個樣本包含電子郵件內容和對應的提取結果。訓練資料上傳到Amazon S3後,透過SageMaker AI建立微調任務,並設定適當的超引數,如最大長度、全域性批次大小和學習率。完成訓練後,模型可部署到Amazon Bedrock進行按需推理。評估結果顯示,微調後所有模型的準確率提升了5.6至16.6個百分點。令人驚訝的是,較小的Nova Micro模型以94.77%的準確率超過了較大的Nova Lite模型。推理延遲降低了約32%,每推理一次節省約7.7秒。成本降低約50%,這得益於PEFT技術和按需定價模式。
綜上所述,透過Amazon SageMaker AI微調Amazon Nova模型是一種高效、經濟的解決方案,能夠解決電子郵件資料提取中的關鍵問題。即使只有少量標註資料,團隊也能獲得顯著的準確率提升。這一成功案例表明,任務特定的最佳化可以充分彌補基礎模型大小的差異。