基於混合機器學習和影像處理的水果質量預測方法
本研究提出一種結合影像處理與深度學習的混合方法評估水果新鮮度。開發了量化腐敗程度的影像處理演算法(0-100分),並訓練CNN進行二元分類(新鮮/腐爛)。透過邏輯迴歸融合兩者結果,最終使影像處理演算法能直接進行二元分類,無需CNN。該方法計算資源需求低,在蘋果和橙子資料集上實現即時檢測,準確率超90%。主要限制是水果需在白色或透明背景上隔離。
近日,一篇發表在arXiv上的研究論文(arXiv:2606.26165)提出了一種結合影像處理與深度學習的新方法,用於評估水果的新鮮度。該研究由Amir Reza Hashemi等人完成,已被《密歇根大學本科生研究期刊》第18卷第20期(2026年)收錄。研究團隊針對農業中水果腐敗導致重大經濟損失的問題,開發了一個混合系統,能夠在低計算資源下實現即時、高精度的水果質量檢測,準確率超過90%。
研究團隊首先開發了影像處理演算法,該演算法能夠對水果的腐敗程度進行量化評分,範圍從0(完全新鮮)到100(完全腐爛)。該演算法基於顏色和紋理特徵,透過分析水果表面的變化來給出一個連續的分值。與此同時,他們訓練了一個卷積神經網路(CNN)進行二元分類,判斷水果是新鮮還是腐爛。CNN在大規模水果影像資料集上進行了訓練,包含了各種品種、光照條件和角度下的蘋果和橙子影像。
為了進一步提升預測準確性,研究者採用邏輯迴歸模型將影像處理演算法的評分與CNN的分類結果進行融合。邏輯迴歸模型學習如何最佳地結合這兩個來源的資訊,從而得到更可靠的預測。有趣的是,他們隨後利用這個邏輯迴歸模型,使得影像處理演算法可以根據其百分比輸出直接進行二元分類,從而在實際應用中不再需要CNN。這一創新大幅降低了計算需求,因為影像處理演算法的計算量遠小於CNN,使得系統能夠在即時場景中高效執行,例如在傳送帶上快速分揀水果。
該方法的驗證在包含蘋果和橙子的資料集上進行,結果令人鼓舞:準確率超過90%,且實現了即時效能。研究團隊強調,該方法不需要高效能GPU,可以在普通嵌入式裝置上執行,這對於農業現場應用至關重要。然而,該技術目前存在一個主要侷限性:水果必須被隔離在白色或透明背景上才能進行準確分析。這意味著在自然場景中,如果背景雜亂,演算法的效能會下降。研究團隊指出,未來可以透過引入先進的語義分割模型來自動移除背景,從而克服這一限制。他們計劃探索U-Net等架構來實現魯棒的背景去除。
此外,研究論文還包括了22頁的詳細描述、13張圖表和2個表格,提供了演算法的具體引數、訓練資料集細節以及實驗結果。該方法展示了將簡單影像處理技術與機器學習相結合的潛力,為農業領域提供了實用、低成本的解決方案,有望幫助減少因水果腐敗造成的經濟損失,並提高食品質量檢測的效率。