精品国产a∨无码一区二区三区-色喜国模李晴超大尺度-天天影视网天天综合色-国产精品青青在线麻豆-www无套内射高清免费

技術文章

Technical articles

當前位置:首頁技術文章集成學習驅動下的無人機高光譜煙草氮含量快速檢測技術

集成學習驅動下的無人機高光譜煙草氮含量快速檢測技術

更新時間:2026-01-09點擊次數:124

應用方向

快速、準確且實時地檢測煙草葉片的氮含量對煙葉品質監測具有重要意義。無人機搭載的高光譜遙感技術可在大尺度上獲取農田作物的精細光譜信息。結合多種機器學習算法,可建立高效的葉片氮含量(LNC)評估模型。本研究旨在利用無人機高光譜影像數據構建高性能煙草LNC估算模型。為解決單模型性能差異(異質性)問題,引入集成學習策略,將多元線性回歸(MLR)、決策樹回歸(DTR)、隨機森林(RF)、自適應提升(Adaboost)及堆疊(Stacking)等多種算法進行融合,以挖掘更多有效數據特征。模型性能通過決定系數(R2)、均方根誤差(RMSE)和平均絕*百分比誤差(MAPE)評估,并以偏最小二乘回歸(PLSR)作為基準。結果表明,所有集成學習模型均優于PLSR(R2=0.680,RMSE=5.402 mg/g,MAPE=19.72%),其中基于堆疊策略的模型表現*佳(R2=0.745,RMSE=4.825 mg/g,MAPE=17.98%)。研究為利用無人機高光譜技術實現高效、無損的作物養分與植被表型特征檢測提供了參考。

背景

煙草是中國重要的經濟作物,其生產質量直接影響農民收益與區域經濟發展。葉片氮含量(LNC)是影響煙葉品質的關鍵指標,但傳統檢測方法(人工經驗或實驗室分析)存在操作繁瑣、成本高、時效差的問題。無人機(UAV)結合高光譜遙感技術為實現作物氮含量的快速、無損檢測提供了可能,并在水稻、玉米、棉花等作物的葉氮含量估算中取得了成功,但在煙草領域的應用仍然較為有限。盡管高光譜數據能夠反映作物的表型特征,但其與葉氮含量之間的關系需要通過精確的建模加以揭示,現有的回歸模型在不同作物和環境條件下表現異質,影響預測的穩定性和精度。本研究采用三種集成學習方法——隨機森林(RF)、Adaboost回歸和堆疊回歸(stacking),以解決單一模型的局限性,并與傳統的部分最小二乘回歸(PLSR)進行了對比。本研究首*系統評估UAV?HRS用于煙草LNC反演的潛力,并以集成學習緩解不同模型在不同地塊、品種和環境下的性能異質性。

圖1 研究技術路線

實驗與數據采集

(1)實驗設置

本研究于2022年在中國云南省大理白族自治州祥云縣和彌渡縣開展,實驗地點位于六個煙草研究農田(S1~S6),采用隨機區組設計,分為三次重復(R1–R3)。每個實驗地塊面積約1000 m2,均為平坦地形,且沒有高壓電線、樹木、建筑物等阻礙無人機飛行的障礙物。煙草苗于四月下旬移栽,隨后每個地塊根據施肥量(0%、25%、50%、75%、100%、125%、150%)分配了七種肥料處理。

(2)數據采集

無人機搭載的高光譜成像平臺包括DJI Matrice 600 Pro無人機和江蘇雙利合譜科技有限公司的GaiaSky-mini2-VN推掃高光譜成像儀,后者在400–1000納米范圍內采集了176個波段的高光譜圖像,光譜分辨率為3.5納米。高光譜圖像采集周期為每隔20天(±3天),從移栽后35天開始,持續到收獲。采集時間段選擇在晴天的10:00到15:00之間,飛行高度為80米,空間分辨率為0.032米。在每次測量前,進行了光譜校準。煙草樣品的采集與高光譜圖像采集同步進行。在每個處理地塊中,從兩株代表性煙草植株的上中部葉片上各采集兩片葉子。樣品被放入標識的紙袋中,并轉送至化學實驗室進行分析。

研究結果

(1)預處理高光譜數據

本研究通過使用數據處理軟件,提取純煙株像元的平均反射率;采用ExG(過量綠色指數)掩膜剔除土壤、陰影與雜草(優于NDVI)見圖3。

(a)Raw    (b)ExG    (c)NDVI

圖2 純煙草像素提取中ExG與NDVI的對比分析。

(2)特征構建:連續投影算法(SPA)處理

利用SPA(Successive Projection Algorithm)篩選氮敏感波段,該算法不僅能壓縮光譜數據,還能根據波長對LNC的貢獻度篩選出有效波段,剔除無意義波長,從而降低模型復雜度,共選出15個關鍵波段(405~959 nm)。

(3)基于Bagging策略的集成學習框架

圖4展示了基于Bagging策略(Bootstrap Aggregating)的集成學習原理。該方法通過對原始訓練集進行多次自助抽樣(Bootstrap sampling),生成若干個隨機子集,在每個子集上分別訓練獨立的弱學習器,最終通過平均或投票融合得到整體預測結果。研究結果表明,RF模型在測試集上獲得R2=0.711、RMSE=5.137 mg/g,顯著優于傳統的PLSR模型,驗證了Bagging策略在復雜農田環境下的穩健性與抗噪聲能力。

圖3 袋裝法與提升法基本策略比較

(4)主成分分析(PCA)提取主成分貢獻度

研究對400~1000 nm全波段反射率數據進行PCA分析后發現,前七個主成分即可累計解釋超過99.9%的光譜信息,如圖5所示。這說明煙草冠層的主要光譜變異可由少量主成分表示,為后續PLSR建模顯著降低了維度與共線性問題。PCA的引入有效壓縮了數據冗余,提升了模型訓練的計算效率和穩定性,為構建偏最小二乘回歸(PLSR)及多元線性回歸(MLR)模型提供了優化輸入。

圖4 前7個主成分貢獻超過99.9%的信息量

(4)連續投影算法(SPA)波段特征

使用連續投影算法(SPA)通過逐步投影和最小化波段間共線性,篩選出*具代表性的光譜特征變量。橫軸為選擇波段數量,縱軸為模型的RMSE值。結果顯示,當選取波段數量達到15個時,RMSE下降至約5.1 mg/g,達到*優解。進一步增加波段數量并未顯著降低誤差,表明SPA有效找到了信息量豐富且冗余度低的波段組合。論文指出,SPA能夠在保持主要氮敏感特征的同時減少噪聲干擾,為后續建模提供更高信噪比的輸入變量,從而提升模型的泛化性能。

圖5 SPA最終篩選的條帶數量

(5)連續投影算法(SPA)波段特征選擇

圖7展示了通過SPA算法篩選出的15個關鍵氮敏感波段在400~1000 nm范圍內的分布情況。這些波段主要集中于三個關鍵光譜區間:藍光區(405–466 nm):對應葉綠素強吸收區,與植被含氮水平密切相關;紅邊區(662–721 nm):對葉片氮、葉綠素及生理狀態最敏感;近紅外區(763–959 nm):反映葉片內部結構與水分含量變化。

波段分布均勻且物理意義明確,表明這些波段能全面表征煙草冠層的光譜響應特征。論文指出,該結果驗證了光譜特征與葉片氮含量之間存在穩定的函數關系,為建立穩健的高光譜反演模型提供了物理依據。

圖6 所選15個頻帶的分布表

(6)模型在訓練集與測試集上的預測對比分析

本文比較了不同建模方法在訓練集與測試集上的預測性能,包括PLSR、MLR、DTR、RF、Adaboost以及三種堆疊模型(Stacking-1/2/3),如圖8所示。結果顯示,所有集成學習模型均顯著優于基線PLSR模型(R2=0.680)。其中,Stacking-3模型在測試集上表現*佳(R2=0.745,RMSE=4.824 mg/g,MAPE=17.98%),兼具高精度與高穩定性。Adaboost模型在MAPE上表現*優(17.56%),說明其通過動態調整弱學習器權重有效降低了偏差。整體趨勢表明,Stacking策略可整合不同模型的優點,提取更多潛在特征信息,從而提高對煙草葉片氮含量的預測能力。這一結果證實了集成學習框架在應對高維非線性農業遙感數據時的優勢。

圖7 不同模型下訓練集與測試集的煙草煙霧密度(mg/g),??2與RMSE的對比分析

(7)討論模型在不同數據集和堆疊層級下的表現差異

不同子集達到AVCR>99.9%所需的主成分數不同——S1~S3:5;S4:8;S5:6;S6:6。這表明各子集的“有效信息維度"并不一致,反映了品種、環境與背景噪聲導致的譜—氮關系復雜度差異。復雜度越高(如S4需8個PC),越難以用統一線性子集精確刻畫。

圖8 子集S1~S3、S4、S5和S6的AVCR值

橫向對比各個子集:S6(*佳):測試集 R2=0.703,RMSE=5.315 mg/g,MAPE=16.30%;S4(最差):測試集 R2=0.462,RMSE=6.122 mg/g,MAPE=17.86%。

在樣本量較小的子集(S4、S5、S6),PLSR的過擬合傾向更明顯,而樣本量相對較大的S1~S3穩定性更好,指出樣本量與參數充分訓練對穩定性的關鍵作用。

圖9 PLSR在各子集的泛化差異比較

結論

本文基于UAV搭載高光譜(400~1000?nm)與田間實測數據,采用PCA+SPA兩級降維并系統比較PLSR與多種集成學習策略,結論表明:在跨地區、跨品種、跨環境的混合數據下,集成學習整體顯著優于PLSR,其中堆疊(Stacking)在精度與穩健性上*優;*佳模型SPA?Stacking?3在測試集達到R2≈0.745、RMSE≈4.82?mg/g、MAPE≈17.98%,而且基學習器應“準確且異質",二層元學習器宜取簡單線性模型以抑制過擬合;SPA能有效降低光譜冗余、基本不損失關鍵信息。盡管UAV?HRS的定量精度尚低于近地觀測,但其提供連續空間信息、適于規模化表型監測,具備用于煙草氮素與相關性狀快速、無損監測的應用潛力;后續應進一步提升影像與預處理質量、拓展基學習器譜系,并開展分生育期/分區建模以增強普適性與可靠性。