使用近紅外高光譜成像儀鑒別枸杞不同產(chǎn)地
發(fā)布時(shí)間:2023-05-18
瀏覽次數(shù):421
采用近紅外 (874–1734 nm) 高光譜成像 (NIR-HSI) 技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)來(lái)自中國(guó)寧夏、內(nèi)蒙古、新疆和青海的 1200 份枸杞樣品進(jìn)行了溯源。研究了兩種方法,稱(chēng)為像素方式和對(duì)象方式,以區(qū)分這些中國(guó)枸杞的來(lái)源。逐像素分類(lèi)為單個(gè)枸杞的每個(gè)像素分配一個(gè)類(lèi)別,通過(guò)這種方法,直觀地反映了四個(gè)產(chǎn)地枸杞的差異。
采用近紅外 (874–1734 nm) 高光譜成像 (NIR-HSI) 技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)來(lái)自中國(guó)寧夏、內(nèi)蒙古、新疆和青海的 1200 份枸杞樣品進(jìn)行了溯源。研究了兩種方法,稱(chēng)為像素方式和對(duì)象方式,以區(qū)分這些中國(guó)枸杞的來(lái)源。逐像素分類(lèi)為單個(gè)枸杞的每個(gè)像素分配一個(gè)類(lèi)別,通過(guò)這種方法,直觀地反映了四個(gè)產(chǎn)地枸杞的差異。使用平均光譜進(jìn)行對(duì)象分類(lèi)。提取高光譜圖像中每個(gè)樣本所有像素點(diǎn)的平均光譜信息作為樣本的代表性光譜,然后基于這些平均光譜建立了枸杞產(chǎn)地的判別分析模型。具體來(lái)說(shuō),采集所有樣品的光譜曲線(xiàn),去除明顯噪聲后,將972~1609 nm的光譜視為枸杞的光譜。然后,對(duì)光譜曲線(xiàn)進(jìn)行移動(dòng)平均平滑(MA)預(yù)處理,建立基于支持向量機(jī)(SVM)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(NN-RBF)和極限學(xué)習(xí)機(jī)(ELM)的判別分析模型。全波段光譜,分別從主成分分析(PCA)和二階導(dǎo)數(shù)光譜的載荷中提取的特征波長(zhǎng)。在這些車(chē)型中,基于PCA載荷提取特征波長(zhǎng)的ELM模型的標(biāo)定集和預(yù)測(cè)集的識(shí)別準(zhǔn)確率均高于90%。該模型既保證了較高的識(shí)別率,又簡(jiǎn)化了模型,有利于日后的快速在線(xiàn)測(cè)試。結(jié)果表明,高光譜成像儀可以快速追蹤枸杞的來(lái)源。
枸杞為茄科多分枝灌木,果實(shí)、皮、葉均可入藥。更重要的是,枸杞灌木在我國(guó)內(nèi)蒙古、陜西、甘肅、寧夏、青海和新疆等地廣泛種植,具有優(yōu)良的水土保持能力。人們普遍認(rèn)為,生長(zhǎng)環(huán)境可能會(huì)改變選定植物的化學(xué)成分和生物學(xué)特性。寧夏枸杞以果實(shí)大、外形美觀、有效成分含量高、藥用價(jià)值廣泛等特點(diǎn)受到廣大消費(fèi)者的青睞。然而,隨著近年來(lái)市場(chǎng)上不同產(chǎn)地水果的頻繁混雜,寧夏枸杞的品質(zhì)難以保證。多數(shù)研究認(rèn)為,枸杞的產(chǎn)地來(lái)源可通過(guò)觀察枸杞的形狀和化學(xué)方法檢測(cè)內(nèi)部品質(zhì),但這些方法耗時(shí)長(zhǎng),對(duì)樣品有破壞性,檢測(cè)精度低。 因此,建立快速、無(wú)損、高精度的枸杞溯源方法迫在眉睫。同時(shí),枸杞育種工作也需要這些分析方法,以獲得營(yíng)養(yǎng)和保健品質(zhì)量更高、農(nóng)場(chǎng)價(jià)值更高的改良品種,用于寧夏枸杞的商業(yè)生產(chǎn)。
近年來(lái),光譜和光譜成像技術(shù)作為快速、無(wú)損的檢測(cè)手段被廣泛應(yīng)用于農(nóng)產(chǎn)品的產(chǎn)地鑒別和質(zhì)量分析?;?780-2526 nm 波長(zhǎng)范圍內(nèi)電磁輻射吸收的近紅外反射光譜 (NIRS) 可以在分子水平上提供有關(guān)樣品成分和性質(zhì)的全面結(jié)構(gòu)信息。事實(shí)證明,該光譜帶區(qū)域來(lái)自 CH、CO、OH 和 NH 伸縮振動(dòng)的泛音。已經(jīng)報(bào)道了幾項(xiàng)研究使用 NIRS 和化學(xué)計(jì)量學(xué)方法來(lái)確定枸杞的來(lái)源和質(zhì)量。(2016) 使用近紅外高光譜成像儀 來(lái)評(píng)估枸杞多糖 (LBPs) 的含量。(2017) 使用傅里葉變換近紅外 (FT-NIR) 光譜儀測(cè)定枸杞的總糖含量。(2016) 使用 NIRS 確定枸杞的地理來(lái)源和與來(lái)源相關(guān)的黃酮類(lèi)化合物含量。(2017) 使用 NIRS 確定黑枸杞的地理來(lái)源和花青素含量。他們都得出結(jié)論,NIRS 在確定枸杞原產(chǎn)地和質(zhì)量方面具有很高的潛力。然而,問(wèn)題與這些方法有關(guān),即樣品在粉碎成粉末時(shí)會(huì)損壞,從而難以進(jìn)行視覺(jué)識(shí)別。此外,雖然NIRS可以從光譜中獲取樣品的內(nèi)部質(zhì)量信息,但NIRS無(wú)法提供樣品的外部空間信息。
高光譜成像儀是光譜學(xué)與數(shù)字成像的結(jié)合,同時(shí)獲取物體的光譜和空間信息。近紅外高光譜成像(NIR-HSI)是光譜成像的常見(jiàn)形式之一。它可以獲得更廣泛的樣品內(nèi)部和外部信息,從而導(dǎo)致更全面的分析,有助于區(qū)分枸杞的不同地理來(lái)源。通過(guò)高光譜成像系統(tǒng),每幅高光譜圖像的一個(gè)像素具有覆蓋整個(gè)光譜范圍的波長(zhǎng)。最后,生成一個(gè)由每個(gè)波長(zhǎng)的一系列圖像組成的高光譜立方體。NIR-HSI 已成功用于鑒別某些農(nóng)產(chǎn)品的來(lái)源和質(zhì)量。(2011) 使用 NIR-HIS 檢查具有不同地形復(fù)雜性的三種谷物(大麥、小麥和高粱)的單個(gè)整粒。(2016) 使用 NIR 高光譜成像對(duì)三種硬度類(lèi)別的玉米粒進(jìn)行分類(lèi),采用像素方式和對(duì)象方式兩種方法,然而,在他們的研究中,三個(gè)類(lèi)別和每個(gè)類(lèi)別 20-40 個(gè)內(nèi)核不足以建立穩(wěn)健的判別模型并且缺少特征波長(zhǎng)以簡(jiǎn)化模型。(2013) 利用近紅外高光譜技術(shù)測(cè)量小麥的出粉率、柔軟度和蔗糖含量,實(shí)現(xiàn)了小麥碾磨質(zhì)量的可靠評(píng)價(jià)。(2013) 使用推掃式高光譜成像系統(tǒng)分別通過(guò)光譜和圖像處理技術(shù)區(qū)分麻瘋樹(shù)種子的不同地理來(lái)源。很少有論文使用 NIR-HSI 對(duì)枸杞產(chǎn)地進(jìn)行定性和定量分析。
在這項(xiàng)研究中,使用 NIR-HSI 技術(shù)研究了枸杞的四個(gè)地理來(lái)源。在獲取枸杞的高光譜數(shù)據(jù)后,提取了所有樣品的所有光譜信息。首先,采用逐像素法對(duì)不同產(chǎn)地的枸杞進(jìn)行主成分可視化分析。然后,分析枸杞樣品的平均光譜,建立支持向量機(jī)(SVM)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(NN-RBF)和極限學(xué)習(xí)機(jī)(ELM)模型。此外,還選擇了特征波長(zhǎng)以通過(guò)主成分分析 (PCA) 和二階導(dǎo)數(shù)光譜的載荷快速識(shí)別枸杞來(lái)源。
樣品準(zhǔn)備
為確保地理來(lái)源是唯一的實(shí)驗(yàn)變量,枸杞樣品是從稱(chēng)為枸杞的同一物種中采集的. 在這項(xiàng)研究中,枸杞是從四個(gè)主要產(chǎn)區(qū)的當(dāng)?shù)剞r(nóng)民那里購(gòu)買(mǎi)的,包括中寧縣(105.67°E,37.48°N,中國(guó)寧夏中衛(wèi)),烏拉特前旗(108.65°E,40.72°N,巴彥淖爾市) , 中國(guó)內(nèi)蒙古), 精河縣 (82.88°E, 44.60°N, 博爾塔拉蒙古, 中國(guó)新疆), 都蘭縣 (98.08°E, 36.30°N, 海西, 中國(guó)青海). 枸杞灌木在中國(guó)的寧夏、內(nèi)蒙古、新疆和青海被當(dāng)?shù)剞r(nóng)民廣泛種植。我們可以將這些枸杞作為食物,也可以對(duì)其進(jìn)行研究。因此,這些位置不需要特定權(quán)限。此外,我們已確認(rèn)實(shí)地研究不涉及瀕危或受保護(hù)物種。單個(gè)枸杞被用作樣品。從每個(gè)產(chǎn)區(qū)抽取樣品300個(gè),共采集樣品1200個(gè)。為采用近似賦值法判定枸杞產(chǎn)地,寧夏為1,內(nèi)蒙古為2,新疆為3,青海為4。將每個(gè)枸杞樣品表面擦拭干凈,樣品在高光譜儀器平臺(tái)上彼此分開(kāi)。采集到的四種不同產(chǎn)地枸杞的 RGB 圖像如下圖所示,外觀無(wú)明顯差異。
數(shù)據(jù)分析
光譜信息中存在大量冗余信息和共線(xiàn)信息,極大地干擾了有效光譜信息的提取。此外,豐富的光譜數(shù)據(jù)導(dǎo)致模型復(fù)雜,計(jì)算耗時(shí)。本研究利用主成分分析載荷(PCA載荷)和二階導(dǎo)數(shù)光譜來(lái)選擇特征波長(zhǎng),以減少冗余和共線(xiàn)信息的影響,簡(jiǎn)化模型并減輕計(jì)算負(fù)擔(dān)。
主成分分析的載荷反映了主成分與原始波長(zhǎng)變量之間的相關(guān)程度。主成分分析的載荷越大表明相應(yīng)波長(zhǎng)變量的重要性越大,包含的信息越多。為了通過(guò) PCA 負(fù)載選擇特征波長(zhǎng),確定了不同主成分 (PC) 的貢獻(xiàn)率,然后選擇分析的 PC 的累積貢獻(xiàn)率和 PC 的數(shù)量。然后,為了確定相應(yīng)PC的負(fù)載,設(shè)置閾值并根據(jù)波長(zhǎng)負(fù)載圖選擇峰或谷作為特征波長(zhǎng)。
常用的光譜預(yù)處理方法之一是導(dǎo)數(shù)光譜,它可以有效地突出光譜的特征信息。導(dǎo)數(shù)光譜用于通過(guò)選擇適當(dāng)?shù)姆寤蚬葋?lái)選擇特征波長(zhǎng)。本研究基于二階導(dǎo)數(shù)光譜選擇特征波長(zhǎng)。由于噪聲對(duì)導(dǎo)數(shù)光譜的影響很大,在選擇特征波長(zhǎng)之前,通過(guò)平滑對(duì)原始光譜進(jìn)行平滑處理,以盡量減少原始光譜的噪聲。
本研究首先對(duì)來(lái)自四個(gè)不同產(chǎn)地的枸杞全像素光譜信息進(jìn)行主成分分析(PCA)可視化分析。然后,基于所有樣本的平均光譜信息建立了支持向量機(jī)(SVM)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(NN-RBF)和極限學(xué)習(xí)機(jī)(ELM)判別分析模型。
PCA是解決數(shù)據(jù)多重共線(xiàn)性問(wèn)題、提取數(shù)據(jù)特征信息、實(shí)現(xiàn)數(shù)據(jù)壓縮的有效算法。PCA將多個(gè)變量通過(guò)線(xiàn)性變換變換到一個(gè)新的坐標(biāo)系中,將數(shù)據(jù)的最大方差投影到第一個(gè)坐標(biāo)(第一主成分,PC1),第二大方差投影到第二個(gè)坐標(biāo)(第二主成分) , PC2) 等, 以獲得與變量個(gè)數(shù)相同的主成分?jǐn)?shù)。本研究根據(jù)累計(jì)貢獻(xiàn)率選取前5個(gè)主成分,并繪制得分圖。通過(guò)結(jié)合得分信息和光譜變量的空間信息,可視化了主成分。
SVM是一種基于結(jié)構(gòu)化風(fēng)險(xiǎn)最小化的統(tǒng)計(jì)學(xué)習(xí)方法。SVM通過(guò)非線(xiàn)性映射將樣本空間映射到高維或無(wú)限維的特征空間。線(xiàn)性劃分或回歸是通過(guò)線(xiàn)性超平面在高維特征空間中實(shí)現(xiàn)的。該方法可以解決神經(jīng)網(wǎng)絡(luò)中樣本少、非線(xiàn)性、高維等問(wèn)題,克服局部極小問(wèn)題。在這項(xiàng)研究中,選擇了不同的懲罰參數(shù)(c)和核函數(shù)參數(shù)(g)以達(dá)到最高的識(shí)別率。
NN-RBF是一種3層前饋神經(jīng)網(wǎng)絡(luò),具有訓(xùn)練速度快、泛化能力強(qiáng)和任意逼近等優(yōu)點(diǎn)。NN-RBF學(xué)習(xí)的目的是確定隱含層神經(jīng)元個(gè)數(shù)、NN-RBF函數(shù)的類(lèi)別、中心和寬度,進(jìn)而確定隱含層和輸出層之間的權(quán)值。本研究通過(guò)將 NN-RBF 神經(jīng)網(wǎng)絡(luò)中的擴(kuò)散率設(shè)置為 0.1-1 和 1-100,使模型達(dá)到最高的識(shí)別率,模型識(shí)別率最高時(shí)的擴(kuò)散值為選為最佳參數(shù)。
通過(guò)設(shè)置隱藏層神經(jīng)元個(gè)數(shù),比較不同神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)的效果,得到最優(yōu)解。本研究將隱藏層神經(jīng)元個(gè)數(shù)從1優(yōu)化到150個(gè),步長(zhǎng)為1,最小訓(xùn)練誤差下的神經(jīng)元個(gè)數(shù)即為ELM模型的隱藏層神經(jīng)元個(gè)數(shù)。
結(jié)果與討論
逐像素分析和分類(lèi)
為了可視化四個(gè)產(chǎn)地枸杞的差異,對(duì)四個(gè)不同產(chǎn)地枸杞的全像素光譜信息進(jìn)行主成分分析。本研究剔除背景和無(wú)關(guān)緊要的像素點(diǎn),得到枸杞子4個(gè)位置20196個(gè)像素點(diǎn)的光譜信息,并進(jìn)行主成分分析。確定前五個(gè)PC,并根據(jù)每個(gè)像素的分?jǐn)?shù)和像素的空間分布繪制PC的分?jǐn)?shù)。不同的顏色代表不同的分?jǐn)?shù)。前五個(gè)主成分的累計(jì)貢獻(xiàn)率為99.78%,解釋了大部分光譜變量。在 PC1 的得分圖像中,顏色分布的類(lèi)型對(duì)于前兩個(gè)位置和下面兩個(gè)位置明顯不同。在 PC2 的得分圖像中,頂部位置的顏色比其余位置的顏色更暖,其余位置的顏色更冷。雖然 PC3、PC4 和 PC5 的貢獻(xiàn)率只占總數(shù)的很小一部分,但它們包含了更多可以表征不同產(chǎn)地的內(nèi)部信息。從他們的評(píng)分圖中可以看出,不同產(chǎn)地的枸杞內(nèi)部分布不同。在 PC3 和 PC4 的得分圖像中, 不同產(chǎn)地的枸杞顏色分布從上到下逐漸由冷色調(diào)變?yōu)榕{(diào)。對(duì)于PC5,不同產(chǎn)地的枸杞在評(píng)分圖中從上到下的顏色分布由暖色調(diào)逐漸變?yōu)槔渖{(diào)。由于在 PC3、PC4 和 PC5 的得分圖像中更容易區(qū)分來(lái)源,因此得分分布與這三個(gè)主要成分的得分一起繪制。主成分分析的分?jǐn)?shù)往往反映了樣本的內(nèi)在信息。雖然不同產(chǎn)地枸杞的分?jǐn)?shù)分布圖相互重疊, 同源樣本更加集中, 形成不同區(qū)域。因此,雖然可以直觀地反映四種產(chǎn)地枸杞之間的差異,但很難做到準(zhǔn)確分類(lèi)。
前五個(gè)主成分的評(píng)分圖像。顏色的變化代表了來(lái)自四個(gè)不同產(chǎn)地的枸杞的內(nèi)部分布
逐像素 2D PCA 得分散點(diǎn)圖 (a) PC3 和 PC4 以及 (b) PC5 和 PC4。來(lái)自同一來(lái)源的樣本更加集中,形成了四個(gè)不同的區(qū)域
對(duì)象分析和分類(lèi)
不同產(chǎn)地枸杞的光譜特征,在對(duì)象方面的方法中,所描繪的對(duì)象(在本例中為中國(guó)枸杞)被用作數(shù)據(jù)點(diǎn)而不是單個(gè)像素。將每顆枸杞所有像素點(diǎn)的光譜反射率取平均值作為一個(gè)樣品的光譜反射率,共得到1200條光譜曲線(xiàn)。去除光譜曲線(xiàn)前端和后端的噪聲,選擇972-1609 nm范圍內(nèi)經(jīng)過(guò)移動(dòng)平均平滑(MA)預(yù)處理的光譜進(jìn)行分析。四種不同產(chǎn)地枸杞的平均光譜如圖所示。不同產(chǎn)地的枸杞具有相似的光譜模式,均在大約 995、1200 和 1465 nm 處有吸收峰。995 nm附近的吸收峰歸因于蛋白質(zhì)或氨基酸中NH鍵的二次振動(dòng)。1200 nm 附近的吸收峰歸因于淀粉、蛋白質(zhì)或脂質(zhì)中 CH 鍵的二次伸縮振動(dòng)。1465 nm 附近的吸收峰是水吸收的敏感區(qū)域 。如圖所示, 四種不同產(chǎn)地的枸杞在972-1609 nm范圍內(nèi)的平均光譜顯示出相似的光譜曲線(xiàn)和略有不同的反射率值。該特征可能是由于不同地區(qū)和氣候的內(nèi)部組件差異引起的。
不同產(chǎn)地枸杞在 972–1609 nm 范圍內(nèi)的平均反射光譜。去除光譜曲線(xiàn)前端和后端的噪聲,并用移動(dòng)平均平滑(MA)對(duì)光譜進(jìn)行預(yù)處理
對(duì)象方面的主成分分析。
將來(lái)自四個(gè)地理來(lái)源的1200個(gè)樣本的光譜數(shù)據(jù)按照算法以2:1的比例分為校準(zhǔn)集和預(yù)測(cè)集,每個(gè)地理來(lái)源的200個(gè)樣本作為校準(zhǔn)集來(lái)自每個(gè)地理來(lái)源的剩余 100 個(gè)樣本用作預(yù)測(cè)集。對(duì)模型集的光譜數(shù)據(jù)進(jìn)行主成分分析,定性分析枸杞產(chǎn)地鑒別。下圖顯示了 PC3 和 PC4 的二維分?jǐn)?shù)散點(diǎn)圖。如下圖所示,來(lái)自每個(gè)地理來(lái)源的樣本根據(jù)自己的特征聚類(lèi)在一起,盡管分?jǐn)?shù)圖中仍然存在一些重疊。需要進(jìn)一步分析和處理以識(shí)別枸杞的不同產(chǎn)地。
來(lái)自每個(gè)地理來(lái)源的樣本根據(jù)其自身的特征聚集在一起
結(jié)論
利用高光譜成像儀系統(tǒng)結(jié)合提取的特征波段和不同的判別分析模型對(duì)枸杞的起源進(jìn)行了追溯。從枸杞的像素光譜出發(fā),結(jié)合枸杞的空間分布,繪制了主成分偽彩色圖,直觀展示了四種產(chǎn)地枸杞的差異。從枸杞樣品的角度出發(fā),通過(guò)PCA加載和二階導(dǎo)數(shù)光譜提取的全光譜和特征波長(zhǎng)建立不同的判別分析模型。經(jīng)過(guò)分析比較,基于全光譜的判別模型優(yōu)于基于特征波長(zhǎng)的判別模型。在判別分析建模方法中,ELM算法獲得了最好的判別效果。基于PCA加載提取的特征波長(zhǎng)的ELM模型不僅具有較高的識(shí)別精度,而且簡(jiǎn)化了模型,有利于快速在線(xiàn)檢測(cè)。在今后的研究中,應(yīng)盡可能多地研究枸杞的產(chǎn)地,以建立更穩(wěn)健、范圍更廣的枸杞產(chǎn)地鑒定模型,并研究應(yīng)用HSI技術(shù)檢測(cè)枸杞品質(zhì)的可行性。判斷枸杞子是否經(jīng)過(guò)人工熏制。
相關(guān)產(chǎn)品
-
高光譜知識(shí):高光譜圖像處理技術(shù)
高光譜圖像處理技術(shù)是一種集圖像與光譜信息于一體的高分辨率技術(shù),廣泛應(yīng)用于航天、農(nóng)業(yè)、食品安全、醫(yī)學(xué)診斷及工業(yè)分類(lèi)質(zhì)檢等領(lǐng)域,展現(xiàn)出強(qiáng)大的應(yīng)用潛力和價(jià)值。..
-
高光譜成像技術(shù)方案怎么選擇?
探索高光譜成像技術(shù),精準(zhǔn)檢測(cè)水果品質(zhì),從源頭把控,讓每一顆果實(shí)都展現(xiàn)最佳風(fēng)味!..
-
基于多種光學(xué)技術(shù)的食品無(wú)損檢測(cè):保障食品安全質(zhì)量
隨著科技的發(fā)展,如今有了更先進(jìn)的食品檢測(cè)方法,其中基于光學(xué)的不同波段檢測(cè)方法結(jié)合光譜技術(shù)大放異彩。這些方法包括可見(jiàn)光、紅外、太赫茲以及 X 射線(xiàn)等波段的檢測(cè),它..
-
高光譜成像技術(shù)在紡織品回收分類(lèi)中的應(yīng)用
利用高光譜相機(jī)對(duì)紡織品進(jìn)行分類(lèi)以便回收,在眾多節(jié)約和減少浪費(fèi)的努力中,紡織品仍然是最大的挑戰(zhàn)之一。只有 15% 被回收和再利用,而其余 85% 最終被填埋。紡織..