引言
激光誘導(dǎo)擊穿光譜(LIBS)技術(shù),作為近年來備受矚目的元素分析方法,即將短脈沖激光聚焦于樣品表面,以實(shí)現(xiàn)樣品材料表面擊穿和等離子體生成。通過捕獲等離子體的輻射光譜,基于一定的光譜數(shù)據(jù)處理模型,反演待測(cè)樣品中元素的含量[1]。相對(duì)于其他常見的元素分析技術(shù),如電感耦合等離子質(zhì)譜(ICP-MS)[2]、拉曼光譜[3]、近紅外光譜(NIR)[4]、X射線熒光光譜法(XRF)[5]和原子吸收光譜法(AAS)[6]等,LIBS分析技術(shù)具有樣品消耗量少、原位、高速、多元素同時(shí)分析等多重優(yōu)勢(shì)。目前,LIBS技術(shù)已廣泛應(yīng)用于食品[7]、工業(yè)[8]、材料科學(xué)[9]、冶金[10]和環(huán)境科學(xué)[11]等多個(gè)領(lǐng)域。在日常生活和工業(yè)中,不銹鋼作為一種重要的基礎(chǔ)材料,有著廣泛的應(yīng)用,不銹鋼中的微量元素的類型和含量對(duì)其化學(xué)物理性質(zhì)有著重要影響,在包含鎳(Ni)、鈦(Ti)和鉻(Cr)三種元素的不銹鋼中,這三種元素含量的高低共同決定了不銹鋼抗腐蝕、抗氧化等性能[12-13]以及不銹鋼的強(qiáng)度和硬度等性質(zhì)[14-15]。因此,準(zhǔn)確測(cè)量這三種元素的含量對(duì)于判斷不銹鋼合金是否具備所需特性至關(guān)重要。
然而,盡管LIBS技術(shù)前景廣泛,但由于基體效應(yīng)和自吸收效應(yīng)等的存在,導(dǎo)致光譜信號(hào)不穩(wěn)定以及測(cè)量精度難以提升等問題,在光譜數(shù)據(jù)處理過程中,如何有效地選擇和利用光譜中的關(guān)鍵特征是提高測(cè)量精度的關(guān)鍵之一。傳統(tǒng)方法中,數(shù)據(jù)分析(例如峰值選擇和波長分析)通常需要經(jīng)驗(yàn)豐富的分析師的介入。這些分析師需考慮單一參數(shù)或少量參數(shù)的相關(guān)性,限制了分析的效率。但隨著機(jī)器學(xué)習(xí)(ML)算法的引入,分析方式逐漸從根據(jù)經(jīng)驗(yàn)進(jìn)行建模分析過渡到了根據(jù)實(shí)驗(yàn)數(shù)據(jù)驅(qū)動(dòng)分析[16]。ML工具的出現(xiàn)使得算法模型可以更容易地從采集到的光譜數(shù)據(jù)中提取更多信息。趙文雅[17]等歸納總結(jié)了LIBS結(jié)合神經(jīng)網(wǎng)絡(luò)(ANN)在地質(zhì)、合金、有機(jī)聚合物、煤炭、土壤及生物等領(lǐng)域的具體應(yīng)用,并提出絕大部分ANN模型集中在BP算法建立的網(wǎng)絡(luò)模型,而其他ANN模型探索依舊很少,有待更全面的研發(fā)。Zhang[18]等回顧了ML在LIBS中的研究現(xiàn)狀和進(jìn)展,介紹了隨機(jī)森林、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等,在介紹原理的同時(shí)指出了各種模型的特點(diǎn),Brunnbauer等在討論常見的用于LIBS的ML算法的原理和優(yōu)點(diǎn)時(shí),還批判性地指出了常見數(shù)據(jù)處理方法的局限性,包括部分算法的使用過程被視為‘黑匣子’,從而使結(jié)果無法得到很好的解釋。可以看出LIBS結(jié)合ML已經(jīng)在多個(gè)領(lǐng)域得到了廣泛使用,但仍然存在進(jìn)一步發(fā)展的空間。
雖然LIBS結(jié)合ML在元素量化上的效果相比于傳統(tǒng)單變量分析法可以得到明顯的提升,但是構(gòu)建ML模型不僅僅是將算法應(yīng)用于數(shù)據(jù)集,數(shù)據(jù)簡化、歸一化、特征選擇以及超參數(shù)的優(yōu)化缺一不可[19]。將原始LIBS全光譜作為ML的模型輸入,容易引發(fā)維度災(zāi)難,導(dǎo)致模型過擬合,模型分析精度較低。相關(guān)研究人員提出多種特征選擇方法以提取LIBS光譜中的有效信息,已有研究包括主成分分析(PCA)[20]、獨(dú)立成分分析(ICA)[21]算法等降維或者特征選擇方法與ML相結(jié)合用于待測(cè)樣品元素的量化分析,說明合適的特征選擇可以在減小輸入變量的同時(shí)保留有效信息,最終提高模型的準(zhǔn)確度。變量重要性方法也是一種常見的特征選擇方法,可以評(píng)估ML模型中特征對(duì)模型性能的影響程度,其原理根據(jù)不同的ML算法和度量方法而有所不同[22]。丁宇[23]等應(yīng)用變量重要性對(duì)RF模型的輸入變量進(jìn)行優(yōu)化,用于鋁合金中鎂(Mg)元素的定量分析,結(jié)果表明相比于常規(guī)的RF模型,基于變量重要性的RF模型在建模時(shí)間減少了91.67%的情況下預(yù)測(cè)精度也得到了明顯提升。除此之外,還有多種特征選擇算法在LIBS量化分析上也能實(shí)現(xiàn)改善模型性能的效果,Tavares[24]等利用間隔連續(xù)投影算法(iSPA)選擇變量,結(jié)合PLS在預(yù)測(cè)土壤肥力屬性上獲得了最佳性能,相比于全光譜輸入的PLS模型,iSPA-PLS將變量數(shù)量最多減少了880倍。Li[25]等使用SBS算法消除LIBS譜中冗余或不相關(guān)的特征變量,并基于篩選后的變量構(gòu)建SBS-RFR標(biāo)定模型,在陶瓷樣品多元素含量的測(cè)定中,測(cè)定結(jié)果優(yōu)于使用全光譜輸入的PLS、SVM和RF的回歸模型。Luarte [26]等比較了先驗(yàn)知識(shí)結(jié)合四種變量選擇算法用于銅精礦球團(tuán)中銅(Cu)、鐵(Fe)和砷(As)濃度的LIBS測(cè)定,包括KBest、最小絕對(duì)收縮和選擇算子正則化(LASSO),主成分分析(PCA)和競(jìng)爭自適應(yīng)重加權(quán)抽樣(CARS),結(jié)果表明,先驗(yàn)知識(shí)和LASSO的組合在綜合性能指標(biāo)和模型復(fù)雜性方面優(yōu)于只使用先驗(yàn)知識(shí)和先驗(yàn)知識(shí)結(jié)合CARS、KBest、PCA。這些方法旨在對(duì)光譜變量進(jìn)行預(yù)處理,以從復(fù)雜的光譜數(shù)據(jù)中選擇最佳的特征子集,提高特征變量和模型標(biāo)簽之間的關(guān)聯(lián)性,從而在實(shí)現(xiàn)降低計(jì)算復(fù)雜度的同時(shí)能夠提高預(yù)測(cè)精度。本文比較的順序后向選擇(SBS)、LASSO兩種特征選擇方法應(yīng)用于不銹鋼樣品中Ni、Ti和Cr元素的量化分析尚未報(bào)道。
1、實(shí)驗(yàn)部分
在本研究中,LIBS裝置主要由激光器、光譜儀、時(shí)序控制裝置和激光光路構(gòu)成,LIBS光譜的采集過程在大氣條件下進(jìn)行。所用激光器為燈泵浦緊湊型電光調(diào)Q激光器(Penny-300-TH),激光波長為1064nm,單脈沖能量約為40mJ,脈沖寬度10ns,激光頻率為5Hz。為了實(shí)驗(yàn)數(shù)據(jù)的可靠性,將3次剝蝕得到數(shù)據(jù)的平均值作為一次數(shù)據(jù),光譜儀為納秒級(jí)曝光光譜儀(SR-750-B1,Andor Technology Ltd),本實(shí)驗(yàn)使用的光柵為1200gr·mm-1,對(duì)應(yīng)分辨率為0.04nm,帶寬覆蓋300~800nm波長,光譜儀的采集門寬設(shè)置為20μs,采集延時(shí)設(shè)置1μs。使用的探測(cè)器為增強(qiáng)型電荷耦合器件(ICCD),型號(hào)為iStar 334T(Andor Technology Ltd),具體實(shí)驗(yàn)裝置示意圖如圖1所示。激光光束經(jīng)過擴(kuò)束器擴(kuò)束和反射鏡反射后,通過焦距為75mm的會(huì)聚透鏡聚焦在三維電動(dòng)移動(dòng)平臺(tái)上的樣品表面,經(jīng)由收光裝置匯聚到光纖端面,傳輸?shù)焦庾V儀記錄并轉(zhuǎn)換,最終在電腦上呈現(xiàn)并得到光譜數(shù)據(jù)。本研究以不銹鋼中的鎳(Ni)、鉻(Cr)和鈦(Ti)為待測(cè)元素,7個(gè)不銹鋼樣品均購自鋼研納克檢測(cè)技術(shù)股份有限公司,編號(hào)序列為GBW01659a-01665a,每個(gè)編號(hào)代表一個(gè)樣品,表1為樣品中三種元素的參考含量。為避免誤差,實(shí)驗(yàn)過程中每個(gè)樣品選擇20個(gè)不同的位置進(jìn)行測(cè)量,每個(gè)位置采集3次光譜得到平均值記錄為一次數(shù)據(jù),共得到140條數(shù)據(jù)記錄。然后將得到的數(shù)據(jù)減去同條件下?lián)舸┛諝鈺r(shí)的光譜數(shù)據(jù),進(jìn)行簡單背景噪聲去除。利用該140條數(shù)據(jù)建立不同的校準(zhǔn)模型,分別使用全光譜數(shù)據(jù)、SBS、LASSO選擇特征作為模型輸入進(jìn)行數(shù)據(jù)處理和定量分析,以進(jìn)行對(duì)

比驗(yàn)證確定特征工程的分析效果,使用Python(3.9.2版本)完成,構(gòu)建LASSO和 SBS模型等主要使用了numpy、pandas、sklearn等庫。
表1
| 編號(hào) | 元素 |
| Ni | Cr | Ti |
| 含量 /% | U /% | 含量 /% | U /% | 含量 /% | U /% |
| GBW1659a | 4.76 | 0.02 | 28.00 | 0.06 | 0.053 | 0.002 |
| GBW1660a | 14.58 | 0.03 | 14.37 | 0.03 | 0.475 | 0.005 |
| GBW1661a | 19.13 | 0.06 | 10.66 | 0.04 | 0.577 | 0.008 |
| GBW1662a | 11.24 | 0.05 | 19.73 | 0.05 | 0.253 | 0.004 |
| GBW1663a | 22.77 | 0.06 | 7.65 | 0.03 | 0.774 | 0.007 |
| GBW1664a | 7.34 | 0.04 | 24.40 | 0.07 | 0.170 | 0.004 |
| GBW1665a | 8.72 | 0.03 | 17.57 | 0.06 | 0.336 | 0.003 |
2、結(jié)果與討論
圖2(a-g)是從7個(gè)不同樣品(GBW01659a-01665a)中挑選出來的具有代表性的LIBS光譜,采集的全光譜波長范圍是300~800nm,由于光譜特征譜線主要集中在330~530 nm的范圍中,挑選特征譜線集中波段展示。根據(jù)美國國家標(biāo)準(zhǔn)與技術(shù)局?jǐn)?shù)據(jù)庫確定不銹鋼光譜中具有代表性物質(zhì)元素的發(fā)射譜線并在圖2中標(biāo)出。圖中標(biāo)識(shí)了三種標(biāo)定元素Ni、Ti、Cr和基底元素Fe的部分特征發(fā)射譜線,對(duì)比發(fā)現(xiàn)元素含量不同的不銹鋼樣品的發(fā)射譜線確實(shí)存在一定差異,但是具體的量化情況難以直接分辨,如果對(duì)光譜中的各個(gè)元素的特征譜線都進(jìn)行標(biāo)注,工作量較大,并且由于不銹鋼樣品中元素種類較多,不同元素之間存在部分波長相近的特征譜線,可能會(huì)導(dǎo)致針對(duì)標(biāo)定元素選擇的特征譜線受到其他元素的干擾,從而無法在量化分析中起到有效作用,因此需要采取適當(dāng)?shù)臄?shù)據(jù)處理才能進(jìn)行更準(zhǔn)確的定量分析。

雖然在理論上光譜譜線強(qiáng)度與元素的含量呈線性相關(guān),但由于不同標(biāo)樣之間的成分差異較大,受到元素間干擾、自吸收以及激光能量波動(dòng)等因素影響,實(shí)際的光譜強(qiáng)度與元素含量往往呈非線性關(guān)系,并且難以找到合適的特定譜線用于元素含量的預(yù)測(cè)[17]。而SBS算法是一種可以用于選擇光譜波段的方法,它允許從復(fù)雜的光譜數(shù)據(jù)中提取有用的信息,以實(shí)現(xiàn)對(duì)元素含量的預(yù)測(cè)和分析。其核心思想是從復(fù)雜數(shù)據(jù)中選擇最具信息量的特征,這些特征能夠最好地反映標(biāo)簽的變化,而忽略掉那些對(duì)預(yù)測(cè)沒有幫助的特征[27]。這種特征選擇可以顯著提高元素含量分析的準(zhǔn)確性,并減少干擾因素的影響。LASSO算法是一種用于特征選擇和稀疏建模的的線性回歸技術(shù),通過正則化使原始特征稀疏化,以保留對(duì)預(yù)測(cè)有貢獻(xiàn)的特征,從而實(shí)現(xiàn)特征選擇。為了比較不同特征處理方法的效果,在將原始數(shù)據(jù)預(yù)處理后,使用特征選擇算法挑選特征,與原始光譜和預(yù)處理光譜分別作為模型輸入,得到最終結(jié)果,具體流程如圖3所示。

2.1光譜預(yù)處理
對(duì)于LIBS樣品,除了不銹鋼樣品元素含量不同導(dǎo)致的差異外,還有實(shí)驗(yàn)過程中產(chǎn)生的背景噪聲輻射、設(shè)備噪聲、模電轉(zhuǎn)換過程產(chǎn)生的附加噪聲等[28-29]。因此需要采取光譜預(yù)處理方法以抵消無關(guān)信息,從而提高模型的訓(xùn)練效果,但是在 LIBS中,對(duì)于預(yù)處理方法并沒有明確的偏好,分析師采用的方法大部分都是對(duì)特定應(yīng)用有效 [30],因此本次研究中也提出多種預(yù)處理方案進(jìn)行比較以確定最合適的方法。本次實(shí)驗(yàn)選擇最大最小歸一化(MMN)、標(biāo)準(zhǔn)正態(tài)變換(SNV)[31]、Savitzky-Golay平滑濾波(SG)[32]以及內(nèi)標(biāo)法(IS) [30]對(duì)光譜進(jìn)行預(yù)處理,通過對(duì)比決定系數(shù) R 2和均方根誤差 RMSE以進(jìn)行評(píng)估,考慮到不同輸入變量對(duì)模型的影響,每一次預(yù)處理方法都會(huì)對(duì)模型參數(shù)進(jìn)行優(yōu)化以選擇最佳模型。 R 2和 RMSE的表達(dá)式如式(1)和式(2)

式(l)和式(2)中,n為樣本數(shù)量,yi是標(biāo)準(zhǔn)參考值,yi是對(duì)應(yīng)的預(yù)測(cè)值。R2是一種用于度量統(tǒng)計(jì)模型對(duì)觀測(cè)數(shù)據(jù)的擬合程度的指標(biāo),R2越接近l表示模型對(duì)數(shù)據(jù)的擬合越好,RMSE表示了模型的預(yù)測(cè)誤差的標(biāo)準(zhǔn)差。通常以與目標(biāo)變量相同的單位來度量。較低的 RMSE值表示模型的預(yù)測(cè)與實(shí)際觀測(cè)值更接近。而較高的 RMSE值表示模型的預(yù)測(cè)與實(shí)際觀測(cè)值之間的差異較大。
預(yù)處理過程中使用的內(nèi)標(biāo)法為全譜內(nèi)標(biāo)法,選取基底元素鐵(Fe)在404.58nm處的譜線強(qiáng)度對(duì)整個(gè)光譜譜線進(jìn)行歸一化處理,歸一化方法如式(3)

式(3)中, I為降噪后的光譜數(shù)據(jù), I Fe 為基體元素 Fe在404.58 nm處的光譜強(qiáng)度, I ′為歸一化后的光譜數(shù)據(jù)。最終對(duì)比效果如圖4所示。
與原始光譜相比,所有預(yù)處理方法在 Ti元素的含量預(yù)測(cè)上都有更好的性能表現(xiàn),在Ni和Cr元素中,只有SG和IS模型性能有所改善。并且無論是 R 2還是 RMSE, SG平滑模型都具有最佳的表現(xiàn),以上分析表明對(duì)于定量分析不銹鋼元素中 Ni、Ti、Cr的含量,本次實(shí)驗(yàn)中 SG模型具有最佳的改善效果,Ni、Ti和Cr的 R 2和RMSE分別為0.9692、0.9579、0.9719和1.134 6 wt%、0.0442 wt%、1.1268 wt%。可能是由于 Ti元素含量較低,光譜特征不突出,所以大部分預(yù)處理方法過程主要都是在去除無關(guān)信息,而 Ni、Cr元素的含量較高,部分方法在去除不相關(guān)信息時(shí)也造成原始光譜信息的過度失真,從而導(dǎo)致定量精度的降低。在對(duì)比四種預(yù)處理方法和原始光譜后,本次實(shí)驗(yàn)選擇使用 SG平滑預(yù)處理方法用于不銹鋼樣品中Ni、Ti和Cr元素的分析。

2.2特征選擇
為了驗(yàn)證特征選擇對(duì)于模型在不銹鋼樣品Ni、Ti和Cr元素上的定量分析效果,以SG平滑后的全光譜作為輸入變量時(shí),構(gòu)建偏最小二乘回歸(PLS)模型和支持向量回歸(SVM)模型并優(yōu)化參數(shù)[18],在進(jìn)行特征選擇之前,使用全光譜數(shù)據(jù)作為輸入,預(yù)測(cè)結(jié)果作為對(duì)比。對(duì)于PLS模型,最重要的參數(shù)是潛在變量數(shù)(LV),通過五折交叉驗(yàn)證和網(wǎng)格搜索尋找最優(yōu)潛變量數(shù),對(duì)于Ni、Ti和Cr元素,其最優(yōu)潛變量數(shù)分別為4、7、5。SVM模型的重要參數(shù)有兩個(gè),分別是核函數(shù)(kernel)包括linear、poly、sigmoid、rbf以及超參數(shù)C,同樣通過5折交叉和網(wǎng)格搜索尋找最優(yōu)參數(shù),對(duì)于SG預(yù)處理后光譜的最終設(shè)置為,Ni:linear,C=0.58,Ti:poly,C=2.33,Cr:linear,C=0.38。在后續(xù)特征選擇完成后,模型輸入改變時(shí),會(huì)參考以上參數(shù)優(yōu)化方式再次選擇相應(yīng)的最優(yōu)參數(shù)。
2.2.1 SBS算法
在理論上,LIBS光譜數(shù)據(jù)越多,計(jì)算速度越慢,本次實(shí)驗(yàn)的光譜數(shù)據(jù)中包含的離散點(diǎn)為33994個(gè),屬于高維度數(shù)據(jù),并且大部分為不相關(guān)或者冗余的特征變量,在耗費(fèi)大量計(jì)算資源的同時(shí)也會(huì)阻礙LIBS定量分析的精度。本次實(shí)驗(yàn)采用的順序后向選擇(SBS)原理是按照變量的重要程度進(jìn)行特征分類,然后逐次迭代去除最不重要(重要性得分最小)的特征變量直到達(dá)到期望的特征變量個(gè)數(shù)。由于原始數(shù)據(jù)包含33994個(gè)離散點(diǎn),原則上應(yīng)當(dāng)從全光譜數(shù)據(jù)中使用排列組合選取最佳的特征組合,從全光譜數(shù)據(jù)開始,每次剔除一個(gè)最差的數(shù)據(jù),并記錄此時(shí)最好的性能分?jǐn)?shù),再進(jìn)行下一次剔除,最后選擇性能分?jǐn)?shù)最佳時(shí)的特征組合。但由于數(shù)據(jù)點(diǎn)太多,全部排列組合的數(shù)據(jù)量太為龐大,計(jì)算效率低下,因此考慮到光譜的有效特征絕大多數(shù)集中在譜峰中,使用基于局部極大值的峰識(shí)別法,設(shè)定窗口大小,取窗口中的非邊緣處的最大值為該窗口的峰值,滑動(dòng)一個(gè)數(shù)據(jù)點(diǎn)到下一個(gè)窗口再取峰值,如果相鄰的峰值相同則刪除,最終得到的為LIBS峰值,在峰值提取過程中窗口的大小選擇至關(guān)重要,具體結(jié)果如表2所示。當(dāng)窗口大小設(shè)置為不大于10個(gè)數(shù)據(jù)點(diǎn)時(shí),峰值得到完全提取,并且RMSE最小。提取效果如圖5所示。將窗口設(shè)定為10時(shí)得到的光譜峰值作為SBS算法的輸入變量。使用PLS作為SBS算法的估算器,質(zhì)量指標(biāo)為RMSE。SBS算法的特征選擇次數(shù)與RMSE值之間的關(guān)系如圖6所示,選擇RMSE值最小時(shí)的特征組合,選擇的特征個(gè)數(shù)如表2所示。


2.2.2 LASSO算法
LASSO是一種廣泛用于特征選擇和稀疏建模的線性回歸技術(shù)。它在線性回歸的基礎(chǔ)上引入了L1正則化項(xiàng),通過最小化損失函數(shù)和L1正則化項(xiàng)的組合來實(shí)現(xiàn)特征選擇和模型稀疏性 [33]。 L1正則化會(huì)使部分特征的系數(shù)變?yōu)榱悖瑥亩x擇了最重要的特征,而將其他特征忽略,實(shí)現(xiàn)了特征的自動(dòng)選擇。LASSO特征選擇的關(guān)鍵在于添加的L1正則化項(xiàng),
表2
| 元素 | 窗口大小 | 選擇特征個(gè)數(shù) | RMSE/wt% |
| Ni | 5 | 599 | 0.1235 |
| 10 | 599 | 0.1235 |
| 20 | 407 | 0.3572 |
| 30 | 287 | 0.5583 |
| Ti | 5 | 699 | 0.0033 |
| 10 | 699 | 0.0033 |
| 20 | 454 | 0.0194 |
| 30 | 331 | 0.0282 |
| Cr | 5 | 796 | 0.1163 |
| 10 | 796 | 0.1163 |
| 20 | 551 | 0.1866 |
| 30 | 406 | 0.4862 |

損失函數(shù)的表達(dá)式如式(4),其中n為樣本數(shù), α為常數(shù)系數(shù),需要進(jìn)行調(diào)優(yōu), ∥θ∥ 1 為 L1范數(shù)。在 LASSO算法中,設(shè)定好正則化參數(shù)(即 a)后會(huì)自動(dòng)擬合回歸模型,生成預(yù)測(cè)值,并將模型預(yù)測(cè)值與實(shí)際觀測(cè)值進(jìn)行比較,得到 RMSE。

在 LASSO算法中,需要對(duì)常數(shù)系數(shù) a進(jìn)行合適的參數(shù)調(diào)節(jié)。對(duì)于本次采集不銹鋼樣品得到光譜數(shù)據(jù),針對(duì)Ni、Ti、Cr三種元素對(duì)常數(shù)系數(shù)的調(diào)節(jié)過程如圖 7所示。當(dāng) RMSE最小時(shí),Ni、Ti、Cr對(duì)應(yīng)的常數(shù)系數(shù)大小分別為0.2、0.2、2.65。設(shè)置參數(shù)完成后,將系數(shù)被稀疏為零的特征剔除,剩余特征作為模型輸入,最終得到Ni、Ti、Cr的輸入特征數(shù)量為852、99、134。
2.3結(jié)果對(duì)比
在完成輸入變量的挑選和優(yōu)化之后,使用留一交叉驗(yàn)證法 [34]進(jìn)行模型的訓(xùn)練,即選取 7個(gè)標(biāo)準(zhǔn)樣品中的 6個(gè)樣品的實(shí)驗(yàn)數(shù)據(jù)作為校準(zhǔn)集,剩下1個(gè)樣品的實(shí)驗(yàn)數(shù)據(jù)作為驗(yàn)證集,循環(huán)7次,得到每一組樣品為驗(yàn)證集時(shí)得到的預(yù)測(cè)值,將7組結(jié)果的評(píng)價(jià)指標(biāo)再進(jìn)行平均計(jì)算得到最終的評(píng)價(jià)指標(biāo),采用 R 2、平均相對(duì)誤差 ARE以及相對(duì)標(biāo)準(zhǔn)偏差 RSD作為評(píng)價(jià)指標(biāo),ARE用于衡量估算值相對(duì)于真實(shí)值的平均誤差百分比,RSD是一種用于衡量數(shù)據(jù)集的相對(duì)離散程度的指標(biāo)。表達(dá)式如式(5)和式(6)

表3
| 元素 | 模型 | 輸入變量 | ARE/% | RSD/ |
| Ni |
| Full | 12.25 | 4.56 |
| SVM | SBS | 8.88 | 6.70 |
| LASSO | 7.48 | 4.29 |
| Full | 11.73 | 4.61 |
| PLS | SBS | 3.53 | 5.68 |
| Lasso | 3.50 | 4.55 |
| Ti |
| Full | 25.56 | 5.16 |
| SVM | SBS | 22.70 | 5.00 |
| LASSO | 19.90 | 8.73 |
| Full | 10.77 | 5.40 |
| PLS | SBS | 8.20 | 4.30 |
| LASSO | 2.66 | 5.23 |
| Cr |
| Full | 5.90 | 3.70 |
| SVM | SBS | 2.34 | 3.58 |
| LASSO | 2.01 | 3.15 |
| Full | 4.28 | 4.52 |
| PLS | SBS | 2.76 | 3.78 |
| LASSO | 0.93 | 2.04 |
結(jié)果如表3所示,總體來看,無論是SBS算法還是LASSO算法選擇的特征,都能改善不銹鋼樣品Ni、Ti、Cr元素的預(yù)測(cè)精度,表現(xiàn)最好的模型是SG-LASSO-PLS,其中Ni元素的ARE為3.50%,RSD為4.55%,Ti元素的ARE為2.66%,RSD為5.23%,Cr元素的ARE為0.93%,RSD為2.04%。相比于全光譜數(shù)據(jù),無論是預(yù)測(cè)精度還是預(yù)測(cè)結(jié)果的穩(wěn)定性,都有較大的提升。對(duì)于Ni和Cr元素,最優(yōu)預(yù)測(cè)結(jié)果的ARE均在4%以下,RSD也都在6%以下,顯示出較好的預(yù)測(cè)能力。而SBS選擇特征也能在預(yù)測(cè)精度上得到較大提升,但是預(yù)測(cè)結(jié)果穩(wěn)定性較差。綜上所述,本實(shí)驗(yàn)的方法可以實(shí)現(xiàn)有效地預(yù)測(cè)不銹鋼樣品中Ni、Ti、Cr元素的含量,從而對(duì)不銹鋼的類型和性能進(jìn)行評(píng)價(jià)。
3、結(jié)論
使用波長為1064nm激光剝蝕不銹鋼標(biāo)準(zhǔn)樣品,得到多個(gè)LIBS光譜,分別使用四種不同的預(yù)處理方法進(jìn)行對(duì)比,最終選擇Savitzky-Golay平滑濾波法作為最佳預(yù)處理方法。為對(duì)比不同特征選擇方法對(duì)不銹鋼樣品元素含量預(yù)測(cè)的性能,提出SBS算法和LASSO算法進(jìn)行特征選擇,并與原始數(shù)據(jù)和經(jīng)過SG平滑后的全光譜數(shù)據(jù)輸入進(jìn)行對(duì)比,機(jī)器學(xué)習(xí)模型選擇SVM和PLS。最終結(jié)果表明,本文提出的兩種特征選擇算法在有效降低模型輸入變量的同時(shí),也顯著提升了不銹鋼樣品元素的量化分析效果。在分別采取SBS和LASSO選擇特征后,對(duì)比全光譜數(shù)據(jù),對(duì)于不銹鋼樣品中的Ni、Ti、Cr元素,量化分析的準(zhǔn)確度都表現(xiàn)出明顯的提升,并且LASSO算法還提高了預(yù)測(cè)結(jié)果的穩(wěn)定性。由此可見,在不銹鋼LIBS光譜的量化分析中,對(duì)于Ni、Ti、Cr三種不同元素選擇合適的特征選擇方法,可以表現(xiàn)出相對(duì)更加優(yōu)異的預(yù)測(cè)性能,實(shí)現(xiàn)對(duì)不銹鋼Ni、Ti、Cr元素含量的快速準(zhǔn)確預(yù)測(cè)。
參考文獻(xiàn)
[1] Costa V C, Augusto A S, Castro J P,et al. Quimica Nova,2019,42(5):527.
[2]Chahrour O, Malone J. Protein and Peptide Letters,2017,24(3):253.
[3]Talari A C S, Movasaghi Z, Rehman S, et al. Applied Spectroscopy Reviews, 2015, 50(1):46.
[4]Porep J U, Kammerer D R, Carle R. Trends in Food Science&. Technology, 2015, 46(2):211.
[5]Li F,Ge L Q,Tang Z Y,et al. Applied Spectroscopy Reviews,2020,55(4):263.
[6]Terán E J, Montes M L, Rodriguez C, et al. Microchemical Journal,2019,144:159.
[7]Markiewicz-Keszycka M,Cama-Moncunill X,Casado-Gavalda M P,et al. Trends in Food Science&. Technology,2017,65:80.
[8]Agresti J, Indelicato C,Perotti M,et al. Molecules,2022,27(6):1813.
[9]Millar S, Kruschwitz S, Wilsch G. Cement and Concrete Research,2019,117:16.
[10]SUN Lan-xiang,WANG Wei,ZHANG Peng,et al(孫蘭香,汪為,張鵬,等).Metallurgical Analysis(冶金分析),2021,41(12):58.
[11]Zhang Q H,Liu Y Z. Atomic Spectroscopy,2022,43(2):174.
[12]LIU Yu-duo,SHEN Wei-hua,ZHU Zhi-qing,et al(劉雨朵,沈衛(wèi)華,朱志慶,等).Corrosion and Protection(腐蝕與防護(hù)),2022,43(12):1.
[13]XU Xiu-qing,WANG Wei,CHEN Zhi-teng,et al(徐秀清,王瑋,陳之騰,等).Materials Reports(材料導(dǎo)報(bào)),2022,36(14):21030183.
[14]LI Long-bo,LI Zheng-xian,LIU Lin-tao,et al(李龍博,李爭顯,劉林濤,等).Rare Metal Materials and Engineering(稀有金屬材料與工程),2021,50(5):1743.
[15]Mamonova A A, Baglyuk G A, Kurovskii V Y. Physics of Metals and Metallography,2015,116(6):562.
[16]Barua A,Ahmed M U,Begum S.IEEE Access,2023,11:14804.
[17]ZHAO Wen-ya, MIN Hong, LIU Shu, et al(趙文雅,閔紅,劉曙,等). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析),2021,41(7):1998.
[18]Zhang D X,Zhang H,Zhao Y,et al. Applied Spectroscopy Reviews,2022,57(2):89.
[19]Brunnbauer L,Gajarski Z, Lohninger H, et al. TrAC-Trends in Analytical Chemistry,2023,159:116859.
[20]ZHANG Ran-ran,YING Lu-na,ZHOU Wei-dong(張冉冉,應(yīng)璐娜,周衛(wèi)東).Chinese Journal of Quantum Electronics(量子電子學(xué)報(bào)),2023,40(3):376.
[21]Zhang T L,Yan C H, Qi J, et al. Journal of Analytical Atomic Spectrometry,2017,32(10):1960.
[22]Wei PF,Lu Z Z, Song J W. Reliability Engineering&. System Safety,2015,142:399.
[23]DING Yu,YANG Lin-yu,CHEN Jing,et al(丁宇,楊淋玉,陳靖,等).Laser& Optoelectronics Progress(激光與光電子學(xué)進(jìn)展),2022,59(13):1314006.
[24]Tavares T R,Mouazen A M, Nunes L C, et al. Soil&. Tillage Research,2022,216:105250.
[25]Li M G,Ruan F Q,Li R R,et al. Microchemical Journal,2022,182:107928.
[26]Luarte D, Myakalwar A K, Velasquez M,et al. Analytical Methods,2021,13(9):1181.
[27]Zhao Y J, Huo X M. Wiley Interdisciplinary Reviews-Computational Statistics,2023,15(4). https://doi.org/10.1002/wics.1602.
[28] Tognoni E,Cristoforetti G. Optics and Laser Technology,2016,79:164.
[29] Hahn D W,Omenetto N. Applied Spectroscopy,2012,66(4):347.
[30] Guezenoc J,Gallet-Budynek A,Bousquet B. Spectrochimica Acta Part B: Atomic Spectroscopy,2019,160:105688.
[31] Syvilay D,Wilkie-Chancellier N,Trichereau B,et al. Spectrochimica Acta Part B: Atomic Spectroscopy,2015,114:38.
[32] Yoon S,Choi J,Moon SJ,et al. Applied Sciences-Basel,2021,11(15):7154.
[33] Andries E. Journal of Chemometrics,2013,27(3-4):50.
[34] Wong T T. Pattern Recognition,2015,48(9):2839.
(注,原文標(biāo)題:不同特征選擇方法結(jié)合激光誘導(dǎo)擊穿光譜量化不銹鋼鎳、鈦和鉻元素含量)
相關(guān)鏈接