酸度是水質檢測的重要指標,目前檢測酸度的方法主要有電位滴定法、pH指示劑法、熒光光譜法等,這些方法雖然能夠得到較為精準的酸度,但是pH指示劑法需要消耗化學試劑,而電位滴定法、熒光光譜法是離線方法,需要較長的分析時間,不能夠滿足現階段綠色、快速的檢測要求。近紅外光譜法作為一種新興的綠色檢測技術,因具有分析快速、無損、非接觸和可通過光纖傳輸進行實時監測等優點,已被廣泛用于農業、化工、醫藥等領域的檢測分析研究中,鮮有在水質酸度檢測中的應用研究報道,其主要原因是水質酸度光譜分析的模型精度達不到應用需求。
水溶液中物質成分含量的近紅外光譜分析標定試驗中,通常使用比色皿裝樣,然后檢測透射式光譜信號。若同時使用多個比色皿,可簡化試驗過程,縮短試驗時間,提高分析效率。但是,由于不同比色皿之間材質的均勻性和透光率存在微小差異,不同比色皿的光譜差異和隨機噪聲不可避免,影響了光譜分析多元校正模型的精度。
正交信號校正 (OSC)是由學者WOLD于1988年提出來的一種光譜數據預處理方法。文獻利用OSC對橡膠樣品的近紅外光譜數據進行預處理,所建立的多元校正模型得到了滿意的預測精度。文獻提出了一種基于直接正交信號校正(DOSC)的模型傳遞方法,結果表明DOSC可以去除光譜數據中與待測成分無關的噪聲,達到減小不同批次樣本光譜間的差異的目的。文獻對多環芳烴樣本的光譜數據進行OSC預處理后建立了偏最小二乘(PLS)模型,結果表明PLS模型的預測性能經 OSC預處理后得到了較大提升。文獻利用隨機森林結合OSC的方法建立了3臺光譜儀的玉米數據的傳遞模型,結果表明該方法可以有效消除光譜噪聲,減小不同光譜儀間的光譜差異。這些研究表明OSC具有去除光譜數據中的噪聲、減小光譜間的差異并提高模型預測精度的作用。
因此,本工作在水質酸度的近紅外光譜分析試驗中,用兩個比色皿對32個不同酸度的水溶液樣品進行裝樣,采集光譜數據。為減小不同比色皿裝樣光譜間的差異,提高水質酸度近紅外光譜定量分析模型的預測精度,采用OSC對光譜進行預處理。對OSC預處理前后的光譜差異和水質酸度定量分析模型的預測精度進行了比較,探討了OSC用于不同比色皿的光譜背景干擾的去除效果。
1、 試驗部分
在水中隨機加入不同體積的鹽酸標準溶液或氫氧化鈉標準溶液,獲得32個具有不同酸度的水樣,依次編號為S1~S32。用酸度計測量水樣pH(參考值),32個水樣的pH為1.64~9.31,平均值為6.27。標準差為2.03。
對于同一個水樣,分別用同一批次生產的兩個石英比色皿(分別記為1號和2號)進行裝樣,以空光路為背景,設置掃描范圍為700~1050nm,平均次數為200,積分時間為29ms,平滑次數為3,獲得兩組該樣品的近紅外光譜數據;采用OSC對兩組光譜數據分別進行預處理,得到預處理后的近紅外光譜數據。
OSC的基本原理如下:將光譜數據矩陣(X)與濃度數據矩陣(y)直接正交,然后再對正交后的X進行主成分分析,通過去除X中與y不相關的正交成分,從而消除X中的背景干擾和隨機噪聲。
2、 結果與討論
2.1 不同比色皿裝樣的光譜差異分析
以樣品S1為例,得到的近紅外光譜圖見圖1。
由圖1可見,兩個比色皿裝樣獲得的近紅外光譜整體趨勢相似,但1號比色皿對應的吸光度較強,特征峰更明顯。
2.2 不同比色皿裝樣的光譜建模差異分析
根據各水樣的酸度參考值,按照梯度法對32個樣品進行劃分,其中校正集包含24個樣品,驗證集包含8個樣品。分別用兩個比色皿裝樣分析,采用交叉驗證法確定主成分數,建立水質酸度的PLS模型,采用預測均方根誤差(RMSEP)和相關系數作為模型的精度評價指標。
結果顯示,1號比色皿裝樣所獲光譜的PLS模型的主成分數為7,RMSEP值1.096,相關系數為0.818;而2號比色皿裝樣所獲光譜的 PLS模型的主成分數為4,RMSEP值 為 2.008,相關系數為0.454,兩個模型的RMSEP差值為0.912,相關系數差值為0.364,預測精度有明顯差別,說明不同比色皿的光譜背景干擾對水質酸度的多元校正模型的預測性能有影響。
2.3 基于OSC的光譜背景干擾去除效果
對校正集和驗證集的兩組光譜數據分別進行OSC預處理。以樣品S1為例,經OSC預處理前后兩個比色皿裝樣獲得的光譜吸光度差值見圖2。
由圖2可見:OSC預處理前,兩個比色皿裝樣獲得的兩條光譜吸光度差異值相對較大,平均差異值達到1.0×10-2級;經OSC預處理后,兩條光譜吸光度差異值相對較小,平均差異值減小至5.6×10-4級。
采用光譜平均差異(ARMS)來評價光譜差異大小,采用光譜校正率(Prcorrected)來評價光譜校正效果。ARMS和Prcorrected的計算公式見公式(1)和公式(2)。


結果顯示,預處理前,樣品S1的兩組光譜數據的ARMS值為0.0042,預處理后,兩組光譜數據的ARMS值為0.0013,Prcorrected值為90%。
2.4 基于OSC的建模結果
使用經OSC預處理后的兩組光譜數據建立PLS模型。結果顯示:經OSC預處理后,1號比色皿裝樣所獲光譜的PLS模型的主成分數為5,RMSEP值為0.964,相關系數為0.924;2號比色皿裝樣所獲光譜的PLS模型的主成分數為5,RMSEP值為0.759,相關系數為0.931,兩個模型的RMSEP差值為0.205,相關系數差值為7.00×10-3。相比2.2節未經OSC預處理的光譜建立的PLS模型,模型預測精度明顯提高,RMSEP差值和相關系數差值分別減 小 了78%和98%,表明OSC預處理能減小比色皿背景干擾對水質酸度的多元校正模型的預測性能的影響,可提高多 元校正模型的預測精度.。
3、 結論
本工作分析了使用兩個比色皿采集水溶液的近紅外光譜差異及其對水質酸度定量分析模型的影響,采用OSC對兩組光譜數據進行預處理,可以減小不同比色皿裝樣的光譜差異和提高多元校正模型的預測精度,為提高近紅外光譜的分析效率和定量分析模型的預測精度提供參考。
