首頁  技術(shù)文章  拉曼多組分分析中的偏最小二乘算法

拉曼多組分分析中的偏最小二乘算法

發(fā)布時間:2022-05-10 11:44:02 瀏覽量:2882 作者:Leon

摘要

拉曼光譜是分析生物樣品中生物分子含量的有力工具。通過檢測光子的波長變化和發(fā)生這種變化的光子的大小,就可能確定化學(xué)鍵和當(dāng)前化學(xué)物質(zhì)的濃度虐骑。拉曼光譜在多組分分析中的應(yīng)用一直是一個活躍的研究領(lǐng)域准验,例如僅使用少量液體就可瞬間測量人體血液和尿液樣本中的一系列分析物。該方法不需要額外的化學(xué)品廷没,樣品不受測量過程的影響糊饱。

正文


拉曼多組分分析中的偏最小二乘算法

在過去的二十年中,人們對拉曼光譜在測量多組分混合物中不同組分濃度方面的應(yīng)用有相當(dāng)大的興趣颠黎。首先是建立一個純形式的單個組分的拉曼光譜數(shù)據(jù)庫來實現(xiàn)的另锋。然后應(yīng)用最小二乘算法找到一個最佳擬合說明混合光譜。偏最小二乘算法返回的權(quán)值表示每個分量的相對濃度狭归。該方法可應(yīng)用來估計血液和尿液樣品中各種分析物的濃度夭坪,包括葡萄糖。多分量分析的核心的算法為偏最小二乘(PLS)过椎。下面將討論如何利用PLS對生物樣品中的化學(xué)濃度進行建模和預(yù)測室梅,并驗證所建立模型的預(yù)測精度。


PLS是用拉曼光譜進行多組分分析的核心數(shù)學(xué)方法疚宇。PLS結(jié)合多元回歸和主成分分析(PCA)的原理亡鼠,以檢驗因變量和自變量的方差,同時考慮它們之間的相關(guān)性敷待。偏最小二乘回歸(PLSR)是基于自變量(例如波長變化)和因變量(例如分析物的濃度)之間的線性關(guān)系的假設(shè)拆宛。它類似于主成分回歸(PCR),因為它試圖構(gòu)建一個稀疏潛變量的矩陣讼撒,然而浑厚,不同的是,在PLS中根盒,自變量被構(gòu)建為與因變量具有高協(xié)方差钳幅。因此,PLS優(yōu)化了方差解釋和與因變量的相關(guān)性炎滞,而PCR在構(gòu)建自在變量時沒有使用響應(yīng)敢艰。


在預(yù)測數(shù)據(jù)時,需要評估或驗證模型的準(zhǔn)確性及其預(yù)測精度册赛。相關(guān)系數(shù)r是變量之間線性關(guān)系強度的度量钠导。在回歸分析中,r2被稱為決定系數(shù)森瘪,它是衡量自變量用來預(yù)測因變量的準(zhǔn)確性的一個指標(biāo)牡属。r更明確地定義為:



其中n表示數(shù)據(jù)對的個數(shù)。r2是r的平方扼睬。r的取值范圍是+1到-1逮栅,+1表示線性正相關(guān),即x增加,y增加措伐。-1表示負相關(guān)特纤,即x增加,y減少侥加。r2在0和1之間捧存,1表示完全相關(guān),0表示不相關(guān)担败。


均方根誤差(RMSE)是衡量包括PCR和PLSR在內(nèi)的回歸模型擬合優(yōu)度的常用指標(biāo)昔穴。它是預(yù)測濃度(殘差)與觀測濃度(殘差)之差的樣本標(biāo)準(zhǔn)差。交叉驗證涉及到將數(shù)據(jù)分割成子集氢架,用于訓(xùn)練和測試模型傻咖。交叉驗證的留一法涉及分離單個樣品及其光譜朋魔。其余的樣本用于訓(xùn)練目的岖研,然后該模型用于預(yù)測分離樣本。這個過程會反復(fù)進行警检,直到每個樣本都被用作針對剩余池的數(shù)據(jù)測試集孙援。驗證測試結(jié)果等措施的根均方誤差預(yù)測(RMSEP),當(dāng)處理一組測試數(shù)據(jù)和一組訓(xùn)練數(shù)據(jù),和交叉驗證的根均方誤差(RMSECV),當(dāng)處理多個測試和訓(xùn)練數(shù)據(jù)的組合。更明確:



其中n為集合中元素的總數(shù)扇雕,L為訓(xùn)練數(shù)據(jù)拓售,k為所選訓(xùn)練數(shù)據(jù)的子集。


您可以通過我們昊量光電的官方網(wǎng)站www.wjjzl.com了解更多的產(chǎn)品信息镶奉,或直接來電咨詢4006-888-532础淤,我們將竭誠為您服務(wù)。

国产福利姬视频在线观看,国产原创激情在线观看网站,亚洲欧美日韩激色国产精品,日韩精品亚洲国产