拉曼光譜解碼:機(jī)器學(xué)習(xí)助力無(wú)標(biāo)記SERS快速鑒定病原菌
發(fā)布時(shí)間:2025-04-07 瀏覽次數(shù):129
1. 引言
快速準(zhǔn)確的病原體檢測(cè)至關(guān)重要,但傳統(tǒng)方法存在局限性。表面增強(qiáng)拉曼散射(SERS)技術(shù)具有靈敏、快速、無(wú)損等優(yōu)勢(shì),尤其無(wú)標(biāo)記SERS無(wú)需復(fù)雜標(biāo)記,可直接檢測(cè)細(xì)菌的固有振動(dòng)指紋。然而,SERS分析面臨信號(hào)峰重疊和咖啡環(huán)效應(yīng)導(dǎo)致信號(hào)不均勻等挑戰(zhàn)。為解決這些問(wèn)題,機(jī)器學(xué)習(xí)(ML)與數(shù)據(jù)預(yù)處理技術(shù)結(jié)合,可有效去除噪聲和背景干擾,提高SERS數(shù)據(jù)分析的準(zhǔn)確性,為病原菌的快速鑒定提供了新的途徑。
本研究報(bào)道了一種結(jié)合機(jī)器學(xué)習(xí)和數(shù)據(jù)預(yù)處理的無(wú)標(biāo)記疏水SERS平臺(tái),用于病原菌的快速高通量檢測(cè)。首先優(yōu)化了SERS信號(hào),并比較了咖啡環(huán)效應(yīng)和疏水富集效應(yīng)下的SERS性能。然后,針對(duì)SERS數(shù)據(jù)開(kāi)發(fā)并評(píng)估了四種機(jī)器學(xué)習(xí)分類模型:k-NN、SVM-poly、SVM-rbf和1D-CNN。其中,SVM模型被廣泛應(yīng)用于數(shù)據(jù)分類任務(wù),而CNN模型則擅長(zhǎng)學(xué)習(xí)數(shù)據(jù)的空間結(jié)構(gòu)和模式。此外,k-NN模型作為一種簡(jiǎn)單的無(wú)監(jiān)督學(xué)習(xí)算法也被應(yīng)用于此研究。
2. 結(jié)果與討論
使用疏水SERS平臺(tái)進(jìn)行細(xì)菌檢測(cè)的無(wú)標(biāo)簽SERS分析
本研究利用疏水SERS平臺(tái)進(jìn)行病原菌的無(wú)標(biāo)記快速檢測(cè)。疏水硅片通過(guò)限制液滴擴(kuò)散,使細(xì)菌和納米顆粒集中,產(chǎn)生“局部濃度效應(yīng)”,相比于普通硅片上的“咖啡環(huán)效應(yīng)”,更有利于SERS檢測(cè)。研究人員用該平臺(tái)對(duì)大腸桿菌、單核增生乳桿菌、鼠傷寒沙門氏菌和金黃色葡萄球菌四種食源性致病菌進(jìn)行了檢測(cè),并構(gòu)建了包含800個(gè)光譜的數(shù)據(jù)集。通過(guò)數(shù)據(jù)預(yù)處理技術(shù)對(duì)數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化,再結(jié)合機(jī)器學(xué)習(xí)分類模型,實(shí)現(xiàn)了對(duì)這四種細(xì)菌的準(zhǔn)確分類。
圖1. 使用疏水SERS平臺(tái)進(jìn)行細(xì)菌檢測(cè)的無(wú)標(biāo)簽SERS分析
細(xì)菌和等離子體粒子混合物在正常和疏水硅襯底上的分布及PNs的表征
利用金核銀殼納米粒子(Au@AgNPs)增強(qiáng)SERS信號(hào),并比較了普通硅片和疏水硅片作為基底的效果。Au@AgNPs結(jié)構(gòu)均勻,在普通硅片上,由于咖啡環(huán)效應(yīng),Au@AgNPs和細(xì)菌集中在液滴邊緣;而在疏水硅片上,則集中在中心區(qū)域,形成“局部濃度效應(yīng)”,顯著提高了細(xì)菌和Au@AgNPs的濃度。疏水處理后的硅片接觸角明顯增大,證實(shí)了其良好的疏水性。結(jié)果表明,疏水基底更有利于SERS檢測(cè),因?yàn)樗茉黾訜狳c(diǎn)成分并使細(xì)菌充分暴露于熱點(diǎn)中。
圖2. 細(xì)菌和等離子體粒子混合物在正常和疏水硅襯底上的分布及PNs的表征
咖啡環(huán)效應(yīng)和局部濃度效應(yīng)下不同PNs配比的SERS活性優(yōu)化
比較了咖啡環(huán)效應(yīng)和局部濃度效應(yīng)下Au@AgNPs對(duì)大腸桿菌的SERS檢測(cè)效果。結(jié)果表明,疏水硅片上的局部濃度效應(yīng)比普通硅片上的咖啡環(huán)效應(yīng)具有更高的靈敏度。在734 cm?1處,局部濃度效應(yīng)的最佳Au@AgNPs濃度為2.6 μg/mL,而咖啡環(huán)效應(yīng)則為21 μg/mL。此外,局部濃度效應(yīng)下的SERS強(qiáng)度比咖啡環(huán)效應(yīng)高33倍,且檢測(cè)限更低。這表明疏水硅片更有利于提高SERS性能,因?yàn)樗苡行岣呒?xì)菌和Au@AgNPs的局部濃度。
圖3. 咖啡環(huán)效應(yīng)和局部濃度效應(yīng)下不同PNs配比的SERS活性優(yōu)化
數(shù)據(jù)預(yù)處理和數(shù)據(jù)集準(zhǔn)備
利用機(jī)器學(xué)習(xí)模型對(duì)四種細(xì)菌的SERS數(shù)據(jù)進(jìn)行分類。由于原始SERS數(shù)據(jù)存在噪聲干擾,研究人員采用了基線校正、平滑和歸一化等預(yù)處理步驟,增強(qiáng)了特征峰譜的清晰度。通過(guò)比較k-NN、SVM-poly、SVM-rbf和1D-CNN四種ML模型的分類性能,研究探索了不同細(xì)菌拉曼光譜的內(nèi)在差異。此外,通過(guò)分析預(yù)處理后鳥(niǎo)嘌呤峰和腺嘌呤峰的相對(duì)強(qiáng)度,驗(yàn)證了在不使用ML模型的情況下,利用SERS光譜區(qū)分細(xì)菌的可行性。
圖4. 數(shù)據(jù)預(yù)處理流程圖,數(shù)據(jù)集準(zhǔn)備,機(jī)器學(xué)習(xí)分類模型。
圖5. 數(shù)據(jù)預(yù)處理和數(shù)據(jù)集準(zhǔn)備
研究發(fā)現(xiàn),不同細(xì)菌的鳥(niǎo)嘌呤/腺嘌呤峰值比存在差異,可用于區(qū)分部分細(xì)菌,但同種細(xì)菌的不同菌株之間也存在信號(hào)差異,例如金黃色葡萄球菌菌株間差異較大,難以區(qū)分。為評(píng)估疏水SERS平臺(tái)的再現(xiàn)性,對(duì)大腸桿菌進(jìn)行了40次重復(fù)測(cè)量,相對(duì)標(biāo)準(zhǔn)偏差為7.45%。此外,不同培養(yǎng)溫度(25-42℃)下,疏水基底均能產(chǎn)生均勻的拉曼光譜,但42℃時(shí)腺嘌呤峰信號(hào)減弱,可能與細(xì)菌成分或代謝物變化有關(guān)。結(jié)果表明,疏水基底的局部濃度效應(yīng)保證了SERS信號(hào)的穩(wěn)定性和可重復(fù)性。
圖6. (A)種和(B)菌株水平上的鳥(niǎo)嘌呤相對(duì)強(qiáng)度峰比(654 ~ 661 cm?1)和腺嘌呤相對(duì)強(qiáng)度峰比(734 ~ 737 cm?1)。數(shù)據(jù)為20個(gè)拉曼光譜的平均值±標(biāo)準(zhǔn)差。
使用ML模型的細(xì)菌分類結(jié)果
本研究使用k-NN、SVM-poly、SVM-rbf和1D-CNN四種機(jī)器學(xué)習(xí)模型對(duì)預(yù)處理后的SERS數(shù)據(jù)進(jìn)行細(xì)菌分類。結(jié)果顯示,數(shù)據(jù)預(yù)處理,尤其是基線校正、平滑和歸一化,顯著提高了模型分類準(zhǔn)確率。未經(jīng)預(yù)處理的原始數(shù)據(jù)中,除k-NN外,其他模型均出現(xiàn)錯(cuò)誤分類。ROC曲線分析也表明,預(yù)處理后模型的AUC值顯著增加。即使在咖啡環(huán)效應(yīng)下,預(yù)處理后的SERS光譜準(zhǔn)確率也能達(dá)到95%以上。研究證實(shí),數(shù)據(jù)預(yù)處理對(duì)于基于SERS數(shù)據(jù)和機(jī)器學(xué)習(xí)的細(xì)菌分類至關(guān)重要。
圖7. (A)原始數(shù)據(jù)和(B)預(yù)處理后的數(shù)據(jù)得到k-NN、SVM-poly、SVM-rbf和1D-CNN四種分類模型的混淆矩陣。E., L., S., St.:大腸桿菌,單核細(xì)胞增生乳桿菌,鼠傷寒沙門氏菌,金黃色葡萄球菌。(C和D)四種分類模型的ROC曲線。
3. 總結(jié)
本研究提出了一種簡(jiǎn)單、經(jīng)濟(jì)、高靈敏度的無(wú)標(biāo)記SERS分析方法,用于快速分類和預(yù)測(cè)食源性致病菌。該方法基于疏水SERS底物、數(shù)據(jù)預(yù)處理技術(shù)和機(jī)器學(xué)習(xí)算法。研究人員通過(guò)優(yōu)化Au@AgNPs濃度和增強(qiáng)底物疏水性來(lái)誘導(dǎo)局部濃度效應(yīng),從而提升SERS性能。結(jié)果顯示,優(yōu)化后的SERS底物強(qiáng)度比利用咖啡環(huán)效應(yīng)的底物高33倍。為了提高SERS光譜的清晰度,研究人員采用了基線校正、平滑和歸一化三個(gè)預(yù)處理步驟,并結(jié)合k-NN、SVM-poly、SVM-rbf和1D-CNN四種機(jī)器學(xué)習(xí)分類模型進(jìn)行分析。數(shù)據(jù)預(yù)處理后,幾乎所有模型的分類準(zhǔn)確率都達(dá)到了100%。然而,本研究存在一個(gè)局限性:缺乏在實(shí)際低濃度環(huán)境中的驗(yàn)證,目前僅依賴于測(cè)試集進(jìn)行評(píng)估。未來(lái)研究將納入更多不同來(lái)源和環(huán)境的外部數(shù)據(jù)集,以減少選擇偏差,更全面地評(píng)估模型性能。
論文鏈接:https://doi.org/10.1016/j.snb.2024.136963
來(lái)源:微生物安全與健康網(wǎng),作者~占英。