數(shù)據(jù)驅(qū)動的細(xì)胞培養(yǎng)基優(yōu)化:機器學(xué)習(xí)助力生物醫(yī)學(xué)進(jìn)步
1. 研究背景與挑戰(zhàn)
核心問題:哺乳動物細(xì)胞培養(yǎng)中,培養(yǎng)基成分的復(fù)雜互作導(dǎo)致傳統(tǒng)優(yōu)化方法(如實驗設(shè)計DoE)效率低下。
現(xiàn)有局限:經(jīng)驗依賴性強,易受人為偏差影響;難以平衡細(xì)胞生長速率(96小時)與最終產(chǎn)量(168小時)。
技術(shù)機遇:主動機器學(xué)習(xí)(Active ML)可通過“預(yù)測-驗證”閉環(huán)減少實驗量,實現(xiàn)多參數(shù)同步優(yōu)化。
2. 創(chuàng)新方法:從傳統(tǒng)DoE到智能ML
本研究技術(shù)路線如圖1)如所示:
圖1 技術(shù)路線圖
1)模型構(gòu)建:
細(xì)胞模型:HeLa-S3細(xì)胞(人宮頸癌細(xì)胞系)
基礎(chǔ)培養(yǎng)基:EMEM(含31種成分)
算法:梯度提升決策樹(GBDT)
2)雙模式優(yōu)化:
常規(guī)模式(R):基于168小時細(xì)胞濃度數(shù)據(jù)優(yōu)化最終產(chǎn)量
節(jié)時模式(TS):基于96小時數(shù)據(jù)預(yù)測168小時產(chǎn)量(利用早期-晚期濃度相關(guān)性)
3)四輪主動學(xué)習(xí):
初始生成209種梯度培養(yǎng)基
每輪篩選15-22種高潛力培養(yǎng)基實驗驗證
迭代更新訓(xùn)練集(共503組數(shù)據(jù))
3. 關(guān)鍵結(jié)果
1)培養(yǎng)基優(yōu)化效能
細(xì)胞濃度提升:
R模式:11種培養(yǎng)基168小時濃度顯著高于EMEM(最高提高50%)
TS模式:10種培養(yǎng)基96小時濃度提升,但僅30%維持至168小時
模型精度:
四輪迭代后預(yù)測誤差(RMSE)降低40%( p<0.05)
數(shù)據(jù)標(biāo)準(zhǔn)化(Fold Change, FC)較原始數(shù)據(jù)(C)提升模型魯棒性
圖2 R/TS模式效能對比
2)關(guān)鍵成分鑒定
特征重要性分析:9種成分貢獻(xiàn)80%生長影響(如谷氨酰胺升高、半胱氨酸降低)
時序差異:甲硫氨酸僅晚期(168小時)關(guān)鍵
圖3 培養(yǎng)基成分對細(xì)胞培養(yǎng)的關(guān)鍵影響
A.不同模型下細(xì)胞培養(yǎng)產(chǎn)量的分布;B.重要性排名前9的成分(累積貢獻(xiàn)80%)
規(guī)模放大驗證:
最優(yōu)培養(yǎng)基R445:168小時濃度提高50%(p <0.01)
成分共性:R445與失效培養(yǎng)基TS471均缺失磷酸氫鈉和硫胺素
3) 轉(zhuǎn)錄組機制解析
基因表達(dá)重編程:
R445激活增殖通路(如細(xì)胞發(fā)育相關(guān)GO term)
TS471引發(fā)表達(dá)紊亂(差異基因數(shù)↑100倍)
功能富集:
R445特異性富集:細(xì)胞周期調(diào)控基因(如mTORC1通路)
EMEM富集:代謝調(diào)控基因
圖4 基因表達(dá)變化與培養(yǎng)基優(yōu)化的關(guān)聯(lián)性研究
4. 討論與局限
1)模式對比
R模式:穩(wěn)定提升最終產(chǎn)量(C1簇占比提高)
TS模式:節(jié)省50%實驗時間,但33%培養(yǎng)基因“生長-產(chǎn)量權(quán)衡”失效(C2簇)
2)技術(shù)突破
數(shù)據(jù)驅(qū)動閉環(huán):首次整合ML預(yù)測→實驗驗證→轉(zhuǎn)錄組反饋
節(jié)時策略:利用96/168小時濃度相關(guān)性(r=0.82)加速優(yōu)化
3)局限與展望
細(xì)胞普適性:當(dāng)前僅驗證HeLa細(xì)胞,需拓展至原代/干細(xì)胞
血清依賴:含F(xiàn)BS培養(yǎng)基成分不透明,下一步開發(fā)無血清方案
算法升級:引入時間序列數(shù)據(jù)提升TS模式穩(wěn)定性
5. 應(yīng)用價值
生物制藥:快速定制單抗生產(chǎn)培養(yǎng)基(成本降低30%)
再生醫(yī)學(xué):優(yōu)化干細(xì)胞擴增體系
開源資源:
代碼庫:https://github.com/yuki020527/medium_optimization
RNA-seq數(shù)據(jù):DRA017793 (DDBJ)
總之,本研究建立了主動機器學(xué)習(xí)驅(qū)動的培養(yǎng)基優(yōu)化新范式,通過雙模式迭代和轉(zhuǎn)錄組驗證,突破傳統(tǒng)方法瓶頸。其中四輪迭代減少60%實驗量,并發(fā)現(xiàn)9種核心成分及時序調(diào)控規(guī)律,為生物制造與精準(zhǔn)醫(yī)療提供工具包。
參考文獻(xiàn):Y Ozawa, T Hashizume, BW Ying. (2025). A data-driven approach for cell culture medium optimization. Biochemical Engineering Journal, 241, 109591. https://doi.org/10.1016/j.bej.2024.109591
來源:微生物安全與健康網(wǎng),作者~陳諾。