四虎国产精品永久在线国在线 ,国内精久久久久久久久久人,久久久精品久久久欧美俄罗乱妇,中国孕妇变态孕交XXXX

語言 ?
中文EN

構(gòu)建基于機器學(xué)習(xí)的孕中期流產(chǎn)風(fēng)險預(yù)測模型

發(fā)布時間:  2025-05-29 17:11:40



2025年4月26日,Sangsang Qi等人在《BMC Pregnancy and Childbirth》雜志上發(fā)表了一篇題為《Building a machine learning-based risk prediction model for second-trimester miscarriage》的文章。本研究旨在構(gòu)建一種基于機器學(xué)習(xí)的風(fēng)險預(yù)測模型,用于準(zhǔn)確預(yù)測孕婦在妊娠中期(14+0至27+6周)發(fā)生流產(chǎn)的風(fēng)險。


圖1 預(yù)測模型流程圖




研究背景

妊娠中期流產(chǎn)(STM)是常見的不良妊娠結(jié)局,占所有流產(chǎn)的2%-3%,但其對患者身心健康的長期影響常被低估?,F(xiàn)有研究多聚焦于妊娠早期流產(chǎn)或早產(chǎn),而妊娠中期流產(chǎn)的預(yù)測模型研究較少。傳統(tǒng)統(tǒng)計方法在復(fù)雜因素分析中存在局限性,機器學(xué)習(xí)(ML)因其處理非線性關(guān)系和特征交互的優(yōu)勢,成為構(gòu)建預(yù)測模型的有力工具。本研究基于臨床實際需求,結(jié)合炎癥標(biāo)志物、宮頸長度等潛在風(fēng)險因素,探索建立高精度、可解釋的妊娠中期流產(chǎn)預(yù)測模型。



數(shù)據(jù)來源

研究回顧性收集了2020年1月至2023年10月期間在寧波大學(xué)婦女兒童醫(yī)院住院、診斷為“先兆流產(chǎn)且孕周為14+0至27+6周的2006例患者數(shù)據(jù)。排除標(biāo)準(zhǔn)包括入院時已確診“難免流產(chǎn)”、嚴(yán)重系統(tǒng)性疾病、胚胎染色體異常及失訪病例。數(shù)據(jù)涵蓋30項臨床特征,包括年齡、孕周、陰道出血、宮頸長度、白細胞計數(shù)(WBC)、C反應(yīng)蛋白(CRP)等。



研究方法

研究采用分層隨機抽樣將數(shù)據(jù)分為訓(xùn)練集(70%)和驗證集(30%)。通過Boruta算法篩選關(guān)鍵特征,結(jié)合多元邏輯回歸進一步確定最終10個預(yù)測變量(如宮頸長度、陰道出血、CRP等)。針對數(shù)據(jù)不平衡問題,使用SMOTE過采樣技術(shù)平衡正負樣本。構(gòu)建了包括邏輯回歸(LR)、支持向量機(SVM)、隨機森林(RF)、XGBoost等7種機器學(xué)習(xí)模型,并基于準(zhǔn)確率、召回率、ROC-AUC、PR-AP等指標(biāo)評估性能。通過SHAP方法解釋模型預(yù)測邏輯,并開發(fā)了在線可視化工具。



結(jié)果

研究人群的基線特征

2020年1月至2023年10月,寧波大學(xué)附屬婦幼醫(yī)院共收治了2172例妊娠 14+0周至 27+6周被診斷為“先兆流產(chǎn)”的患者。根據(jù)排除標(biāo)準(zhǔn),我們排除了166例患者:其中2例患有精神障礙,153例反復(fù)住院,11例因特殊原因自動出院。最終,我們的研究共納入2006例患者;其中395例(19.69%)患者發(fā)生自然流產(chǎn)。作者考慮了30個潛在預(yù)測變量進行分析,并統(tǒng)計分析了所有納入病例中每個因素的缺失值。宮頸長度(4.99%)、CRP(3.54%)、異常羊水量(1.94%)、孕前BMI(0.25%)、白細胞計數(shù)(0.15%)、中性粒細胞百分比(0.15%)的缺失數(shù)據(jù)占個人數(shù)據(jù)的5%以下,如圖2所示。我們使用數(shù)值變量的平均值和分類變量的眾數(shù)來填充缺失值。


圖2 缺失值分析

本研究考察了30個可能導(dǎo)致STM的風(fēng)險變量。為了避免眾多特征之間的共線性,創(chuàng)建了相關(guān)性熱力圖來預(yù)測STM的風(fēng)險特征。相關(guān)性熱力圖是一種可視化工具,它以熱圖的形式顯示特征之間的相關(guān)系數(shù),并用顏色陰影表示特征之間的相關(guān)程度。圖3展示了納入研究中風(fēng)險特征的相關(guān)性分析,Spearman相關(guān)系數(shù)小于0.6,表明納入特征之間的相關(guān)性較低。


圖3 相關(guān)性熱力圖

特征選擇

Boruta是一種基于隨機森林分類器的特征選擇算法。在我們的研究中,Boruta進行了500次迭代,選擇結(jié)果總結(jié)在圖4中。以下特征與STM風(fēng)險相關(guān):孕婦年齡、腹痛、陰道出血、陰道分泌物、宮頸長度、宮內(nèi)手術(shù)次數(shù)、絨毛膜下血腫、子宮肌瘤、白細胞、中性粒細胞百分比、CRP、貧血和胎盤異常。


圖4 Boruta特征篩選

圖5顯示了13個特征的多變量分析。選擇具有統(tǒng)計學(xué)顯著差異(P <0.05)的特征作為最終特征。最終理想的10個特征為:腹痛、陰道出血、陰道分泌物、宮頸長度、絨毛膜下血腫、子宮肌瘤、白細胞、中性粒細胞比例、C反應(yīng)蛋白、胎盤異常。統(tǒng)計結(jié)果顯示,發(fā)生STM的風(fēng)險為19.69%,明顯低于無流產(chǎn)的概率,說明數(shù)據(jù)樣本不平衡。本研究利用SMOTE過采樣技術(shù)生成少數(shù)樣本,確保孕中期陽性樣本與陰性樣本比例為1:1,且數(shù)據(jù)結(jié)構(gòu)平衡 ,生成SMOTE后數(shù)據(jù)集。


圖5 多因素分析

模型構(gòu)建與評估

本研究采用了七種不同的機器學(xué)習(xí)技術(shù)建立模型:LR、KNN、SVM、DT、RF、XGBoost和ANN。圖6展示了這七種模型在訓(xùn)練隊列和驗證隊列中的ROC-AUC和PR-AP性能。表1比較了準(zhǔn)確率、精確率、召回率和F1分?jǐn)?shù),并使用圖7中描繪的雷達圖從多個維度比較了每個模型的性能數(shù)據(jù),以增強結(jié)果的清晰度和視覺吸引力。在七種模型中,有三個模型都表現(xiàn)出較高的預(yù)測性能:LR模型(AUC = 0.843)、SVM(AUC = 0.835)和 XGBoost(AUC = 0.833)AUC大于0.8表示預(yù)測性能良好。KNN(AUC = 0.751)、DT(AUC = 0.721)、RF(AUC = 0.796)和ANN(AUC = 0.771)模型的預(yù)測能力中等。RF模型的精確度最高,為0.653,其次是XGBoost(精確度為 0.529)。但XGBoost的PR和準(zhǔn)確度最高,分別為0.650和0.817。


圖6 ROC曲線與召回曲線 


表1 各模型預(yù)測性能比較


圖7 機器學(xué)習(xí)模型性能分析的雷達圖

當(dāng)使用臨床決策曲線分析(DCA)評估預(yù)測模型的臨床有效性時,XGBoost模型在特定范圍內(nèi)獲得的凈收益大于其他模型(圖8),表明XGBoost模型具有良好的臨床實用性。校準(zhǔn)曲線分析顯示,XGBoost模型的表現(xiàn)優(yōu)于其他模型,其Brier Score最低(驗證組中為0.132)。


圖8 臨床決策曲線和召回曲線

前瞻性驗證

對預(yù)測模型進行臨床評估,前瞻性收集了2024年1月至3月寧波大學(xué)附屬婦幼保健院符合納入和排除標(biāo)準(zhǔn)的120例患者資料,其中18例(15.0%)患有 STM。模型準(zhǔn)確率為0.858,精確率為0.519,召回率為0.778,F(xiàn)1得分為0.622,ROC-AUC為0.883,PR-AP為0.702,結(jié)果如表2所示。


表2 XGBoost的前瞻性驗證

SHAP 模型解釋

SHAP分析顯示,宮頸長度是預(yù)測中期流產(chǎn)的最關(guān)鍵因素,其縮短顯著增加風(fēng)險(如長度<20mm時風(fēng)險升高14.5倍)。其他重要特征依次為C反應(yīng)蛋白(CRP)、中性粒細胞百分比、陰道出血及陰道分泌物。模型解釋表明:宮頸縮短、炎癥標(biāo)志物升高(如CRP>2.27mg/L)、陰道出血等正向驅(qū)動流產(chǎn)預(yù)測;而宮頸長度正常(如≥30mm)、無出血等特征則降低風(fēng)險。通過可視化案例,SHAP直觀展示了各特征對個體預(yù)測結(jié)果的貢獻方向與強度,為臨床決策提供可解釋依據(jù)。


圖9  SHAP可解釋性分析

網(wǎng)頁應(yīng)用程序

此外,還為臨床醫(yī)生構(gòu)建了一個基于網(wǎng)絡(luò)的工具來使用所提出的模型(網(wǎng)址為 https://qisangsang.shinyapps.io/STMRISK/)(圖10)。


圖10 網(wǎng)頁計算器


結(jié)論

研本研究成功構(gòu)建了基于XGBoost算法的中期流產(chǎn)風(fēng)險預(yù)測模型,其性能優(yōu)于傳統(tǒng)統(tǒng)計方法,并通過SHAP實現(xiàn)可視化解釋。模型整合了易獲取的臨床指標(biāo),為早期識別高危孕婦提供了實用工具。




上一篇:機器學(xué)習(xí)算法用于預(yù)測早發(fā)心肌梗死患者中射血分?jǐn)?shù)保留型心力衰竭

下一篇:05.26-06.02 臨床預(yù)測模型研究頂刊快報



郵編:400000
聯(lián)系電話:13651835632
電子郵件:zhoubaihao910@126.com
地址:重慶市沙坪壩區(qū)龍湖光年4號樓
Copyright ? 2022 重慶嘉舟生物科技有限公司 All Rights Reserved 渝ICP備2022013225號