發(fā)布時(shí)間: 2025-08-04 14:52:34
2025年7月21日,任繼良等人在《Eur Radiol Exp》雜志上發(fā)表了一篇題為《Deep learning using nasal endoscopy and T2-weighted MRI for prediction of sinonasal inverted papilloma-associated squamous cell carcinoma: an exploratory study》的文章。本研究旨在探索深度學(xué)習(xí)(DL)結(jié)合鼻內(nèi)窺鏡和T2加權(quán)磁共振成像(T2W-MRI)在自動(dòng)分割腫瘤及區(qū)分鼻竇鼻倒?fàn)盍觯⊿IP)與其惡性轉(zhuǎn)化的鱗狀細(xì)胞癌(SIP-SCC)中的應(yīng)用價(jià)值。
一、研究背景
SIP是鼻腔和鼻竇最常見的良性腫瘤,但有惡變?yōu)镾IP-SCC的風(fēng)險(xiǎn),后者治療方式更復(fù)雜且預(yù)后較差。術(shù)前準(zhǔn)確識(shí)別SIP-SCC對(duì)制定治療方案至關(guān)重要,但目前的標(biāo)準(zhǔn)診斷方法——術(shù)前穿刺活檢存在準(zhǔn)確性低、采樣誤差及侵入性等缺點(diǎn)。鼻內(nèi)窺鏡和MRI是常用的診斷工具,分別提供腫瘤表面特征和內(nèi)部結(jié)構(gòu)的互補(bǔ)信息,但人工評(píng)估易受主觀經(jīng)驗(yàn)限制。盡管已有研究利用DL分析單一模態(tài)圖像,但尚未有研究整合兩種模態(tài)以實(shí)現(xiàn)SIP-SCC的自動(dòng)化預(yù)測(cè)。因此,本研究通過開發(fā)一種雙模態(tài)DL模型,旨在為臨床提供一種高效、自動(dòng)化的預(yù)測(cè)工具,輔助醫(yī)生進(jìn)行更準(zhǔn)確的術(shù)前診斷和決策。
二、數(shù)據(jù)來源
本研究的數(shù)據(jù)來源于復(fù)旦大學(xué)附屬眼耳鼻喉科醫(yī)院2019年12月至2023年4月期間收治的SIP患者。經(jīng)過納排篩選后,最終納入174例患者進(jìn)行研究。所有入組患者均滿足兩個(gè)關(guān)鍵標(biāo)準(zhǔn):一是經(jīng)手術(shù)切除并獲得病理確診,二是在影像檢查前未接受任何治療。這些患者被隨機(jī)分為訓(xùn)練隊(duì)列(121例,含97例SIP和24例SIP-SCC)和測(cè)試隊(duì)列(53例,含43例SIP和10例SIP-SCC),兩組在年齡、性別和病理類型等基線特征上無顯著差異。
三、研究方法
在數(shù)據(jù)預(yù)處理階段,研究團(tuán)隊(duì)對(duì)MRI和鼻內(nèi)窺鏡圖像分別進(jìn)行了標(biāo)注。MRI圖像由兩名頭頸部影像診斷經(jīng)驗(yàn)的放射科醫(yī)師使ITK-SNAP軟件逐層勾畫腫瘤輪廓,若存在分歧則由資深放射科醫(yī)師仲裁。鼻內(nèi)窺鏡圖像由耳鼻喉科醫(yī)師從每位患者的四張圖像中選擇最具代表性的一張(標(biāo)準(zhǔn)為腫瘤暴露最清晰、干擾因素最少),并使用Labelme軟件進(jìn)行標(biāo)注,隨后由另一名醫(yī)師復(fù)核。此外,一名耳鼻喉科醫(yī)師隨機(jī)抽取40例患者的圖像評(píng)估標(biāo)注一致性(kappa值=0.886)。在模型構(gòu)建方面,研究針對(duì)不同模態(tài)采用了不同的分割模型:鼻內(nèi)窺鏡圖像使用UNet、DeepLabV3_ResNet101和FCN_ResNet101,T2W-MRI圖像使用UNet、UNETR和VNet。訓(xùn)練時(shí)采用DiceCE混合損失函數(shù),并通過在線數(shù)據(jù)增強(qiáng)提升泛化能力。MRI圖像預(yù)處理包括歸一化至RAS坐標(biāo)系、重采樣至1 mm3分辨率,以及強(qiáng)度標(biāo)準(zhǔn)化。分類階段采用預(yù)訓(xùn)練的DenseNet121網(wǎng)絡(luò),輸入為手動(dòng)標(biāo)注或自動(dòng)分割的腫瘤區(qū)域(MRI僅分析最大層面,內(nèi)窺鏡圖像保留腫瘤外擴(kuò)5像素的最小外接矩形)。訓(xùn)練時(shí)使用合成少數(shù)類過采樣技術(shù)(SMOTE)平衡數(shù)據(jù),并通過Z-score標(biāo)準(zhǔn)化消除強(qiáng)度差異。最終,內(nèi)窺鏡和MRI的DL預(yù)測(cè)分?jǐn)?shù)通過邏輯回歸整合為雙模態(tài)列線圖,并采用梯度加權(quán)類激活映射(Grad-CAM)生成注意力熱圖以增強(qiáng)可解釋性。性能評(píng)估方面,兩名放射科醫(yī)師獨(dú)立診斷MRI圖像,一周后在DL列線圖輔助下重新評(píng)估。模型性能通過AUROC(受試者工作特征曲線下面積)等指標(biāo)衡量,并與醫(yī)師診斷結(jié)果對(duì)比(DeLong檢驗(yàn))。(圖2)
四、結(jié)果
該研究涉及訓(xùn)練隊(duì)列(n = 121)和測(cè)試隊(duì)列(n = 53)。培訓(xùn)隊(duì)列包括97次SIP和24個(gè)SIP-SCC,而測(cè)試隊(duì)列由43個(gè)SIP和10個(gè)SIP-SCC組成。在隊(duì)列之間沒有發(fā)現(xiàn)年齡,性別或病理分類的統(tǒng)計(jì)學(xué)上顯著差異(所有P≥0.230)。(表1)
對(duì)于內(nèi)窺鏡圖像的自動(dòng)分割,F(xiàn)CN_RESNET101模型的性能最高,在訓(xùn)練隊(duì)列中達(dá)到0.94±0.05,MIOU為0.89±0.08,分別為0.95±0.03和0.95±0.03和0.90±0.06。在T2W-MRI圖像分割中,VNET模型的表現(xiàn)優(yōu)于其他模型,在訓(xùn)練隊(duì)列中,DSC和MIOU值為0.91±0.10,0.86±0.10,在測(cè)試隊(duì)列中為0.93±0.02和0.88±0.03。(表2)
采用人工標(biāo)注時(shí),內(nèi)窺鏡模型和T2加權(quán)MRI模型在訓(xùn)練隊(duì)列中的AUROC值分別為0.894和0.853,在測(cè)試隊(duì)列中分別為0.628和0.820;而采用自動(dòng)分割時(shí),這兩個(gè)模型在訓(xùn)練隊(duì)列中的AUROC值分別為0.866和0.869,在測(cè)試隊(duì)列中則為0.674和0.835。測(cè)試隊(duì)列中,基于人工標(biāo)注與自動(dòng)分割的深度學(xué)習(xí)模型在AUROC值上均無顯著差異(p值分別為0.369和0.841)。在評(píng)估兩位耳鼻喉科醫(yī)師對(duì)內(nèi)窺鏡圖像選擇的一致性時(shí),發(fā)現(xiàn)兩者具有幾乎完美的一致性(K值為0.886)。內(nèi)窺鏡和T2加權(quán)MRI模型的性能數(shù)據(jù)匯總于表3,相應(yīng)的曲線展示在圖3中。(圖3、表3)
基于自動(dòng)分割,將來自內(nèi)窺鏡檢查和T2W-MRI模型的DL評(píng)分組合起來構(gòu)建雙模式列線圖(圖4)。該列線圖展示了最佳的預(yù)測(cè)性能,訓(xùn)練隊(duì)列和測(cè)試隊(duì)列的AUROC分別為0.938和0.865。放射科住院醫(yī)師和主治放射科醫(yī)生在培訓(xùn)隊(duì)列中的AUROC分別為0.631和0.704,在測(cè)試隊(duì)列中的AUROC分別為0.672和0.707。測(cè)試隊(duì)列中,DL列線圖與放射科住院醫(yī)師和主治放射科醫(yī)生之間的AUROC差異趨于顯著(分別為p = 0.071和0.066),而當(dāng)兩位醫(yī)生都使用DL列線圖時(shí),沒有觀察到顯著差異(p = 0.218和0.476)。
在DL列線圖的幫助下,兩位放射科醫(yī)生都提高了他們的診斷性能,培訓(xùn)隊(duì)列中的AUROC分別為0.745和0.813,測(cè)試隊(duì)列中的AUROC分別為0.734和0.834。值得注意的是,根據(jù)Delong測(cè)試,當(dāng)將獨(dú)立工作的放射科醫(yī)生與使用DL輔助的放射科醫(yī)生進(jìn)行比較時(shí),某些AUROC觀察到顯著差異。DL列線圖圖和兩名放射科醫(yī)生的表現(xiàn)詳情見表4。DL列線圖和兩名放射科醫(yī)生的ROC曲線如圖5a、e所示,基于Delong測(cè)試結(jié)果的熱圖如圖5 b、f所示。DL列線圖表現(xiàn)出良好的校準(zhǔn),在兩個(gè)隊(duì)列中產(chǎn)生不顯著的結(jié)果(p = 0.887和0.599)。(圖5c,g)。
決策曲線分析表明,在兩個(gè)隊(duì)列中,在合理的閾值概率范圍內(nèi),DL列線圖提供了比兩種單模式和兩名放射科醫(yī)生更高的總體凈效益(圖5d,h)。使用自動(dòng)化DL框架準(zhǔn)確診斷的代表性病例如圖6所示。
五、總結(jié)
研究開發(fā)的DL框架整合了內(nèi)窺鏡和T2加權(quán)MRI,能夠自動(dòng)分割腫瘤并預(yù)測(cè)SIP-SCC。雙模態(tài)DL列線圖在訓(xùn)練和測(cè)試隊(duì)列中均表現(xiàn)出較高的預(yù)測(cè)性能(AUROC分別為0.938和0.865),可輔助醫(yī)師提高診斷準(zhǔn)確性。這是首個(gè)整合內(nèi)窺鏡和MRI數(shù)據(jù)的全自動(dòng)SIP-SCC預(yù)測(cè)研究,具有臨床應(yīng)用的潛力。未來需擴(kuò)大樣本量并優(yōu)化模型以進(jìn)一步提升性能。
上一篇:剖宮產(chǎn)止血效果研究 去甲腎上腺素表現(xiàn)優(yōu)于苯腎上腺素
下一篇:07.28-08.03 臨床預(yù)測(cè)模型研究頂刊快報(bào)