English | 中文版 | 手機(jī)版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當(dāng)前位置 > 首頁 > 技術(shù)文章 > AI驅(qū)動精準(zhǔn)腫瘤學(xué)突破:MUSK模型助力醫(yī)學(xué)研究

AI驅(qū)動精準(zhǔn)腫瘤學(xué)突破:MUSK模型助力醫(yī)學(xué)研究

瀏覽次數(shù):315 發(fā)布日期:2025-5-28  來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)

在醫(yī)學(xué)領(lǐng)域,精準(zhǔn)診斷和治療決策一直是醫(yī)生和患者關(guān)注的焦點(diǎn)。然而,面對海量的多模態(tài)數(shù)據(jù),傳統(tǒng)方法往往力不從心。人工智能(AI)技術(shù)的崛起,正為這一難題帶來革命性解決方案。本期文章聚焦于新的研究成果——MUSK模型,通過整合病理圖像和臨床文本數(shù)據(jù),不僅實現(xiàn)了跨模態(tài)檢索、視覺問答等復(fù)雜任務(wù),還在分子標(biāo)志物預(yù)測、癌癥預(yù)后和免疫治療反應(yīng)預(yù)測中展現(xiàn)了卓越性能。MUSK的出現(xiàn),標(biāo)志著AI在精準(zhǔn)腫瘤學(xué)領(lǐng)域的應(yīng)用邁出了關(guān)鍵一步。通過本文,您將深入了解AI如何改變醫(yī)學(xué)的未來,以及它如何為患者帶來更精準(zhǔn)、更個性化的治療選擇。

一. 研究背景

臨床決策依賴多模態(tài)數(shù)據(jù),如臨床記錄和病理特征,但現(xiàn)有方法在整合這些數(shù)據(jù)方面存在局限。人工智能(AI)在整合多模態(tài)數(shù)據(jù)方面潛力巨大,但高質(zhì)量標(biāo)注數(shù)據(jù)集稀缺,阻礙了模型發(fā)展;A(chǔ)模型通過大規(guī)模預(yù)訓(xùn)練,可在無需額外訓(xùn)練的情況下應(yīng)用于多種任務(wù),為醫(yī)學(xué)AI開辟了新方向。然而,現(xiàn)有視覺-語言基礎(chǔ)模型在病理學(xué)領(lǐng)域面臨數(shù)據(jù)規(guī)模不足和任務(wù)復(fù)雜度有限的挑戰(zhàn)。

為此,本研究提出基于多模態(tài)統(tǒng)一掩碼建模變換器(MUSK)的視覺-語言基礎(chǔ)模型。MUSK利用大規(guī)模未標(biāo)注病理圖像和文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,并進(jìn)一步對齊圖像-文本對特征,旨在解決現(xiàn)有模型的局限性。通過廣泛任務(wù)評估,MUSK在跨模態(tài)檢索、視覺問答、圖像分類、分子標(biāo)志物預(yù)測及臨床結(jié)果預(yù)測中展現(xiàn)了卓越性能,為精準(zhǔn)腫瘤學(xué)和多模態(tài)AI應(yīng)用提供了新工具。

二. 文章詳情

文章題目:A vision–language foundation model for precision oncology
中文題目:用于精準(zhǔn)腫瘤學(xué)的視覺-語言基礎(chǔ)模型
發(fā)表時間:2025.02
期刊名稱:Nature
影響因子:50.5
DOI:10.1038/s41586-024-08378-w

三. 研究結(jié)果

1. MUSK模型預(yù)訓(xùn)練

本研究開發(fā)了基于多模態(tài)Transformer架構(gòu)的視覺-語言基礎(chǔ)模型,作為網(wǎng)絡(luò)骨干。模型預(yù)訓(xùn)練分為兩個連續(xù)階段。首先,MUSK在5000萬張病理圖像和10億個病理相關(guān)文本標(biāo)記上進(jìn)行預(yù)訓(xùn)練。這些圖像來源于11,577名患者的約33,000張全切片組織病理學(xué)掃描結(jié)果,涵蓋了33種腫瘤類型。借鑒BEiT3架構(gòu),MUSK模型由共享的自注意力模塊以及針對視覺和語言輸入的獨(dú)立專家模塊組成;預(yù)訓(xùn)練通過掩碼建模實現(xiàn)。其次,MUSK在來自QUILT-1M模型的一百萬張圖像-文本對上進(jìn)行了預(yù)訓(xùn)練,采用對比學(xué)習(xí)方法以實現(xiàn)多模態(tài)對齊。

圖片Fig1. 數(shù)據(jù)策劃,模型開發(fā)和評估

2. MUSK在跨模態(tài)任務(wù)中的卓越表現(xiàn)

MUSK在跨模態(tài)檢索和視覺問答(VQA)任務(wù)中展現(xiàn)了強(qiáng)大的能力。通過統(tǒng)一掩碼建模技術(shù),MUSK在無需額外訓(xùn)練的情況下實現(xiàn)了零樣本跨模態(tài)檢索,在BookSet和PathMMU數(shù)據(jù)集上顯著優(yōu)于其他基礎(chǔ)模型,例如在PathMMU數(shù)據(jù)集上比第二好的模型(CONCH)高出7.1%。同時,MUSK在視覺問答任務(wù)中也表現(xiàn)出色,在PathVQA數(shù)據(jù)集上的準(zhǔn)確率達(dá)到73.2%,超越了專門為VQA設(shè)計的K-Path VQA模型(準(zhǔn)確率:68.9%)。這些結(jié)果表明,MUSK能夠有效對齊視覺和語言特征,為跨模態(tài)任務(wù)提供了高效且通用的解決方案。

圖片Fig2. 跨模式檢索和VQA

3. 圖像檢索與分類

MUSK不僅在跨模態(tài)任務(wù)中表現(xiàn)優(yōu)異,還可以作為獨(dú)立的圖像編碼器用于圖像檢索和分類任務(wù)。在零樣本和少樣本圖像分類中,MUSK在多個基準(zhǔn)數(shù)據(jù)集上均超越了其他基礎(chǔ)模型。例如,在十樣本圖像分類中,MUSK在12個數(shù)據(jù)集中的10個上表現(xiàn)最佳。此外,MUSK在監(jiān)督圖像分類中的平均準(zhǔn)確率達(dá)到88.2%,顯著優(yōu)于其他模型。這些結(jié)果證明了MUSK在病理圖像分類中的高效性和穩(wěn)健性。

圖片Fig3. 補(bǔ)丁級圖像分類

4. 分子生物標(biāo)志物預(yù)測

MUSK在從病理圖像中預(yù)測分子生物標(biāo)志物方面展現(xiàn)了卓越性能。在乳腺癌受體狀態(tài)和腦腫瘤IDH突變狀態(tài)的預(yù)測任務(wù)中,MUSK的AUC值顯著高于其他病理學(xué)基礎(chǔ)模型。例如,在預(yù)測HER2狀態(tài)時,MUSK的AUC為0.826,優(yōu)于GigaPath(0.786)和CONCH(0.771)。這表明MUSK能夠為精準(zhǔn)腫瘤學(xué)提供有價值的分子標(biāo)志物預(yù)測工具。

5. 黑色素瘤復(fù)發(fā)預(yù)測

MUSK在預(yù)測黑色素瘤復(fù)發(fā)方面表現(xiàn)出色。基于VisioMel數(shù)據(jù)集,MUSK在預(yù)測5年復(fù)發(fā)的AUC達(dá)到0.833,顯著優(yōu)于其他視覺-語言基礎(chǔ)模型。通過結(jié)合臨床報告和病理圖像的多模態(tài)信息,MUSK進(jìn)一步提高了預(yù)測準(zhǔn)確性。此外,MUSK在90%敏感性閾值下的特異性顯著高于其他模型,可能幫助更多患者避免不必要的輔助治療。

6. 泛癌癥預(yù)后預(yù)測

MUSK在泛癌癥預(yù)后預(yù)測中展現(xiàn)了廣泛的應(yīng)用潛力;赥CGA數(shù)據(jù)集的16種癌癥類型,MUSK的平均c-index為0.747,顯著優(yōu)于臨床風(fēng)險因素和其他基礎(chǔ)模型。例如,在腎細(xì)胞癌中,MUSK的c-index達(dá)到0.887。通過Kaplan-Meier分析,MUSK能夠顯著分層低風(fēng)險和高風(fēng)險患者,為個性化治療提供了重要依據(jù)。

圖片Fig4. 16種癌癥類型的預(yù)后預(yù)測

7. 免疫治療反應(yīng)預(yù)測

MUSK在預(yù)測免疫治療反應(yīng)和結(jié)果方面表現(xiàn)優(yōu)異。在晚期非小細(xì)胞肺癌和胃食管癌患者中,MUSK的AUC和c-index均顯著優(yōu)于現(xiàn)有生物標(biāo)志物和其他基礎(chǔ)模型。例如,在預(yù)測NSCLC患者PFS時,MUSK的c-index為0.705,優(yōu)于腫瘤PD-L1表達(dá)的0.574。通過多模態(tài)數(shù)據(jù)整合,MUSK能夠識別可能從免疫治療中受益的患者,為臨床決策提供了有力支持。

圖片Fig5. 肺癌免疫治療反應(yīng)預(yù)測

四. 主要結(jié)論

本研究開發(fā)了一種名為“多模態(tài)統(tǒng)一掩碼建模變換器”(MUSK)的視覺-語言基礎(chǔ)模型,旨在利用大規(guī)模、未標(biāo)注、未配對的圖像和文本數(shù)據(jù)。MUSK通過統(tǒng)一掩碼建模技術(shù),預(yù)訓(xùn)練了來自11,577名患者的5000萬張病理圖像和10億個病理相關(guān)文本標(biāo)記。此外,它還進(jìn)一步預(yù)訓(xùn)練了100萬張病理圖像-文本對,以高效對齊視覺和語言特征。在無需或僅需少量額外訓(xùn)練的情況下,MUSK在23個圖像塊級別和切片級別的基準(zhǔn)測試中展現(xiàn)了卓越性能,涵蓋圖像到文本和文本到圖像的檢索、視覺問答、圖像分類以及分子生物標(biāo)志物預(yù)測等任務(wù)。

此外,MUSK在結(jié)果預(yù)測方面也表現(xiàn)出色,包括黑色素瘤復(fù)發(fā)預(yù)測、泛癌預(yù)后預(yù)測以及肺癌和胃食管癌的免疫治療反應(yīng)預(yù)測。MUSK成功整合了病理圖像和臨床報告中的互補(bǔ)信息,有望提高癌癥診斷的準(zhǔn)確性和治療的精準(zhǔn)性。

參考文獻(xiàn)
Xiang, Jinxi et al. “A vision-language foundation model for precision oncology.” Nature vol. 638,8051 (2025): 769-778.
發(fā)布者:上海生物芯片有限公司
聯(lián)系電話:400-100-2131
E-mail:marketing@shbiochip.com

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點(diǎn),不代表本站觀點(diǎn)。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com