在剛剛結(jié)束的2025年 I/O 開發(fā)者大會上,谷歌宣布開源全新醫(yī)療 AI 模型 ——MedGemma。這款基于 Gemma3架構(gòu)的模型專為醫(yī)療領(lǐng)域設(shè)計,具備強大的多模態(tài)圖像和文本理解能力,旨在提升醫(yī)療診斷與治療效率。
MedGemma 提供兩種配置選項,分別為4B 和27B 參數(shù)模型。4B 參數(shù)模型主要用于醫(yī)療圖像的分類和解讀,能夠生成詳細的診斷報告或回答與圖像相關(guān)的問題;而27B 參數(shù)模型則專注于處理臨床文本,特別適合于患者分診和決策輔助。這意味著,醫(yī)生可以更快地獲得有關(guān)患者病情的有價值信息,從而更有效地制定治療方案。
其中,4B 模型的圖像編碼器采用了 SigLIP 技術(shù),預(yù)訓(xùn)練數(shù)據(jù)涵蓋了胸部 X 光、皮膚病學(xué)、眼科及組織病理學(xué)等多個領(lǐng)域的圖像,使得其在處理復(fù)雜醫(yī)療圖像時表現(xiàn)出色。相比之下,27B 模型則以270億參數(shù)為基礎(chǔ),專注于深度理解醫(yī)療文本,為臨床推理提供支持,幫助醫(yī)務(wù)人員更快速地進行決策。
更為靈活的是,開發(fā)者可以選擇在本地運行這些模型進行實驗,或者通過谷歌云的 Vertex AI 平臺將其部署為 HTTPS 端點,方便進行大規(guī)模應(yīng)用。谷歌還提供了 Colab 筆記本等豐富的資源,幫助開發(fā)者進行模型的微調(diào)和集成。
此外,谷歌鼓勵開發(fā)者針對特定的使用場景對模型進行驗證和微調(diào),并提供了相關(guān)指導(dǎo)和工具,支持開發(fā)者在適配過程中使用提示工程、上下文學(xué)習(xí)及 LoRA 等方法進行高效的參數(shù)微調(diào)。這使得 MedGemma 不僅是一款先進的 AI 工具,更是開發(fā)者和醫(yī)務(wù)人員在日常工作中提升效率的重要助手。
MedGemma 的推出標志著醫(yī)療 AI 領(lǐng)域的又一重大進展,為未來的醫(yī)療實踐帶來了無限可能。
標簽:谷歌 MedGemma AI模型 醫(yī)療圖像 文本分析