Opinione Notizie Tecnologia
Gennaio 15, 2026

Dalle scansioni alla voce: come Google sta redefiintelligenza artificiale sanitaria

In Breve

Google ha aggiornato la sua intelligenza artificiale medica open source MedGemma con funzionalità per l'interpretazione di scansioni come TC e risonanze magnetiche, rilasciando anche uno strumento aperto di conversione da voce a testo MedASR.

L'aggiornamento MedGemma di Google segna una nuova era per la diagnosi medica basata sull'intelligenza artificiale

Azienda tecnologica Google ha annunciato un aggiornamento del suo modello di intelligenza artificiale MedGemma, migliorando il supporto per le applicazioni di imaging medico. 

Il nuovo modello MedGemma 1.5 4B incorpora il feedback della comunità degli sviluppatori per supportare al meglio molteplici modalità di imaging medico, tra cui scansioni ad alta dimensione come TC e RM, immagini istopatologiche, imaging longitudinale come serie temporali di radiografie del torace e attività di localizzazione anatomica. 

Migliora inoltre la comprensione dei documenti medici, consentendo l'estrazione di dati strutturati dai referti di laboratorio. Rispetto alla precedente versione di MedGemma 1 4B, l'aggiornamento 1.5 4B offre una maggiore accuratezza per testo, cartelle cliniche e imaging 2D, pur rimanendo sufficientemente compatto da poter essere eseguito offline. 

Per applicazioni testuali più complesse, gli sviluppatori possono continuare a utilizzare il modello MedGemma da 27 miliardi di parametri. Dettagli completi e benchmark sono disponibili nella scheda del modello MedGemma 1.5.

MedGemma è stato originariamente concepito come un sistema multimodale per riflettere il complesso ambiente di dati della medicina, con le prime versioni che supportavano l'interpretazione di immagini mediche bidimensionali come radiografie del torace, immagini dermatologiche, scansioni retiniche e campioni istopatologici. L'ultima versione, MedGemma 1.5, espande queste funzionalità per includere l'imaging medico ad alta dimensionalità, incorporando dati TC e RM tridimensionali e istopatologia a vetrino intero. Gli sviluppatori possono ora creare applicazioni che elaborano più sezioni o patch di immagini insieme a prompt specifici per attività, consentendo casi d'uso diagnostici e analitici più avanzati.

Secondo valutazioni interne, MedGemma 1.5 dimostra notevoli miglioramenti delle prestazioni in diversi ambiti, tra cui la classificazione dei reperti TC e RM, l'analisi istopatologica, la localizzazione anatomica nelle radiografie del torace, la revisione longitudinale delle immagini e l'estrazione strutturata dei dati dai referti di laboratorio. Il modello mostra inoltre notevoli miglioramenti nella comprensione dei testi medici e nella capacità di rispondere alle domande contenute nelle cartelle cliniche elettroniche, riflettendo i più ampi progressi sia in termini di visione che di linguaggio.

Questa funzionalità ampliata si basa sui precedenti strumenti di base per la TC di Google e rappresenta uno dei primi modelli multimodali aperti e disponibili al pubblico in grado di gestire dati medici ad alta dimensionalità insieme a testo tradizionale e immagini 2D. Sebbene queste funzionalità siano ancora in fase di evoluzione, l'azienda prevede che gli sviluppatori otterranno ulteriori miglioramenti attraverso una messa a punto specifica per dominio, supportata da tutorial e risorse appena rilasciati per applicazioni di TC e istopatologia su Hugging Face e Model Garden.

Google presenta MedASR per migliorare il riconoscimento vocale medico e i flussi di lavoro clinici basati sull'intelligenza artificiale

Inoltre, Google ha rilasciato MedASR, un modello aperto di riconoscimento vocale automatizzato, ottimizzato per la dettatura medica, che converte il parlato in testo e si abbina a MedGemma per attività di ragionamento avanzate. 

Sebbene il testo rimanga l'interfaccia dominante per i modelli linguistici di grandi dimensioni, la comunicazione orale continua a svolgere un ruolo centrale nella pratica clinica, dalla dettatura del medico alle consulenze in tempo reale con i pazienti, rendendo il riconoscimento vocale accurato una capacità essenziale.

MedASR è progettato specificamente per il linguaggio medico, consentendo una trascrizione più affidabile della terminologia specifica di un dominio e fungendo da metodo di input naturale per MedGemma. Nei test comparativi con il modello Whisper large-v3 per uso generale, MedASR ha dimostrato un'accuratezza significativamente maggiore, producendo un numero significativamente inferiore di errori di trascrizione sia nei dettati delle radiografie del torace sia in un ampio benchmark interno che copre diverse specialità mediche e profili di parlanti.

Tutti i modelli HAI-DEF, tra cui MedGemma 1.5, MedASR e il codificatore di immagini MedSigLIP, restano gratuiti per la ricerca e l'uso commerciale e sono accessibili su Hugging Face o integrati in applicazioni scalabili su Vertex AI.

MedGemma guadagna popolarità a livello globale mentre i sistemi sanitari e i ricercatori espandono l'adozione dell'intelligenza artificiale

Secondo Google, l'adozione di MedGemma si sta espandendo tra le startup di tecnologie sanitarie e i team di ricerca in tutto il mondo, con il modello sempre più utilizzato per accelerare lo sviluppo in un'ampia gamma di applicazioni mediche. 

In Malesia, Qmed Asia ha integrato MedGemma in askCPG, un sistema conversazionale progettato per fornire accesso a oltre 150 linee guida nazionali per la pratica clinica. Secondo il Ministero della Salute malese, l'interfaccia ha migliorato l'usabilità di queste linee guida nel processo decisionale clinico di routine, mentre i primi programmi pilota hanno riportato un feedback particolarmente positivo sulle funzionalità di imaging medico multimodale della piattaforma basate su MedGemma.

A Taiwan, la National Health Insurance Administration ha utilizzato MedGemma per analizzare le valutazioni preoperatorie per la chirurgia del cancro al polmone. Estraendo informazioni strutturate da decine di migliaia di referti istologici e altri dati clinici non strutturati, l'iniziativa supporta analisi statistiche su larga scala volte a orientare le decisioni politiche e a migliorare la pianificazione chirurgica e gli esiti per i pazienti.

Fin dalla sua uscita all'inizio di quest'anno, MedGemma è stato ampiamente citato anche in ambito accademico IA medica ricerca, dove ha dimostrato ottime prestazioni come modello fondamentale per attività quali la comprensione di testi medici, il supporto alle decisioni cliniche multidisciplinari e la refertazione mammografica.

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Alisa, una giornalista dedicata al MPost, è specializzato in criptovaluta, prove a conoscenza zero, investimenti e nel vasto regno di Web3. Con un occhio attento alle tendenze e alle tecnologie emergenti, offre una copertura completa per informare e coinvolgere i lettori nel panorama in continua evoluzione della finanza digitale.

Altri articoli
Alice Davidson
Alice Davidson

Alisa, una giornalista dedicata al MPost, è specializzato in criptovaluta, prove a conoscenza zero, investimenti e nel vasto regno di Web3. Con un occhio attento alle tendenze e alle tecnologie emergenti, offre una copertura completa per informare e coinvolgere i lettori nel panorama in continua evoluzione della finanza digitale.

Hot Stories
Iscriviti alla nostra newsletter.
Notizie

La calma prima della tempesta di Solana: cosa ci dicono ora grafici, balene e segnali on-chain

Solana ha dimostrato ottime performance, trainate dalla crescente adozione, dall'interesse istituzionale e da partnership chiave, affrontando al contempo potenziali ...

Per saperne di più

Criptovalute ad aprile 2025: tendenze chiave, cambiamenti e cosa succederà in futuro

Nell'aprile 2025, il settore delle criptovalute si è concentrato sul rafforzamento dell'infrastruttura principale, con Ethereum che si preparava per Pectra...

Per saperne di più
Scopri di più
Leggi di più
HSC Asset Management presenta l'edizione di Hong Kong, presentando approfondimenti che guidano la partecipazione istituzionale Web3 E tecnologie emergenti
Featured Hackerare le stagioni Affari Lifestyle Mercati Notizie Tecnologia
HSC Asset Management presenta l'edizione di Hong Kong, presentando approfondimenti che guidano la partecipazione istituzionale Web3 E tecnologie emergenti
13 Febbraio 2026
CertiK vince il premio "Migliore soluzione di sicurezza e conformità 2026" ai SiGMA AIBC Eurasia Awards
Notizie Tecnologia
CertiK vince il premio "Migliore soluzione di sicurezza e conformità 2026" ai SiGMA AIBC Eurasia Awards
13 Febbraio 2026
Binance, BlackRock e Ripple guidano la spinta istituzionale sulle criptovalute nella seconda settimana di febbraio
Affari Notizie Tecnologia
Binance, BlackRock e Ripple guidano la spinta istituzionale sulle criptovalute nella seconda settimana di febbraio
13 Febbraio 2026
Il fondatore di Gate, il dott. Han, parla del progresso del sistema finanziario di prossima generazione tramite l'intelligenza artificiale Web3
Affari Notizie Tecnologia
Il fondatore di Gate, il dott. Han, parla del progresso del sistema finanziario di prossima generazione tramite l'intelligenza artificiale Web3
13 Febbraio 2026
LABORATORI DI CRITTOMERIA PTE. srl.