Patologia mammaria
Lunedì, 17 Febbraio 2025

Intelligenza artificiale a supporto dello screening mammografico: svolta o illusione?

A cura di Fabio Puglisi

Il progresso tecnologico sta trasformando la diagnosi del carcinoma mammario. Ma cosa accadrebbe se un'intelligenza artificiale (AI) affiancasse o addirittura sostituisse i radiologi nella lettura delle mammografie? Il MASAI Trial, uno studio randomizzato e controllato, ha messo alla prova un sistema AI avanzato all'interno del programma nazionale di screening mammografico in Svezia. Ma i risultati giustificano l’integrazione dell’AI nella pratica clinica? È davvero possibile individuare più tumori senza aumentare i falsi positivi e senza compromettere la sicurezza dello screening? La risposta non è così scontata…

Hernström V, et al. Screening performance and characteristics of breast cancer detected in the Mammography Screening with Artificial Intelligence trial (MASAI): a randomised, controlled, parallel-group, non-inferiority, single-blinded, screening accuracy study. Lancet Digit Health 2025 (Epub ahead of print). 

L’impiego dell’intelligenza artificiale nella lettura delle mammografie potrebbe offrire un duplice vantaggio: incrementare il tasso di rilevazione tumorale e ridurre il carico di lavoro dei radiologi. Tuttavia, la reale efficacia di questa tecnologia nel contesto dello screening di popolazione richiede una verifica rigorosa.

Il MASAI Trial è uno studio clinico randomizzato, parallelo, controllato, di non-inferiorità, single-blinded, condotto all'interno del programma di screening mammografico nazionale svedese. Lo studio ha incluso 105.934 donne, reclutate in quattro centri (Malmö, Lund, Landskrona, Trelleborg) tra aprile 2021 e dicembre 2022, assegnate random (1:1) a due strategie di screening:

Gruppo di controllo: doppia lettura standard da parte di due radiologi senza AI.

Gruppo sperimentale: screening supportato da AI, in cui il sistema Transpara v1.7.0 (ScreenPoint Medical, Paesi Bassi) assegnava un punteggio di rischio (1-10) a ogni mammografia, selezionando i casi a basso rischio per una singola lettura e quelli ad alto rischio per una doppia lettura con supporto AI.

Misure di outcome:

  • Tasso di rilevazione tumorale (casi/1000 partecipanti)
  • Tasso di richiami e falsi positivi
  • Valore predittivo positivo (PPV) del richiamo
  • Tipologia e stadio dei tumori individuati
  • Carico di lavoro radiologico (numero di letture e riunioni di consenso)

L'analisi statistica è stata condotta su una popolazione intention-to-treat modificata, escludendo i partecipanti che avevano rifiutato il richiamo tecnico o ricevuto diagnosi di linfoma. L'hazard ratio e gli intervalli di confidenza al 95% sono stati calcolati per confrontare i due gruppi, con un p-value <0.05 considerato significativo.

Lo screening supportato dall’AI ha portato a un incremento significativo nella rilevazione del tumore mammario. Sono stati individuati 338 tumori nel gruppo AI contro 262 nel gruppo di controllo (tasso di rilevazione: 6.4 vs 5.0 per 1000 donne, HR 1.29; IC 95%: 1.09-1.51; p=0.0021).

  • L’aumento è stato osservato sia per i tumori invasivi (270 vs 217; HR 1.24; IC 95%: 1.04-1.48) sia per i carcinomi in situ (68 vs 45; HR 1.51; IC 95%: 1.03-2.19). In particolare, il gruppo AI ha individuato:
  • 58 tumori T1 in più (≤20 mm), con un incremento significativo dei carcinomi T1c (124 vs 79; HR 1.56; IC 95%: 1.18-2.07)
  • 46 tumori linfonodo-negativi in più (206 vs 160)
  • 21 tumori non-luminali A in più, tra cui un incremento nei tripli negativi (16 vs 6, HR 2.66; IC 95%: 1.04-6.79) e nei HER2-positivi (17 vs 13)
  • Il tasso di richiami è stato leggermente più alto nel gruppo AI (2.1% vs 1.9%, HR 1.08; IC 95%: 0.99-1.17; p=0.084), ma senza un aumento significativo dei falsi positivi (1.5% vs 1.4%, p=0.92). Il valore predittivo positivo del richiamo è risultato superiore nel gruppo AI (30.5% vs 25.5%, HR 1.19; IC 95%: 1.04-1.37; p=0.012), indicando una maggiore precisione nella selezione dei casi da sottoporre a follow-up.
  • Un dato cruciale è la riduzione del carico di lavoro dei radiologi: il numero totale di letture è stato inferiore del 44.2% nel gruppo AI (61.248 vs 109.692), senza aumentare il numero di riunioni di consenso (3.8% in entrambi i gruppi).

I dati del MASAI Trial forniscono una forte evidenza a favore dell’integrazione dell’intelligenza artificiale nello screening mammografico. L’impiego dell’AI ha portato a un incremento significativo nel tasso di rilevazione tumorale, in particolare di tumori piccoli, linfonodo-negativi e più aggressivi, senza aumentare il numero di falsi positivi o il carico di lavoro dei radiologi.

Questi risultati suggeriscono che l’AI non solo migliora la sensibilità della mammografia, ma lo fa con un impatto positivo sulla gestione delle risorse sanitarie. Tuttavia, alcuni aspetti meritano cautela. L’aumento nella rilevazione dei tumori in situ, sebbene limitato ai gradi più elevati, solleva interrogativi sull’eventuale overdiagnosi. Inoltre, resta da chiarire se l’incremento nella diagnosi precoce si tradurrà in una reale riduzione della mortalità, un aspetto che sarà valutato nell’endpoint primario del trial: il tasso di tumori d’intervallo, atteso nel 2025.

Un altro punto critico riguarda la generalizzabilità dei risultati. Il contesto svedese, caratterizzato da un’alta qualità nello screening mammografico e da un basso tasso di richiami, potrebbe non essere rappresentativo di tutti i sistemi sanitari. Inoltre, lo studio si è basato su un singolo software AI, lasciando aperta la questione della variabilità delle prestazioni tra algoritmi diversi.

In sintesi, il MASAI Trial dimostra che l’AI può migliorare la diagnosi precoce del tumore mammario senza compromettere la sicurezza dello screening. Tuttavia, prima di una sua adozione su larga scala, sarà essenziale valutare il suo impatto sugli outcome clinici a lungo termine e sulla sostenibilità economica del sistema sanitario.