L’utilizzo dei dati clinici esistenti è di fondamentale importanza per la ricerca e la sperimentazione ma il loro utilizzo attuale è difficilissimo per due motivi: la regolamentazione della privacy dei dati dei pazienti (per il Gdpr, il regolamento europeo sui dati personali, i dati dei pazienti sono altamente riservati e in genere non possono essere scambiati o aggregati, neppure per ragioni di ricerca e sviluppo o per collaborazioni tra enti pubblici) e la scarsità delle informazioni stesse quando si trattano patologie rare.

Se a questo aggiungiamo la dispersione delle informazioni in centri clinici e di ricerca non collegati tra loro, e dunque non comunicanti, ci rendiamo conto di quanto materiale preziosissimo andiamo a perdere.

Il progetto Synthema

Per ovviare ad entrambi i problemi, nel 2023 partirà il progetto Synthema, finanziato dalla Commissione Europea con 7 milioni di euro nell’ambito del programma Horizon Europe.

Il progetto vuole sviluppare tecniche innovative basate sull’intelligenza artificiale per rendere anonime le informazioni cliniche e biologiche dei pazienti e generare dati sintetici e vede la partecipazione anche dell’Italia con le Università di Bologna e Padova e del centro AI Center di Humanitas (primo ospedale in Italia ad avere un centro di ricerca sull’Intelligenza Artificiale integrato). Quest’ultimo in particolare è già impegnato nell’applicazione dell’Intelligenza Artificiale in vari ambiti: dalla prevenzione dei tumori del colon e del retto (dove sta lavorando a un database di dati omici in endoscopia) alla diagnostica per immagini e all’ematologia.

I dati sintetici sono generati da complessi modelli di machine learning

Credits Panuwat Sikham / iStock via Getty Images Plus

I dati sintetici

Attualmente esiste l'anonimizzazione dei dati ma è un procedimento faticoso, lento e non permette operazioni di ricampionamento utili a eliminare eventuali bias presenti nei dati reali (per esempio la sottorappresentazione di alcuni gruppi).

I dati sintetici a partire da database reali, invece, vengono generati per mezzo di modelli di machine learning capaci di mantenere inalterato il contenuto statistico e le relazioni tipiche di un database relazionale. Non c'è quindi solo una fedeltà statistica ma anche la struttura relazionale viene mantenuta.

Per i dati sintetici servono algoritmi capaci di interfacciarsi con le informazioni dei pazienti reali per creare una versione virtuale del gruppo di pazienti che ha generato quei dati, ma che contiene tutte le proprietà cliniche, genetiche, biologiche e statistiche della popolazione originale. Questo permette di non replicare il singolo individuo, ma di creare un “nuovo” essere umano “tipo”, contenente tutte le informazioni dei singoli inserite nel contesto del gruppo, tenendo anche conto delle relazioni tra i dati.

L'intelligenza artificiale

Nel 2019 venne resa nota l’esistenza di un algoritmo in grado di ricreare un volto umano non appartenente a nessuno ma generato artificialmente a partire da tutti i dati singoli “insegnati” all'intelligenza artificiale. I dati sintetici di cui si parla per Synthema utilizzano lo stesso concetto ma valutano le patologie anziché i lineamenti umani.
L’AI verrà infatti “addestrata” con dati reali di pazienti malati, le analisi e le cure che fanno lungo un certo arco di tempo e da qui sarà in grado di accorpare dati e previsioni e creare dati sintetici in grado di moltiplicare le informazioni a disposizione e di integrare anche quelle appartenenti ad asset diversi, senza creare contraddizioni né distorsioni nel contenuto delle informazioni stesse.

L'utilizzo di dati riguardanti le cure e le risposte del paziente in cura permetterà una maggiore visione di insieme rispetto a esperimenti fatti in laboratorio, in cui le variabili da studiare sono necessariamente poche ed isolate, che rischiano di non poter mai verificare l’applicabilità di determinate cure e andrebbero a perdere tutta l’esperienza già maturata in campo ospedaliero.

ll progetto Synthema si focalizzerà inizialmente sulle malattie ematiche

Юлия Чернышенко / iStock via Getty Images Plus

 

I benefici per la ricerca

Per il momento il progetto Synthema parte dall’ambito delle malattie ematiche che, come spiega il prof. Matteo Della Porta, responsabile leucemie e mielodisplasie di Humanitas, docente di Humanitas University e responsabile dell’attività clinica di tutto il progetto Synthema, "derivano da anomalie quantitative o qualitative delle cellule del sangue, degli organi linfoidi e dei fattori di coagulazione” e si concentrerà sulle malattie ematologiche rare, come l’anemia a cellule falciformi e la leucemia mieloide acuta, scelte per la loro diversità clinica e terapeutica.

Questa diversità permetterà di verificare la versatilità e l’applicabilità di Synthema in contesti differenti. Nel trattamento delle malattie rare la condivisione dei casi clinici mondiali diventa fondamentale al fine di avere un campione abbastanza ampio da essere rappresentativo della popolazione di riferimento. Solo in Italia il 20% dei malati di tumori è affetto da una forma di neoplasia rara, per questo la UE si è impegnata, negli ultimi anni, alla creazione di gruppi di ricerca collaborativa.

Saranno necessari 4 anni per concludere il progetto: 2 anni per applicazione a casi studio specifici e altri 2 per rendere il sistema di memorizzazione ed elaborazione dei dati plastico e adattabile a tutti i settori della medicina, non solo all’ematologia.

Scritto da:
Federica Pitzianti
Supply Chain Specialist
Costruisci il tuo futuro con la connessione Fastweb