Prima simulazione 4D dell’intero ciclo vitale di una cellula: cosa ha rivelato il supercomputer Delta
Una cellula simulata nelle prime fasi di divisione: la metà sinistra mostra il citoplasma (cubi blu), le molecole del macchinario di degradazione dell'mRNA (rosa) e i trasportatori di zuccheri (marrone); la metà destra aggiunge la membrana cellulare (verde) e i ribosomi (giallo/rosso). Da Figure 1 di Thornburg Z. et al., "Bringing the genetically minimal cell to life on a computer in 4D", Cell, 2026. DOI: 10.1016/j.cell.2026.02.009. Grafica: Zane Thornburg.
Un team dell’Università dell’Illinois Urbana-Champaign ha simulato per la prima volta l’intero ciclo vitale di una cellula batterica in quattro dimensioni, spazio e tempo, con risoluzione alla nanoscala.
Ogni molecola del batterio sintetico JCVI-syn3A, dai ribosomi al cromosoma, è stata modellata dinamicamente lungo i 105 minuti che separano la nascita della cellula dalla sua divisione in due cellule figlie. Lo studio è pubblicato sulla rivista Cell.
Il problema di simulare una cellula vivente
Simulare una cellula vivente è uno dei problemi computazionali più complessi che la biologia abbia mai affrontato. Una singola cellula batterica contiene migliaia di specie molecolari diverse, ciascuna presente in copie che vanno da poche unità a milioni di esemplari, tutte in movimento, tutte in interazione, tutte che cambiano quantità e posizione nel tempo. Replicare questo sistema in un modello matematico significa costruire un’equazione per ogni molecola, per ogni reazione chimica, per ogni spostamento nello spazio tridimensionale, e risolverle tutte simultaneamente per ogni istante temporale dell’intero ciclo cellulare.
I tentativi precedenti di modellazione whole-cell avevano due limiti strutturali. I modelli ad altissima risoluzione atomica, che descrivono le interazioni tra singoli atomi con precisione straordinaria, possono coprire solo frazioni di secondo di attività cellulare: sono ottimi per studiare la struttura delle proteine, ma inutilizzabili per simulare un processo che dura 105 minuti. I modelli cinematici su scala più ampia, che descrivono le reti di reazioni metaboliche e genetiche, mancavano invece della dimensione spaziale: trattavano la cellula come un contenitore uniforme, senza tenere conto del fatto che le molecole occupano posizioni precise nello spazio e devono fisicamente spostarsi per incontrarsi e reagire.
La ricerca pubblicata su Cell il 9 marzo 2026 colma entrambi questi gap simultaneamente, producendo il primo modello che è allo stesso tempo spazialmente risolto (le molecole hanno posizioni tridimensionali precise), temporalmente completo (copre l’intero ciclo cellulare), e molecolarmente esaustivo (include ogni gene, ogni proteina, ogni filamento di RNA, ogni ribosome del batterio).
La scelta di JCVI-syn3A: perché la cellula minima è la più adatta
La decisione di quale organismo simulare è stata strategicamente centrale per la fattibilità del progetto. Il team guidato da Zan Luthey-Schulten, professoressa di chimica, fisica e membro del Beckman Institute dell’Università dell’Illinois, ha scelto JCVI-syn3A (abbreviato Syn3A), un batterio sintetico sviluppato dal J. Craig Venter Institute in California.
Syn3A è il prodotto di oltre vent’anni di ricerca sulla biologia sintetica: è il microrganismo vivente con il genoma più piccolo mai creato in laboratorio, con soli 493 geni disposti su un unico filamento circolare di DNA. A titolo di confronto, il batterio Escherichia coli ha circa 4.300 geni, le cellule umane ne hanno circa 20.000. Syn3A è stato ottenuto per eliminazione progressiva: partendo dal genoma del batterio Mycoplasma mycoides, i ricercatori del JCVI hanno rimosso sistematicamente tutti i geni non strettamente necessari alla sopravvivenza e alla replicazione, fino a ottenere un organismo che contiene solo l’essenziale biologico.
Questa riduzione non è una semplificazione biologicamente vuota. Ogni gene rimasto in Syn3A è indispensabile: rimuoverne uno qualsiasi causa la morte della cellula. Questa proprietà trasforma Syn3A in un sistema ideale per la modellazione computazionale, perché non esistono geni ridondanti, vie metaboliche alternative non essenziali o processi la cui funzione è ancora sconosciuta. Ogni componente del modello aveva un ruolo definito da incorporare nella simulazione.
Un ulteriore vantaggio di Syn3A come soggetto di studio è la quantità di dati sperimentali disponibili. Il batterio è stato studiato intensivamente da decine di laboratori nel mondo sin dalla sua creazione, e la letteratura su di esso fornisce misurazioni precise di tassi di crescita, composizione della membrana, distribuzione dei ribosomi, cinetica di replicazione del DNA e morfologia cellulare durante la divisione. Questi dati sperimentali hanno fornito i vincoli e i parametri del modello computazionale, e poi i riferimenti per validarne i risultati.
L’architettura computazionale: metodi ibridi e doppio nodo GPU
La simulazione di Syn3A ha richiesto l’integrazione di metodi computazionali ibridi che operano a livelli di risoluzione diversi, ciascuno adatto ai processi biologici con le caratteristiche spaziali e temporali appropriate.
Per i processi che coinvolgono singole molecole in movimento, come la diffusione delle proteine nel citoplasma e l’assemblaggio dei ribosomi, il team ha usato la dinamica di Brownian (Brownian dynamics, BD), un approccio che descrive il moto casuale delle molecole in soluzione acquosa. Per le reti di reazioni biochimiche, come il metabolismo e l’espressione genica, sono stati utilizzati metodi cinematici stocastici che tengono conto delle fluttuazioni statistiche inerenti ai sistemi con piccoli numeri di molecole. Per la dinamica della membrana e la divisione cellulare, sono stati sviluppati modelli fisici dedicati basati sulle proprietà meccaniche dei lipidi e delle proteine di membrana.
La complessità computazionale di questa combinazione ha richiesto una soluzione hardware specifica. Il team ha eseguito le simulazioni sul supercomputer Delta del National Center for Supercomputing Applications (NCSA) dell’Università dell’Illinois, finanziato dalla National Science Foundation e dallo Stato dell’Illinois. La strategia adottata prevedeva l’uso di due nodi GPU dedicati in parallelo: un nodo gestiva esclusivamente la simulazione della replicazione del DNA, il processo più computazionalmente intensivo per la sua complessità topologica e la necessità di tracciare la posizione del cromosoma in 3D a ogni istante. Un secondo nodo gestiva tutti gli altri processi cellulari simultaneamente.
Ogni singola simulazione del ciclo cellulare completo ha richiesto da quattro a sei giorni di calcolo continuo su questi due nodi. Per produrre le analisi principali dello studio, il team ha eseguito 50 simulazioni replicate dell’intero ciclo, per un totale di circa 15.000 ore GPU. Come sintetizzato da Zane Thornburg, il postdottorando che ha eseguito le simulazioni: “Non posso sottovalutare quanto sia difficile simulare oggetti in movimento, farlo in 3D per un’intera cellula è stato un trionfo.”
Cosa è stato simulato: dal DNA ai lipidi di membrana
La simulazione copre in modo integrato tutti i processi fondamentali del ciclo cellulare di Syn3A, trattandoli non come compartimenti separati ma come fenomeni mutuamente dipendenti che si influenzano continuamente.
La replicazione del DNA è modellata a partire dai livelli di desossiribonucleoside trifosfati (dNTP) disponibili nel pool metabolico: la velocità con cui la polimerasi avanza lungo il cromosoma dipende dalla disponibilità di questi substrati, che a loro volta dipendono dall’attività degli enzimi del metabolismo nucleotidico. La segregazione dei due cromosomi replicati verso i poli opposti della cellula è governata dai complessi SMC (Structural Maintenance of Chromosomes), proteine analoghe alla condensina eucariotica che organizzano e compattano il DNA, simulate attraverso dinamica di Brownian con vincoli topologici che riproducono il comportamento reale delle proteine SMC.
La sintesi proteica è modellata a livello di singolo ribosoma: ogni ribosoma di Syn3A viene assemblato, si sposta nel citoplasma per diffusione, localizza i suoi substrati, traduce il messaggero RNA in proteina e viene infine rilasciato. Il citoplasma batterico è straordinariamente affollato, una condizione nota in biochimica come macromolecular crowding, e il modello riproduce questa densità includendo tutte le molecole simultaneamente nello stesso spazio tridimensionale. Durante la creazione delle visualizzazioni ad alta risoluzione, i ricercatori hanno dovuto rendere invisible alcuni componenti per poter vedere gli altri: ad esempio, eliminando dalla visualizzazione tutte le proteine cellulari è stato possibile osservare come il cromosoma si snodi attraverso il citoplasma affollato.
La crescita della membrana è simulata come un processo guidato dall’inserzione progressiva di lipidi e proteine di membrana, con il tasso di espansione vincolato dai dati di imaging a fluorescenza che mostrano come cambia la morfologia cellulare durante il ciclo. La divisione cellulare fisica, infine, è modellata attraverso la dinamica della proteina FtsZ, il principale regolatore della divisione batterica, che forma un anello contrattile all’equatore della cellula e ne guida la separazione in due cellule figlie.
I risultati: validazione quantitativa e scoperte inattese
La prima misura di qualità di una simulazione biologica è la sua capacità di riprodurre i dati sperimentali. Su questo fronte, i risultati dello studio sono notevoli. Nelle 50 simulazioni replicate del ciclo cellulare completo, il tempo di raddoppio medio previsto dal modello si è discostato dal valore misurato sperimentalmente (105 minuti) di circa soli due minuti. Per un sistema che modella migliaia di specie molecolari in interazione nello spazio tridimensionale, questa precisione è, come scrive ScienceBlog in una delle sintesi più accurate dello studio, “rimarchevolmente vicina”.
Il modello ha riprodotto correttamente anche il rapporto tra DNA all’origine di replicazione e al termine, una misura della progressione del processo replicativo, il numero di ribosomi presenti in cellula durante le diverse fasi del ciclo, e la distribuzione delle molecole nelle diverse zone del citoplasma.
Un contributo sperimentale cruciale per la validazione è venuto dalla collaborazione con il gruppo del biofisico Taekjip Ha del Boston Children’s Hospital e della Harvard Medical School, e del chimico Angad Mehta dell’Università dell’Illinois. Questo team ha generato nuovi dati di imaging ad alta risoluzione e di sequenziamento del DNA specificamente per testare le previsioni del modello computazionale, confermando due risultati che non erano noti con certezza prima dello studio: che la divisione cellulare di Syn3A è simmetrica (le due cellule figlie ricevono quantità equivalenti di componenti cellulari) e che la replicazione del DNA è completata prima della divisione con un timing preciso. Entrambi questi dati, ottenuti sperimentalmente, erano già stati previsti dalla simulazione.
La capacità del modello di simulare simultaneamente tutti i processi cellulari ha permesso di osservare interconnessioni che gli esperimenti tradizionali, focalizzati su un processo alla volta, non possono rivelare. Come dichiarato da Luthey-Schulten: “Se vuoi sapere cosa sta succedendo nel metabolismo dei nucleotidi, puoi guardare simultaneamente cosa sta succedendo nella replicazione del DNA e nella biogenesi dei ribosomi. Le simulazioni possono darti i risultati di centinaia di esperimenti simultaneamente.”
La struttura 4D: cosa significa avere tre dimensioni più il tempo
La qualificazione “4D” del modello non è un elemento di comunicazione scientifica, ma una distinzione tecnica precisa rispetto ai modelli precedenti. I modelli whole-cell sviluppati in precedenza, incluso il pionieristico modello del batterio Mycoplasma genitalium pubblicato nel 2012 dalla Stanford University (Karr et al., Cell), trattavano la cellula come un sistema ben mescolato (well-mixed): le concentrazioni delle molecole erano uniformi in tutto il volume cellulare e variavano solo nel tempo. Questo approccio è equivalente a descrivere la cellula in zero dimensioni spaziali, solo nel tempo.
Il modello di Luthey-Schulten aggiunge le tre dimensioni spaziali: ogni molecola ha una posizione precisa nel volume tridimensionale della cellula, si muove per diffusione seguendo le leggi della dinamica di Brownian, e può reagire con altre molecole solo quando si trova fisicamente nella stessa regione dello spazio. Questo è biologicamente fondamentale perché la cellula batterica, nonostante le sue dimensioni di circa un micrometro di diametro, non è affatto omogenea al suo interno: il cromosoma occupa una regione specifica, i ribosomi si distribuiscono in modo non uniforme, le proteine di membrana hanno localizzazioni precise lungo la superficie cellulare.
La dimensione temporale, infine, non è solo la progressione del ciclo cellulare, ma la cattura dinamica di come ogni molecola cambia posizione, concentrazione e stato biochimico in ogni istante dei 105 minuti simulati. Il risultato è una rappresentazione che i ricercatori definiscono come un “film molecolare” dell’intera vita di una cellula, dove è possibile mettere in pausa la simulazione in qualsiasi momento e vedere la posizione di ogni molecola nello spazio tridimensionale.
Implicazioni per la biologia cellulare e la medicina
Il valore di questa simulazione per la ricerca biomedica si articola su più piani, sia immediati che prospettici.
Sul piano della biologia di base, il modello whole-cell 4D offre la possibilità di fare “esperimenti virtuali” che sarebbero impossibili o eticamente problematici in laboratorio: modificare il numero di copie di un gene, alterare il tasso di produzione di una proteina specifica, cambiare le condizioni di pH o temperatura all’interno di un compartimento cellulare, e osservare le conseguenze su tutti i processi cellulari simultaneamente. Questo tipo di analisi perturbativa può rivelare dipendenze funzionali e meccanismi di regolazione che gli esperimenti tradizionali, che studiano un processo alla volta in condizioni artificialmente semplificate, non riescono a cogliere.
Sul piano della farmacologia, la disponibilità di un modello accurato del ciclo cellulare batterico apre prospettive per la progettazione razionale di nuovi antibiotici. Molti antibiotici agiscono su processi che sono stati simulati in questo studio: la replicazione del DNA (fluorochinoloni, rifampicina), la sintesi proteica ribosomale (aminoglicosidi, tetracicline, macrolidi), la sintesi della parete cellulare e della membrana (beta-lattamici, polimixine). Un modello che descrive questi processi nella loro dimensione spaziale e temporale reale potrebbe permettere di prevedere le conseguenze dell’inibizione di un bersaglio molecolare sull’intera fisiologia cellulare, identificando potenziali effetti sinergici tra farmaci diversi e meccanismi di resistenza emergenti.
Sul piano della biologia sintetica, la collaborazione con il J. Craig Venter Institute che ha prodotto Syn3A suggerisce applicazioni dirette nella progettazione di organismi sintetici con funzioni specifiche. Avere un modello computazionale che predice il comportamento di un organismo sintetico prima di costruirlo fisicamente ridurrebbe enormemente i tempi e i costi del ciclo di progettazione e test, che attualmente richiede molte iterazioni sperimentali.
Verso la simulazione di cellule più complesse
Syn3A con i suoi 493 geni rappresenta, come scrivono i ricercatori, il punto di partenza minimo: ogni altro organismo vivente è costruito sopra questo livello di complessità, con più geni, più reti di regolazione, più meccanismi di adattamento. La simulazione di Syn3A è quindi sia un risultato in sé che una prova di concetto dei metodi ibridi sviluppati dal team.
Il passaggio a organismi più complessi, incluse le cellule eucariotiche come quelle umane, richiederà un aumento ordini di grandezza nella capacità computazionale: le cellule umane hanno genomi circa 6.000 volte più grandi di Syn3A, decine di compartimenti subcellulari distinti (nucleo, mitocondri, reticolo endoplasmatico, apparato di Golgi), e processi di regolazione genica che non hanno equivalente nei batteri. Tuttavia, i metodi ibridi sviluppati per Syn3A, la separazione della simulazione in moduli con diversi livelli di risoluzione, la parallelizzazione su GPU, la validazione sistematica contro dati sperimentali, costituiscono il framework metodologico su cui le future simulazioni di cellule più complesse potranno essere costruite.
I dati e il codice di questa ricerca sono stati resi apertamente accessibili, una scelta che permette ad altri gruppi di ricerca di utilizzare il modello come punto di partenza, modificarne i parametri per adattarlo ad altri organismi, e costruire estensioni che incorporino processi non ancora inclusi nella versione attuale.
Fonti
- Luthey-Schulten Z., Thornburg Z., Maytin A., Mehta A., Ha T., Gilbert B., Glass J. (2026). Bringing the genetically minimal cell to life on a computer in 4D. Cell. DOI: 10.1016/j.cell.2026.02.009
- University of Illinois Urbana-Champaign News Bureau, 9 marzo 2026
- NCSA, 10 marzo 2026
- QCB Center, 10 marzo 2026
