L’INTELLIGENZA ARTIFICIALE È IN GRADO PREVEDERE LA STRUTTURA DELLE PROTEINE

blue technology circuit diagram with glowing line lights

A un anno dalla sua pubblicazione iniziale, il database di AlphaFold, il sistema di intelligenza artificiale sviluppato da DeepMind di Google e dall’European molecular biology laboratory (Embl), in grado di prevedere la struttura delle proteine, è stato espanso più di 200 volte. Sono state rilasciate le strutture 3D di oltre 200 milioni di proteine, rendendole apertamente disponibili alla comunità scientifica. Nel database sono presenti quasi tutte le proteine note alla scienza finora.

L’intelligenza artificiale AlphaFold, grazie a una collaborazione tra DeepMind, che ne ha sviluppato l’algoritmo, e l’Embl si basa su tecniche di machine learning, di bioinformatica e di biologia strutturale.

Il team ha costruito un database che funziona, a detta di chi l’ha progettato, come una “ricerca su Google”: si inserisce il nome, il gene, la sequenza amminoacidica o l’organismo della proteina di interesse e lo strumento offre un accesso istantaneo a previsioni di strutture tridimensionali di quella sequenza con precisione atomica, riducendo il tempo necessario agli scienziati per conoscere le probabili conformazioni della proteina che stanno studiando e di fatto accelerando il loro lavoro sperimentale.

DeepMind ed Embl hanno lanciato il database di AlphaFold nel luglio 2021, che conteneva al suo interno oltre 350.000 previsioni sulla struttura delle proteine. Successivi aggiornamenti hanno visto l’aggiunta di 27 nuovi proteomi, per arrivare a circa un milione di strutture proteiche in database, a cui hanno avuto accesso più di 500.000 ricercatori provenienti da oltre 190 paesi nel mondo.

Dopo un anno di lavoro il database è stato aggiornato e oggi conta 200 milioni di sequenze, che coprono quasi ogni organismo sulla Terra a cui è stato sequenziato il genoma (piante, batteri, animali e altri organismi), aprendo nuove strade alla ricerca nell’ambito delle scienze della vita.

DeepMind ed Embl sperano che il nuovo database ampliato accelererà il lavoro di ricercatori e scienziati nell’affrontare le sfide globali a cui sono chiamati, dalla lotta alle malattie fino alla salvaguardia dell’ambiente.