Bioinformatics

AlphaFold, almanac de proteïnes

Una nova eina que multiplica la base de dades de proteïnes revoluciona la ciència

Proteïnes
Foto: MIT Technology Review (DeepMind)

La bioinformàtica i la Intel·ligència Artificial han permès crear una eina que permet fer prediccions de l’estructura de totes les proteïnes. Entendre malalties, afinar-ne la diagnosi i el tractament, dissenyar nous fàrmacs i fins acabar amb el canvi climàtic. S’obre un nou món per a la recerca.

Aquest juliol, la revista Nature ha publicat un article que pot canviar la manera de fer ciència. DeepMind, l’empresa d’Intel·ligència Artificial creada el 2010 i comprada per Google el 2014, en col·laboració amb l’Institut Europeu de Bioinformàtica (EMBL-EBI) ha desenvolupat una eina que fa prediccions de models en 3D de l’estructura de les proteïnes en base a la seqüència genètica.

AlphaFold, que és el nom d’aquesta eina, ha permès publicar una base de dades amb 350.000 estructures de proteïnes (unes 20.000 del cos humà i altres de 20 organismes com el llevat, la mosca de la fruita, ratolins, etc). Determinar l’estructura d’una proteïna a partir de la seva seqüència genètica és una tasca complexa. Fins ara, es feia mitjançant diverses tècniques (generalment per assaig-error) que costaven molt temps i diners. La Intel·ligència Artificial ha obert la porta a dissenyar un mètode computacional que és l’alternativa per fer aquestes prediccions d’estructures proteòmiques.

Per què són importants les proteïnes?

Les proteïnes són molècules essencials complexes que expliquen la vida. Cada funció del nostre cos està determinada per com es mouen i canvien una o vàries proteïnes (per exemple la contracció dels músculs o convertir el menjar en energia). El que una proteïna pot fer depèn de la seva estructura i la “recepta” de com són i què fan aquestes proteïnes és als gens i està codificada a l’ADN.

L’estructura o forma d’una proteïna és important perquè en determina la seva funció. Així que conèixer la forma significa entendre el seu rol dins la cèl·lula i, per tant, permet desenvolupar medicaments específics. Un “error” a l’ADN significa que hi ha una malformació en alguna proteïna, el que pot causar malalties i també la mort d’un organisme. És a dir, moltes malalties estan lligades a proteïnes, però saber on està l’error genètic no implica saber l’estructura o forma de la proteïna.

Les proteïnes estan formades per cadenes d’aminoàcids i l’ADN té informació de la seqüència dels aminoàcids, però no de com es pleguen aquestes cadenes i quina forma tenen. A més, com més gran és una proteïna, més difícil és fer una predicció o model de la seva estructura. A banda que es pleguen de manera espontània en milisegons, també cal tenir en compte que les molècules interactuen entre elles.

Per què és important tenir models de les proteïnes?

AlphaFold no és una eina infalible, la seva precisió és d’un 58%. Tanmateix canviarà la manera de fer recerca. Si un científic vol estudiar una proteïna implicada en el càncer, per exemple, el més normal és que aquesta no estigui a cap base de dades i esbrinar la seva estructura pot ser qüestió de mesos i fins i tot anys. Actualment a les bases de dades hi ha 180.000 estructures de proteïnes i aquest nou model computacional n’ha presentat el doble. I en qüestió de mesos seran milions.

Algunes de les aplicacions que veurem gràcies als models d’AlphaFold seran la diagnosi i el tractament de malalties causades per proteïnes “mal plegades”, disseny de medicaments amb la reducció de cost que suposa l’avenç en experimentació i, fora de l’àmbit de la salut, aquest sistema de machine learning també pot ajudar els científics a dissenyar proteïnes per acabar amb productes contaminants i fer-los biodegradables, el que ajudaria a acabar amb el canvi climàtic.

El canvi de paradigma que introdueix Alphafold és més que substancial: estalvia molt temps i les imprecisions actuals d’aquesta eina es poden anar corregint. A mida que els científics adquireixen més coneixements sobre l’estructura de les proteïnes i entenen el seu funcionament mitjançant simulacions i models, sens dubte s’acceleraran els descobriments a gairebé totes les àrees de recerca de la biologia i la creació de medicaments serà més eficient i més barata.

We also recommend you