Bioinformatics ESCI-UPF

Margaret Dayhoff, la mare de la bioinformàtica

Bioinformàtica Margaret Dayhoff
Margaret Dayhoff. / Foto: muntatge deSmithsonian.com; original de la NIH National Library of Medicine (Ruth Dayhoff)

Margaret Dayhoff va ser pionera en l’aplicació de tècniques computacionals en camps com la bioquímica o l’astronomia. A través de la vida de la científica nord-americana descobrim les seves grans aportacions al desenvolupament de la bioinformàtica.

La biologia computacional (sovint entesa com a sinònim de la bioinformàtica) és una disciplina que fa servir l’ús d’eines informàtiques, models matemàtics i la simulació per a l’estudi de la biologia. Com explica Ana M. Rojas, investigadora del CSIC, la bioinformàtica és un camp d’estudi molt ampli i s’investiguen temes tan diversos com “per què es produeixen les mutacions en el nostre ADN, com es relacionen les proteïnes entre si o de quina manera afecta un fàrmac a una proteïna”, entre d’altres.

A dia d’avui és un camp en plena expansió gràcies als avenços tecnològics de les últimes dècades (només cal pensar en el potencial d’infraestructures com el BSC per a l’estudi de múltiples disciplines científiques) però, encara que ara costi de creure, la bioinformàtica va néixer abans que Internet. La seva història és relativament recent, es remunta a meitat del segle XX, i una de les coses que la fa especial és que, a diferència d’altres branques científiques, la persona que va començar a obrir camí és una dona: Margaret Dayhoff.

Margaret Dayhoff (1925-1983) està considerada com la mare de la bioinformàtica i va ser pionera en l’aplicació de les matemàtiques i de les tècniques computacionals en el camp de la bioquímica. Dayhoff es va graduar en Matemàtiques a la Universitat de Nova York i es va doctorar en Química Quàntica a la Universitat de Columbia, un fet poc freqüent per a l’època, ja que després de la IIGM era una àrea bàsicament dominada per homes i només un 5% dels doctorands en Química eren dones.

«La bioinformàtica va néixer abans que Internet»

Durant el seu doctorat es va interessar per la computació i a Columbia va tenir l’oportunitat d’entrar en contacte amb alguns dels laboratoris computacionals més potents del moment. Va ser llavors quan Dayhoff va començar a automatitzar els càlculs amb l’objectiu de processar les dades més ràpidament i amb més exactitud a través del rudimentari sistema de targetes perforades.

El 1960 va entrar al National Biomedical Research Foundation de la mà de Robert Ledley, un metge que, com Dayhoff, veia el gran potencial que podia tenir l’aplicació de l’anàlisi informàtica en camps com la medicina, la biologia o la química. Va ocupar el càrrec de directora associada durant 21 anys i, entre d’altres temes, va interessar-se per l’origen de la vida i la relació entre les seqüències de proteïnes i el seu rol en la biologia evolutiva.

Dayhoff va desenvolupar eines informàtiques per a la seqüenciació de proteïnes i àcids nucleics. Juntament amb Ledley va investigar quina era la funció de les proteïnes des d’una perspectiva diferent a la que s’havia fet fins llavors: enlloc d’estudiar-les de manera aïllada, van començar a comparar les proteïnes de plantes i espècies animals per tal de veure’n les similituds i les variacions. Amb aquest propòsit va dissenyar un software per emmagatzemar i comparar seqüències de proteïnes i, d’aquesta manera, comprendre la seva història evolutiva.

Dayhoff també es va interessar per l’astronomia i va col·laborar amb Carl Sagan i Ellis Lippincott en el desenvolupament de models termodinàmics per entendre la composició química de la matèria. D’altra banda, Dayhoff va desenvolupar un programa informàtic capaç de calcular la concentració de gasos en les atmosferes planetàries.

Atlas of Protein Sequence and Structure

L’aportació més destacada de Dayhoff és la publicació de l’Atlas of Protein Sequence and Structure el 1965, la base de dades que constitueix la primera anàlisi comparativa de les seqüències de proteïnes i que està considerada com el text fundacional de la bioinformàtica. L’equip de Dayhoff, format majoritàriament per dones, va recopilar totes les proteïnes seqüenciades fins al moment, 65, per posar-les a disposició dels científics i facilitar la recerca.

La tasca de recol·lecció dirigida per Dayhoff, però, va ser poc valorada per la comunitat científica del moment. Igual que va passar amb les científiques de la NASA conegudes com a “calculadores humanes”, la seva feina va ser considerada com una labor menor i secundària, no comparable a la ciència experimental. Malgrat tot, el 1971 Dayhoff va engegar la Protein Information Resource, “el primer sistema de base de dades online a la qual es podia accedir a través de la línia telefònica”, com recull la plataforma What is Biotechnology?

D’altra banda, Dayhoff també és la responsable de la creació del codi d’una sola lletra per descriure els aminoàcids, fins llavors codificats amb tres lletres. El canvi de Dayhoff va permetre reduir el pes dels arxius de les dades necessàries per descriure la seqüència dels aminoàcids en les proteïnes.

A dia d’avui, els mètodes i les eines informàtiques desenvolupades per Dayhoff estan considerades com l’origen de les grans bases de dades actuals, el germen i el model que, entre d’altres, va permetre portar a realitzar el Projecte del Genoma Humà. Quan Dayhoff va morir el 1983, la bioinformàtica encara no era considerada una disciplina científica autònoma. La seva tasca va ser crucial perquè al cap dels anys la bioinformàtica assolís l’estatus que li pertoca i, com es pot veure pel paper que juga en la recerca de la cura de la COVID-19, actualment està considerada una disciplina amb un llarg camí per davant.

We also recommend you