Frederick Sanger (1918-2013) i la seqüenciació de proteïnes i d’àcids nucleics

Bioquímica: Aquest mes de novembre, el dia 19, es moria mentre dormia Frederick Sanger, als 95 anys d’edat. Per al gran públic, Sanger era conegut per la fita d’haver aconseguit dues vegades el Premi Nobel de Química. Efectivament, el 1958, als 40 anys, se li va atorgar “per la feina en l’estructura de proteïnes, especialment de la insulina“. El 1980 el Premi Nobel de Química es va dividir en dues meitats, una per a Paul Berg (“pels seus estudis fonamentals de la bioquímica d’àcids nucleics, amb particular consideració a l’ADN recombinant“), i l’altra compartida entre Walter Gilbert i Frederick Sanger “per les llurs contribucions en relació a la determinació de la seqüència de bases dels àcids nucleics“. Tècnicament això són 1,25 nobels de química. La tècnica de seqüenciació de proteïnes de Sanger potser pot semblar una anècdota en la història de la ciència, però la tècnica dels dideoxinucleòtids per seqüenciar els àcids nucleics ha tingut una enorme rellevància en el desenvolupament de la genètica molecular i només fa uns anys que les plataformes modernes de seqüenciació les han superades per contribuir a l’explosió actual de la genòmica.

Naixement i formació

El pare de Frederick Sanger també es deia Frederick. Metge de professió, va treballar uns anys a la Xina en una missió anglicana. Per motius de salut deixà la Xina per tornar a Anglaterra i, amb 40 anys, el 1916, trencà la solteria per casar-se amb Cicely Crewdson, filla d’una rica família cotonera, de 37 anys, instal·lant-se a Rendcomb (Gloucestershire). La parella tindria tres fills, Theodore (nascut el 1915), Frederick i May (nascuda el 1923). El nostre Frederick Sanger va nàixer el 13 d’agost del 1918. No gaire després del naixement de Frederick, la família es va fer quàquera, en part pels antecedents familiars materns. El 1923, la família es traslladà a Tanworth-in-Arden, a Warwickshire.

El 1927, Sanger fou internat en la Downs School (Colwall, Herefordshire), una escola preparatòria quàquera. Prèviament, Sanger havia estat sota la cura de la institutriu familiar. A Downs School hi va retrobar el germà, que era un curs més avançat que ell. S’hi va estar fins el 14 anys, quan passà a la Bryanston School (Blandford, Dorset). Bryanston School havia estat creada quatre anys abans i seguia el “Pla Dalton”, impulsat per Helen Parkhurst des del 1914 i que tenia com a objectiu desenvolupar la iniciativa i autosuficiència dels alumnes. Bon estudiant, se sentia atret especialment per les matèries científiques.

Superat l’exam de certificació escolar, el 1936 ingressà en el St John’s College, de Cambridge, per estudiar ciències naturals. Era el mateix College on s’havia format el seu pare. Bo en química i bioquímica, Sanger tingué més dificultats en matemàtica i física. Per això, en el segon any trià els estudis de fisiologia per comptes dels de física. Amb poca diferència va perdre els seus pares, tots dos víctimes del càncer. No fou fins el tercer any que conclogué el primer cicle i va poder dedicar el segon cicle a la bioquímica. El Departament de Bioquímica havia estat fundat uns anys abans per Gowland Hopkins (1861-1947), i entre els professors de Sanger hi hagué noms com Malcolm Dixon (1899-1985), Joseph Needham (1900-1995) i Ernest Baldwin (1909-1969).

A banda de l’activitat acadèmica, Sanger fou actiu en el Peace Pledge Union i en el Cambridge Scientists’ Anti-War Group. Fou en aquests col·lectius pacifistes, oposats a la perspectiva d’una nova guerra mundial, que conegué Joan Howe, estudiant d’economia al Newnham College. Es prometeren, amb la idea de casar-se després de graduar-se. Entre mentres, però, esclatà la guerra amb Alemanya. Com a quàquer, Sanger s’havia declarat objector de consciència, emparant-se en la llei. Després d’una formació en el centre quàquer de Spicleands (Devon), serví com a assistent en un hospital. L’octubre del 1940, començà el treball de tesi doctoral, sota la direcció de Bill Pirie (1907-1997). La proposta de Pirie, adreçada a l’obtenció de proteïna comestible a partir de pastures, per bé que adient a la situació de guerra i carestia, no acabà de fer el pes a Sanger, i el novembre va passar-se a un projecte similar d’Albert Neuberger (1908-1996), sobre el metabolisme de la lisina que, com a aminoàcid essencial, era obstacle a l’aprofitament nutritiu de la proteïna de la patata. El desembre, ja graduats tots dos, Frederick Sanger es casà amb Joan Cowe. Com el seu pare, Frederick engendrà dos fills (Robin, nascut el 1943, i Peter, nascut el 1946) i una filla (Sally Joan, nascuda el 1960).

Neuberger era deu anys més gran que Sanger. S’havia doctorat feia quatre anys sota la direcció de Charles Robert Harington (1897-1972). D’origen bavarès, Neuberger era refugiat a Anglaterra des del 1933. Sanger enllestí la tesi, titulada “El metabolisme de l’aminoàcid lisina en el cos animal“, que defensà reeixidament davant de Harington i d’Albert Charles Chibnall (1894-1988) en el 1943. Sanger completà la tesi sense rebre cap ajut públic, sostingut únicament per la fortuna familiar.

La seqüenciació de proteïnes

Sanger no acompanyà Neuberger quan aquest es traslladà a l’Institut Nacional de Recerca Mèdica, sinó que continuà a Cambridge, ara dins del grup de recerca de Chibnall. Chibnall era interessat en l’anàlisi de composició aminoacídica i en l’estructura de proteïnes. Unir els dos aspectes (composició d’aminoàcids i estructura) únicament era factible en proteïnes de baix pes molecular. Per això, i per la pròpia rellevància d’aquesta proteïna, Chibnall recomanà Sanger que s’endinsés en l’estudi de la insulina. Com a tractament de la diabetis, la insulina era comercialitzada per Boots. Sanger aconseguí un ajut del Medical Research Council i, a partir del 1944 i fins el 1951 del Beit Memorial Fellowship for Medical Research.

En el 1945, Sanger descriva un mètode per estudiar els grups amino lliures (-NH2) de la insulina. El reactiu bàsic del seu estudi era l’1-fluoro-2,4-dinitrobenzè (DNFB) que, no debades, es coneix com el “reactiu de Sanger”. El DNFB pot reaccionar amb els grups amino lliures de les proteïnes:

Sanger deduí que l’estructura bàsica de la insulina consistia en quatre cadenes polipeptídiques. L’aminoàcid N-terminal de dues de les cadenes era la glicina (Gly) mentre que el de els altres dues era la fenilalanina (Phe). La unió de les quatre cadenes es faria a través d’enllaços disulfur a través de cisteïnes. Posterioment, Sanger reduí aquest esquema a dues cadenes, un amb Gly i una altra amb Phe com a aminoàcids terminals. Per la combinació bidimensional de separacions electroforètica i cromatogràfica, Sanger podia identificar els aminoàcids o pèptids units a molècules de DNFB. L’anàlisi de la insulina es basava en la degradació d’aquesta per hidròlisi química (amb àcid clorhídric) o enzimàtica (amb tripsina).

F. Sanger i H. Tuppy (1951a) analitzaren els pèptids resultants d’hidròlisis parcials d’insulina tractades amb fenilalanil, i també els pèptids resultants de la hidròlisi enzimàtica de la insulina. Així reconstruïren la seqüència aminoacídica de la cadena B (Phe) de la insulina. En el 1952, Sanger emprengué amb E. O. P. Thompson la mateixa tasca amb la cadena A (Gly) (Sanger & Thompson, 1953a; Sanger & Thompson, 1953b). En 1955, entengueren com es vinculaven totes dues cadenes a través de ponts disulfur (Ryle et al., 1955).

Seqüència de la insulina. Els aminoàcids són representats per tres lletres. Cada aminoàcid s’uneix al següent mitjançant un enllaç peptídic. Per convenció s’assigna la posició 1, a l’aminoàcid que queda lliure en el seu grup amino (extrem N). El conjunt de dos aminoàcids forma un dipèptid, el de tres un tripèptid, etc. La insulina és formada per dues cadenes, que s’uneixen mitjançant ponts disulfur a través de cisteïnes (Cys).

Els estudis de Sanger sobre la insulina definien, doncs, a la fi, l’estructura primària de les proteïnes com la seqüència específica d’aminoàcids. Cada proteïna, segons aquesta visió, era caracteritzada fonamentalment per aquesta seqüència. Donat el rol central de les proteïnes en l’activitat específica de la matèria viva, no és estrany que Sanger rebés un ràpid reconeixement, cristal·litzat amb la concessió del Nobel de Química en el 1958. Pocs mesos abans, Francis Crick proposava sobre la síntesi de proteïnes una hipòtesi:

“Aquesta hipòtesi assum que l’especificitat d’un segment d’àcid nucleic s’expressa únicament per la seqüència de les seves bases, i que aquesta seqüència és un codi (simple) per a la seqüència aminoacídica d’una proteïna particular. Aquesta hipòtesi sembla força ben sostinguda. Té la virtut d’unir diverses parelles remarcables de generalitzacions: la importància bioquímica central de les proteïnes i el rol dominant dels gens, i en particular del llur àcid nucleic; la linealitat de les molècules proteiques (considerades covalentment) i la linealitat genètica dins el gen funcional; la simplicitat de la composició de les molècules proteiques i la simplicitat dels àcids nucleics“.

La seqüenciació de l’ARN

Francis Crick enumerava, doncs, com a dogma central de la biologia, el flux d’informació des de l’ADN a l’ARN, i de l’ARN a la proteïna. Sanger, en el curs de la seva carrera científica, va fer el camí invers. De les proteïnes passà a l’ARN, i de l’ARN a l’ADN. Membre extern del Medical Research Council des del 1951, es va vincular més a aquesta entitat el 1962, amb l’obertura del Laboratori de Biologia Molecular, del qual esdevingué cap de la Divisió de Química Proteica. A aquelles alçades, ja s’havia fet clar que el mètode de seqüenciació de proteïnes difícilment es podria aplicar de manera generalitzada. La cadena B de la insulina consta de 30 aminoàcids, però la cadena proteica típica consta de centenars i, de vegades, milers d’aminoàcids. Mentre les proteïnes són integrades per 20 tipus diferents d’aminoàcids, els àcids nucleics són integrats per 4 tipus diferents de nucleòtids. Sanger pensà que la seqüenciació de molècules d’ARN podia ser més factibles. Estudià mètodes de degradació selectiva d’ARN per ribonucleases i de separació dels fragments generats. Hi havia, però, un obstacle: la purificació d’un ARN específic era molt més problemàtica que la purificació d’una proteïna. Calia cercar, doncs, un tipus d’ARN que fos relativament abundant en algun material biològic. En el curs d’aquestes recerques, descrigué l’N-formil-metionil-S-ARN (Marcker & Sanger, 1964), l’ARNt que transporta l’aminoàcid N-formil-metionina, que es troba normalment en l’extrem N terminal de les proteïnes bacterianes. Però Holley et al. (1965) s’avançaren publicant la seqüència de 77 nucleòtids de l’ARNt que transfereix l’aminoàcid alanina en el llevat (Saccharomyces cerevisiae). No fou fins el 1967, que el grup de Sanger publicà la seva primera seqüència d’ARN, concretament la seqüència de 120 nucleòtids de l’ARN ribosòmic 5S del bacteri Escherichia coli (Brownlee et al., 1967). En el 1968, Robert Holley, Har Gobind Khorana i Marschall Warren Nirenberg rebien el Premi Nobel de Fisiologia per la seqüenciació del 1965. Sanger s’havia hagut d’esperar cinc anys per rebre el seu per la seqüència de la insulina, i aquestos el rebien en tres anys per una molècula sense aparent rellevància clínica: coses de la febrada de la biologia molecular dels anys 1960.

La seqüenciació de l’ADN

Posterioment, Sanger s’adreçà a la qüestió de la seqüenciació de l’ADN. Les molècules típiques d’ADN són molt més llargues que les d’ARN, de manera que l’aproximació havia de basar-se, no tant en la degradació i separació de fragments d’ADN, com en la còpia de segments. Emprant l’enzim ADN polimerasa I, un oligonucleòtid sintètic com a encebador (concretament, un octadesoxirribonucleòtid) i nucleòtids marcats radiactivament, Sanger et al. (1973) aconseguí una seqüència parcial de 50 nucleòtids del genoma del virus bacteriòfag f1. Sanger & Coulson (1975) presentaren una millora d’aquesta tècnica “plus and minus”, que permetia una seqüenciació més ràpida de fins a 80 nucleòtids per experiment. Gràcies a aquesta millora, el grup de Sanger es convertí en el primer a aconseguir la seqüenciació d’un genoma sencer: els 5375 nucleòtids que integren el genoma d’ADN monocatenari del bacteriòfag phi X174 (Sanger at al., 1977). El genoma incloïa les seqüències dels nou gens coneguts del bacteriòfag, i troba que dos d’aquests gens se superposaven parcialment, cosa que trencava parcialment amb la idea inicial d’un gen-una proteïna.

Una millora fonamental del mètode de seqüenciació fou la introducció dels didesoxinucleòtids (Sanger et al., 1977). Si els desoxinucleòtids de l’ADN es caracteritzen pel fet que no tindre el grup -OH que sí tenen els ribonucleòtids en la posició 2 del sucre, els didesoxinucleòtids el perden no tan sols en la posició 2 sinó també en la 3. Els didesoxinucleòtids, per aquesta raó, provocaven la terminació de la cadena. Emprant els quatre didesoxinucleòtids corresponents a cada base (A, C, T, G), quatre reaccions paral·leles produïen fragments de pes molecular precís que es podien córrer en un únic gel electroforètic reproduint la seqüència precisa de l’ADN motllo.

El resultat final del mètode Sanger de dideoxinucleòtids és un gel electroforètic de quatre carrils (esquerra), on cada banda correspon a un fragment d’ADN marcat radiactivament. A partir dels anys 1990 es popularitzà una derivada d’aquest mètode que, en marcar cada dideoxinucleòtid amb un fluorocrom diferent, permetia fer la seqüenciació en una sola reacció. El marcatge fluorescent, a més, permetia prescindir del marcatge radiactiu

Paral·lelament al mètode de dideoxinucleòtids de Sanger, Maxam & Gilbert (1977) idearen un mètode basat en la degradació preferencial de l’ADN. Sanger i Gilbert reberen conjuntament el Premi Nobel de Química per aquests dos mètodes, per bé que el gruix del guardó anà a Paul Berg, per les tècniques d’ADN recombinant. El mètode de Sanger acabà per dominar el panorama de les tres dècades següents. Les tècniques d’ADN recombinant i la reacció en cadena de la polimerasa foren essencials per aplicar el mètode de Sanger en les seqüenciacions de genomes sencers.

Els darrers trenta anys

Quan es va retirar a “Far Leys” (Swaffham Bulbeck, a les enfores de Cambridge), el 1983, Frederick Sanger tenia 65 anys i dos premis nobel de química. Malgrat que en alguna ocasió va dir que ell no havia estat pas un acadèmic brillant sinó bàsicament un home de laboratori, el reconeixement de Sanger entre el gran públic anà en creixement en els anys 1980 i 1990. Bona part del genoma humà se seqüencià amb la tècnica dels dideoxinucleòtids. En el 1992, el Wellcome Trust i el Medical Research Council obriren el Sanger Center, que després esdevindria el Sanger Institute, en Hinxton, prop de Cambridge. El Sanger Center fou fundat per John Sulson, un dels col·laboradors de Sanger, i actualment és un dels principals centres de recerca genòmica del món.

Sanger, educat com a quàquer, es declarava agnòstic (“cerco òbviament la veritat, però em calen proves”) i va declinar en diverses ocasions ser ordenat cavaller per la reina. Sí que va acceptar, però, en el 1986, l’Ordre de Mèrit.

El llegat de Sanger és present en les 35 llibretes de laboratori que cobreixen la feina feta durant quaranta anys de recerca (1944-1983) i en la biografia científica que prepara George Brownlee, un dels seus deixebles.

Aquesta entrada ha esta publicada en 3. La Vida. Afegeix a les adreces d'interès l'enllaç permanent.

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *

Aquest lloc utilitza Akismet per reduir el correu brossa. Aprendre com la informació del vostre comentari és processada