Nel maggio del 1961, in un laboratorio del National Institutes of Health a Bethesda, nel Maryland, un giovane biochimico di nome Marshall Nirenberg osservò una provetta trasformare l'astratto in chimico. La provetta conteneva un estratto privo di cellule, il macchinario spremuto da cellule batteriche rotte, e in essa lui e il suo collaboratore Heinrich Matthaei avevano aggiunto un semplice RNA sintetico costruito con nient'altro che la base uracile, ripetuta più e più volte. Quando controllarono quale proteina l'estratto avesse costruito, trovarono catene fatte di un solo amminoacido, la fenilalanina, assemblata ancora e ancora. Una sequenza di U era stata letta come un'istruzione, e l'istruzione diceva fenilalanina.
Era la prima parola del codice genetico mai letta ad alta voce. Prima di quel pomeriggio nessuno aveva saputo cosa significasse un qualsiasi codone specifico. Alla fine dell'esperimento, uno di loro lo sapeva: la sequenza UUU codifica per la fenilalanina. Quell'unico risultato aprì una porta sperimentale che, nel giro di cinque anni, avrebbe condotto all'intera tabella dei codoni e a un premio Nobel.
Ma per capire perché quella provetta avesse importanza, ci serve la mappa più grande in cui si inseriva. Come fa l'informazione racchiusa nel DNA, una molecola che nelle tue cellule non lascia mai il nucleo, a finire per dirigere la costruzione delle proteine che edificano e fanno funzionare il tuo corpo? La risposta è un principio che il fisico diventato biologo Francis Crick formulò tre anni prima dell'esperimento di Nirenberg, ed è ancora la spina dorsale della biologia molecolare.
L'idea che Crick battezzò nel 1958
Nel 1958, Francis Crick si presentò davanti alla Society for Experimental Biology e tenne una relazione intitolata On Protein Synthesis. In essa articolò ciò che chiamò il dogma centrale della biologia molecolare, un nome deliberatamente grandioso per un'affermazione ingannevolmente semplice sulla direzione in cui può viaggiare l'informazione biologica. L'informazione, propose Crick, fluisce dal DNA all'RNA alle proteine. Una volta che quell'informazione ha raggiunto la proteina, non può tornare indietro verso l'acido nucleico.
La parola "dogma" fu una scelta infelice, come Crick stesso ammise in seguito, perché suggerisce qualcosa creduto senza prove. Ciò che intendeva era più vicino a un'ipotesi organizzatrice centrale, un'affermazione su quali trasferimenti di informazione di sequenza fossero possibili e quali fossero vietati. L'asimmetria cruciale è la valvola a senso unico alla fine: la sequenza amminoacidica di una proteina può essere specificata da un acido nucleico, ma una proteina non può mai riscrivere la propria sequenza nel DNA o nell'RNA. Non esiste alcun macchinario cellulare che legga una catena di amminoacidi e ricostruisca a ritroso il gene che l'ha prodotta.
Questa direzione del flusso ha una conseguenza profonda. I cambiamenti che una proteina subisce nel corso della tua vita, l'usura e l'adattamento delle tue molecole al lavoro, non possono essere ereditati riscrivendoli nei tuoi geni. L'informazione genetica passa in avanti, mai all'indietro a partire dalla proteina.
Dove avvengono i due grandi passaggi
Il viaggio dal gene alla proteina si divide in due fasi denominate, e nelle tue cellule avvengono in stanze diverse. La prima fase, la trascrizione, copia un tratto di DNA in una molecola di RNA messaggero, e in una cellula eucariotica (quella di cui sono fatti piante, animali e funghi) ciò accade dentro il nucleo, dove è custodito il DNA. La seconda fase, la traduzione, legge quell'RNA messaggero e costruisce la proteina corrispondente, e ha luogo sui ribosomi nel citoplasma.
Poiché queste due fasi avvengono in compartimenti separati, l'RNA messaggero deve compiere un viaggio. Dopo essere stato trascritto, viene elaborato e poi esportato fuori dal nucleo attraverso i pori nucleari, i canali a controllo presenti nella membrana che racchiude il nucleo, prima che da esso possa essere costruita una qualsiasi proteina. L'informazione deve essere fisicamente trasportata dalla stanza in cui risiede la copia originale alla stanza in cui avviene la produzione.
I batteri e gli altri procarioti fanno le cose in modo diverso, e la differenza è istruttiva. Una cellula procariotica non ha nucleo, quindi non c'è alcuna membrana che separi il DNA dai ribosomi e nessun tragitto che l'RNA debba compiere. Trascrizione e traduzione avvengono simultaneamente sulla stessa molecola: i ribosomi possono agganciarsi a un RNA messaggero e iniziare a costruire la proteina da un'estremità mentre l'altra estremità è ancora in fase di copia dal DNA. La coreografia a due stanze delle tue cellule collassa in un unico spazio brulicante.
Copiare il gene: la trascrizione
La trascrizione comincia quando un enzima chiamato RNA polimerasi trova e si lega a un tratto specifico di DNA chiamato promotore, una sequenza che segnala dove inizia un gene e in quale verso debba essere letto. Una volta legata, la polimerasi separa i due filamenti della doppia elica per aprire una breve bolla, esponendo le basi all'interno. Poi legge lungo un filamento, il filamento stampo, muovendosi in direzione da 3-primo a 5-primo, e lo usa per assemblare un filamento di RNA complementare nella direzione opposta da 5-primo a 3-primo. Questi numeri primi etichettano semplicemente le due estremità chimicamente distinte di un filamento di acido nucleico, e contano perché il macchinario molecolare può procedere lungo di esse in una sola direzione.
Negli eucarioti, l'RNA appena prodotto, chiamato trascritto nascente, non è ancora pronto per essere tradotto. Subisce una sequenza di modifiche mentre si trova ancora nel nucleo. Una struttura protettiva chiamata cappuccio al 5-primo viene aggiunta alla sua estremità anteriore. Tratti di sequenza non codificante chiamati introni vengono tagliati via e i pezzi codificanti rimanenti vengono ricuciti insieme, un processo noto come splicing. Infine, una lunga coda di basi adenina, la coda poli-A, viene aggiunta all'estremità 3-primo. Solo dopo questa elaborazione l'RNA messaggero maturo lascia il nucleo. Il cappuccio e la coda contribuiscono a stabilizzare la molecola e a contrassegnarla come un insieme legittimo di istruzioni, mentre lo splicing assembla il messaggio codificante finale a partire da frammenti sparsi.
Leggere il messaggio: la traduzione e il codice
Nel citoplasma, la traduzione è il momento in cui la sequenza dell'RNA messaggero diventa una catena di amminoacidi. Immagina la scena dentro un ribosoma all'opera: il ribosoma si stringe attorno all'RNA messaggero e lo legge nella direzione da 5-primo a 3-primo, mentre piccole molecole adattatrici chiamate RNA di trasferimento trasportano gli amminoacidi uno alla volta. Ogni RNA di trasferimento porta con sé un amminoacido specifico ed espone una sequenza di tre basi, il suo anticodone, che si appaia con un codone corrispondente di tre basi sull'RNA messaggero. Man mano che gli RNA di trasferimento corretti si agganciano in ordine, i loro amminoacidi vengono collegati in una catena crescente, il polipeptide, che emerge da un tunnel nel ribosoma.
Il regolamento che connette i codoni agli amminoacidi è il codice genetico, e ha tre proprietà fondamentali che vale la pena memorizzare. Esistono sessantaquattro possibili codoni di tre basi, e questi corrispondono a venti amminoacidi più tre segnali di stop che indicano al ribosoma dove terminare la catena. Primo, il codice è ridondante, il che significa che la maggior parte degli amminoacidi è specificata da più di un codone. Secondo, è non sovrapposto, il che significa che ogni base appartiene esattamente a un codone e i codoni vengono letti in un quadro fisso, tre basi alla volta senza condivisione. Terzo, è quasi universale: gli stessi codoni indicano gli stessi amminoacidi in un batterio, in una sequoia e in un essere umano, con solo poche eccezioni note nei mitocondri e in una manciata di protisti. Quella quasi universalità è una delle prove più solide del fatto che tutta la vita sulla Terra discende da un antenato comune che usava già questo codice.
Decifrare il codice, un codone alla volta
Questo ci riporta alla provetta di Nirenberg. Prima del 1961, il codice genetico era una struttura teorica senza alcuna voce sperimentale. Lo stratagemma di Nirenberg e Matthaei fu aggirare la complessità del macchinario naturale fornendo a un estratto privo di cellule di E. coli un RNA su misura che avevano costruito loro stessi, un filamento di puro uracile. L'estratto costruì diligentemente una proteina di pura fenilalanina, dimostrando che UUU codifica per la fenilalanina. Presentarono il risultato al Congresso Internazionale di Biochimica a Mosca nell'agosto del 1961, e il campo capì immediatamente che il codice poteva ora essere letto sperimentalmente anziché soltanto indovinato.
Ciò che seguì fu una campagna durata cinque anni. Variando gli RNA sintetici e sviluppando tecniche più ingegnose, i ricercatori completarono il resto della tabella tra il 1961 e il 1966. Il riconoscimento decisivo arrivò nel 1968, quando il premio Nobel per la fisiologia o la medicina andò congiuntamente a Robert Holley, Har Gobind Khorana e Marshall Nirenberg per la loro interpretazione del codice genetico e della sua funzione nella sintesi proteica. Holley aveva determinato la struttura di un RNA di trasferimento, Khorana aveva sintetizzato sequenze di RNA definite che fissarono i codoni in modo inequivocabile, e Nirenberg aveva avviato l'intera impresa con quella prima lettura di UUU.
Cosa il dogma non vieta
Un malinteso persistente merita una correzione, perché gli studenti molto spesso arrivano convinti che il dogma centrale vieti qualsiasi flusso di informazione dall'RNA al DNA. Non è così, e non lo è mai stato. Nella sua formulazione originale del 1958, Crick elencò esplicitamente il trasferimento da RNA a DNA come un trasferimento speciale consentito. L'unico flusso che escluse era quello dalla proteina all'acido nucleico.
La questione fu risolta in modo clamoroso nel 1970, quando Howard Temin e David Baltimore scoprirono in modo indipendente un enzima chiamato trascrittasi inversa nei retrovirus, virus come l'HIV che immagazzinano i propri geni come RNA e li copiano in DNA all'interno di una cellula ospite. L'RNA veniva manifestamente riscritto in DNA, esattamente il trasferimento che la struttura di Crick aveva consentito. Quello stesso anno, per dissipare la confusione che la scoperta aveva suscitato, Crick pubblicò un articolo chiarificatore su Nature in cui ribadiva ciò che il dogma centrale aveva sempre significato. La via della trascrizione inversa era stata anticipata; l'unico divieto genuino e tuttora intatto riguarda soltanto il flusso dalla proteina all'acido nucleico.
Quando il polipeptide esce dal ribosoma
C'è un'ultima onestà che il dogma centrale ci richiede. Una catena polipeptidica che scivola fuori dal tunnel di uscita del ribosoma non è ancora una proteina finita e funzionale. Il percorso dell'informazione che il dogma descrive termina alla sequenza, ma la funzione biologica è un problema di chimica a valle che la sola sequenza non porta a compimento.
Una nuova catena deve ripiegarsi in una forma tridimensionale precisa, un processo spesso assistito da proteine ausiliarie chiamate chaperone che le impediscono di aggregarsi in modo errato. Frequentemente viene tagliata da enzimi chiamati proteasi, che rifiniscono la catena nella sua forma funzionale. Può avere gruppi zuccherini o gruppi fosfato attaccati chimicamente, modifiche che ne accendono o spengono l'attività o la contrassegnano per una destinazione. E talvolta viene unita ad altre catene, poiché molti enzimi e recettori sono assemblaggi di più polipeptidi. Il dogma centrale ti dice come una cellula decide l'ordine degli amminoacidi; non ti dice, di per sé, la forma finale o la macchina funzionante, che emergono da una chimica stratificata sopra la sequenza codificata.
Punti chiave
Il dogma centrale, battezzato da Francis Crick nel 1958, afferma che l'informazione di sequenza fluisce dal DNA all'RNA alle proteine e mai dalla proteina di nuovo verso l'acido nucleico; il trasferimento da RNA a DNA, spesso ricordato male, era consentito fin dall'inizio ed è stato confermato dalla scoperta nel 1970 della trascrittasi inversa. Nelle cellule eucariotiche, la trascrizione avviene nel nucleo, dove l'RNA polimerasi si lega a un promotore e copia lo stampo di DNA in un RNA messaggero che viene dotato di cappuccio, sottoposto a splicing e munito di coda prima dell'esportazione, mentre la traduzione avviene sui ribosomi citoplasmatici, dove gli RNA di trasferimento appaiano gli anticodoni ai codoni per costruire un polipeptide; nei procarioti, privi di nucleo, i due processi si svolgono contemporaneamente sulla stessa molecola. Il codice genetico è un insieme di sessantaquattro codoni di tre basi che corrispondono a venti amminoacidi e tre segnali di stop, ed è ridondante, non sovrapposto e quasi universale, un codice letto per la prima volta sperimentalmente quando Nirenberg e Matthaei dimostrarono nel maggio del 1961 che UUU significa fenilalanina, completato entro il 1966 e onorato con il premio Nobel del 1968 a Holley, Khorana e Nirenberg. Infine, il dogma descrive soltanto la sequenza: una proteina finita e funzionale richiede ripiegamento, taglio, modifica chimica e assemblaggio che si collocano al di là del percorso dell'informazione in sé.
Learn more with Mindoria
Bite-sized lessons, spaced repetition, and live PvP trivia battles. Free on Android.
Download Free