
MICROARRAY
Per
lo studio delle basi chimiche della vita
AUTORI:
STRUMENTI PER PRODUZIONE E LETTURA
CONTROLLO DI QUALITA’
DEGLI SPOTS
MACCHINE PER L’AUTOMAZIONE DELL’IBRIDAZIONE
LA RACCOLTA DEI CAMPIONI BIOLOGICI
NORMALIZZAZIONE E TRASFORMAZIONE
LE APPLICAZIONI DEI MICROARRAY
IL SEQUENZIAMENTO MEDIANTE IBRIDAZIONE
LE SINDROMI NEOPLASTICHE EREDITARIE
RISPOSTE RAPIDE PER MALATTIE COMPLESSE
LA COMPONENTE GENETICA DELLE MALATTIE
FARMACOGENETICA E FARMACOGENOMICA
PROSPETTIVE BREVETTUALI E COMMERCIALI
COLLABORAZIONI E FINANZIAMENTI
I microarray o
biochips sono un piccolo supporto per analisi costituito, nella forma più
tradizionale, da un vetrino portaoggetti o anche altri tipi di supporto su cui
sono fissati, su linee parallele, decine, centinaia o anche migliaia di puntini
(spots) che sono piccoli o addirittura piccolissimi ammassi di acidi nucleici,
proteine o cellule e che quindi, funzionando da veri e propri biosensori,
rendono possibile, con l'aiuto del computer, la valutazione di qualsiasi tipo
di fenomeno vitale con una velocità e una precisione mai realizzate in
precedenza in tutta la storia della biologia. Un biosensore, infatti, è un
sensore chimico che sfrutta l'elevata specificità e sensibilità delle molecole
biologiche per trasformare un segnale biochimico ( in genere un evento di
riconoscimento specifico ) in un segnale quantificabile.
Praticamente il
microarray è un miniaturizzato sistema di analisi che si basa sulla
utilizzazione di supporti di vario genere, i più comuni sono in vetro, su cui
sono allineate microscopiche aree costituite da un numero anche notevole di
molecole di cattura, disposte secondo specifici criteri, che rendono possibile,
per mezzo di indicatori fluorescenti o di altro genere, determinare in
parallelo, e nello stesso tempo, anche migliaia di eventi biologici che, letti
da uno scanner in parallelo e contemporaneamente o da altro apparecchio in
grado di assolvere alla stessa funzione, sono resi evidenti sullo schermo di un
computer, che tra l' altro, in base ai risultati, può anche dare una risposta
numerica che è espressione della elaborazione complessiva del fenomeno preso in
esame.
La utilizzazione di
tali piccolissime quantità di molecole di cattura, e di altrettanto piccole
quantità dei campioni, rende il metodo molto più sensibile di altri che
utilizzano volumi centinaia di volte maggiori.
Pertanto, proprio per
le sue peculiari caratteristiche, l'uso dei microarray ha trovato immediata
larga applicazione nello studio del genoma in quanto è stato possibile
utilizzare vetrini su cui erano stati fissati anche decine di migliaia di
oligonucleotidi per centimetro quadrato e che quindi, in base a specifici
fenomeni di ibridazione, permettevano di mettere insieme rapidamente, ed in
parallelo, una enorme quantità di dati sull' espressione dei singoli geni.
La prima intuizione di
tale nuovo metodo di analisi la si deve a Mark Schena dell’università di
Stanford, che ne ha fatto cenno ad Amsterdam nel 1994 nel corso del quarto
congresso internazionale di Biologia Molecolare delle Piante, ma la prima
pubblicazione riguardante questa nuova tecnica è dell'anno seguente (Schena et
al. 1995). Presso l'università di Stanford, che ha una lunga tradizione negli
studi sugli acidi nucleici, e presso i contigui Laboratori Davis, sono state infatti
affrontate le prime problematiche su come fissare sui vetrini microscopiche
linee di sequenze di geni delle piante e su come studiarne l'espressione
utilizzando campioni di mRNA isolati dalle cellule e coniugati ad un enzima per
poter evidenziare poi l'avvenuta reazione con la comparsa di fluorescenza di
intensità variabile e quindi misurabile.
Quindi i microarray,
come i microprocessori, sono nati nella Silicon Valley. Parallelismo,
miniaturizzazione ed automazione sono tre aspetti che mettono in luce una certa
similarità fra le due tecnologie. I microprocessori hanno rivoluzionato i
rapporti umani ed hanno reso possibile favorire gli interscambi ed eseguire
milioni di calcoli per secondo. Abbiamo il convincimento che i microarray
potranno generare una rivoluzione tecnologica di inimmaginabile portata, perché
in grado di chiarire tantissimi problemi che sono alla base dei processi che
riguardano tutte le forme di vita sia vegetale che animale.
Infatti si è
sviluppato rapidamente un enorme interesse sulle prospettive di utilizzazione
di tale nuova tecnologia perché utilizzabile non solo per studiare le piante,
gli animali e l' uomo, ma anche i lieviti, i batteri, i virus. Ne consegue che
si intravede un' esplosiva applicazione non solo in medicina ma in tutta la
biologia, agricoltura compresa.
Per avere un' idea di
quello che può rappresentare in campo medico basti pensare che l'espressione
dei singoli geni è sempre strettamente correlata a quasi tutti i fenomeni della
crescita, dello sviluppo, dell'invecchiamento, all'azione delle droghe, degli
ormoni, alle malattie mentali e ad una infinità di malattie in cui la sequenza
genica del singolo individuo gioca un ruolo importante.
Ci si è subito resi
conto che, con questo nuovo mezzo d'indagine, sarebbe stato possibile non solo
fare diagnosi molto più precise e documentate, ma anche sarebbe stato possibile
arrivare alla individuazione dei farmaci più adatti da utilizzare di volta in
volta per i singoli pazienti.
Siamo quindi alla
vigilia di un modo nuovo di fare la medicina su basi biologiche molto più
complete e profonde perché potremo valutare rapidamente, grazie all'uso dei
microarray e dei computer, non solo il comportamento dei singoli organi o
distretti, ma anche essere informati di quello che è in atto in base alla
valutazione dell'attività di migliaia di singoli componenti cellulari, inclusi
i geni che ci daranno la possibilità di fare diagnosi esatte, anche in corso di
manifestazioni patologiche di difficile interpretazione, compresi i tumori.
Dato che nel genoma di
ciascuno di noi c'è scritto chi siamo e quello che possiamo o non possiamo
fare, e dato che la nostra vita è espressione delle interreazioni che,
specialmente attraverso le proteine, che derivano dai geni, avvengono fra le
nostre cellule, con i microarray, sapremo dare risposte precise a tante domande
a cui oggi non è possibile rispondere.
Ma questa nuova
tecnologia, se da un lato si va diffondendo perché permette di realizzare
tecniche diagnostiche finora
improponibili, è ancora abbastanza complessa perché, per lo meno sotto certi
apetti, alcune fasi non hanno ancora raggiunto l’optimum di standardizzazione e
di automazione. I problemi che si possono affrontare sono tali e tanti che non
ci si deve meravigliare se alcuni aspetti o alcuni tipi di soluzioni che sono prospettati possono far sorgere dei
dubbi.
Lo scopo di questa
monografia è pertanto sia quello di descrivere
le tecniche fondamentali e le possibili applicazioni ma anche di
illustrare tutti gli aspetti riguardanti i controlli di qualità che in tipo di
lavoro così complesso, che è ancora in gran parte di tipo artigianale e molto
capillarizzato assumono più che mai un’importanza determinante per ottenere
consistenza e ripetibilità di risultati.
L'essenza della vita è
un colossale ed apparentemente disordinato rimescolamento di molecole che
interagiscono in rete per effetto degli stimoli dell’ambiente con diversi gradi
di connettività e differenti stati di sensibilità alle perturbazioni.
Le molecole sono
sostanze formate da due o più atomi combinati in vario modo. Atomi della stessa
specie e della stessa massa formano la tavola periodica dei 118 elementi che è
praticamente l'alfabeto chimico. Gli elementi sono quindi atomi che, con le
normali reazioni chimiche non possono essere frazionati in strutture più
semplici.
I vari elementi sono
identificati usando o l'intero nome o lettere singole: Carbonio (C), azoto (N),
ossigeno (O), fosforo (P) e zolfo (S) sono gli elementi che più di frequente si
trovano nelle biomolecole.
Lo studio delle basi
chimiche della vita si articola nella biochimica, disciplina scientifica
sviluppatasi negli ultimi 200 anni, che ha svelato, con una impressionante
serie di progressive scoperte, il funzionamento delle più importanti molecole
che giocano un ruolo fondamentale nei meccanismi vitali e che sono il DNA, RNA,
le proteine ed i carboidrati.
Queste sono strutture
allungate,conosciute anche come biopolimeri, e che sono composte da catene di
molecole più piccole o monomeri. I più importanti monomeri, su cui si
articolano i meccanismi fondamentali della vita, sono i nucleotidi, gli
aminoacidi ed i monosaccaridi.
Cerchiamo di
ricapitolare brevemente le caratteristiche fondamentali di ciascuno di essi.
Sono i monomeri o
molecole costituenti le catene degli acidi nucleici sia tipo DNA che RNA, e
consistono, a loro volta di tre differenti componenti: una base azotata, un
gruppo fosfato ed una molecola di zucchero o monosaccaride.
Le basi azotate sono
strutture eterocicliche contenenti più atomi di azoto ed una delle cinque basi
azotate che sono note come adenina ( A ), guanina ( G ), citosina ( C ), timina
( T ) ed uracile ( U). Sono appunto dette basi perché in soluzione hanno
reazione basica. Come vedremo, le prime quattro entrano nella struttura del DNA
o acido desossiribonucleico, mentre l'uracile, invece della timina, entra nella
struttura del RNA o acido ribonucleico.
Oltre alle basi, la
molecola del nucleotide è composta anche da una molecola di un monosaccaride a
5 atomi di carbonio detto appunto pentosio. Le molecole del monosaccaride dei
nucleotidi del DNA e quelle del RNA sono praticamente identiche tranne che in
posizione 2' dell'anello che contiene, per il DNA, un atomo di idrogeno e
quindi H, invece dell'ossidrile OH che è nella stessa posizione del RNA. Da ciò
derivano pertanto le denominazioni desossiribosio e ribosio.
I nucleotidi che
compongono la molecola di DNA e RNA contengono una sola molecola di fosfato
mentre quelli utilizzati per la sintesi enzimatica sempre del DNA e RNA ne
contengono tre.
Sono i componenti
essenziali delle proteine e, come tali, indispensabili alla vita. Svolgono un
ruolo importantissimo in vari processi chimici naturali.
Gli aminoacidi sono 20
e tutti hanno come componenti caratteristici della struttura sia una gruppo
amminico ( NH3 ) che un gruppo carbossilico ( COO ) acido da cui deriva il
nome. Riportiamo nella seguente tavola come vengono contrassegnati in modo
abbreviato con tre lettere o con una singola lettera.
TAVOLA DEGLI
AMINOACIDI
Aminoacidi
|
Abbreviazione a tre lettere |
Abbreviazione a lettera singola |
|
Alanina |
ala |
A |
|
Arginina |
arg |
R |
|
Asparagina |
asn |
N |
|
Aspartato |
asp |
D |
|
Cisteina |
cys |
C |
|
Glutamina |
gin |
Q |
|
Glutammato |
glu |
E |
|
Glicina |
gly |
G |
|
Istidina |
his |
H |
|
Isoleucina |
ile |
I |
|
Leucina |
leu |
L |
|
Lisina |
lys |
K |
|
Metionina |
met |
M |
|
Fenilalanina |
phe |
F |
|
Prolina |
pro |
P |
|
Serina |
ser |
S |
|
Treonina |
thr |
T |
|
Triptofano |
trp |
W |
|
Tirosina |
tyr |
Y |
|
Valina |
val |
V |
Si sospetta che nelle
prime forme di vita, gli archeobatteri, il codice usato non arrivasse a
specificare tutti e 20 questi elencati ma ce ne fossero altri due: la
selenocisteina e la pirrolisina, che sono simili alla serina. Questo ci fa
pensare che il codice genetico, non sia stato sempre uguale ma che tenda ad
evolvere e ad espandersi dando origine a nuovi aminoacidi.
Sono composti
biochimici noti anche come zuccheri. altamente solubili, contenenti atomi di
carbonio, idrogeno e ossigeno in rapporto 1: 2 : 1. E' una famiglia di molecole
molto estesa che include glucosio, fruttosio, mannosio, galattosio ecc.
Le catene di
monosaccaridi contenenti due o più di tali molecole sono conosciuti come
polisaccaridi o carboidrati.
Il DNA o acido
desossiribonucleico è presente nel nucleo di ogni cellula del nostro corpo. E’
la molecola di cui sono composti i geni e che codifica le informazioni per la
sintesi sia dell’ RNA che delle proteine. E’ composta da tre componenti: uno
zucchero,un fosfato, ed una base. La molecola del DNA è lineare e si forma per
un’ azione enzimatica che lega il gruppo idrossilico 3' di un nucleotide al
gruppo S' del fosfato di un altro nucleotide. Due nucleotidi riuniti insieme in
questo modo formano un dinucleotide, ma le molecole di DNA sono formate da un
gran numero di nucleotidi. Risultano essere, quindi, sottili e lunghissime
scale a chiocciola ma avvolte e superavvolte in un'intelaiatura proteica, così
che il tutto assume la forma di un bastoncello microscopico che prende il nome
di cromosoma, che, come vedremo è composto da un insieme di segmenti
funzionali, detti geni.
Un tipico gene umano
contiene spesso circa 10.000 nucleotidi, mentre un cromosoma ne contiene anche
1.000.000.
La catena del DNA ha
una polarità e viene letta andando da sinistra, o parte alta, verso destra che
è la parte terminale. La parte alta contiene il fosfato legato all'atomo S' di
carbonio del desossiribosio, mentre l'estremo terminale contiene il gruppo
idrossilico legato all' atomo 3' di carbonio del desossiribosio.
Le molecole di DNA si
possono sintetizzare usando particolari macchine che, appunto, prendono il nome
di sintetizzatori di DNA. Si possono così realizzare delle catene di 10-100
nucleotidi a catena singola, noti come oligonucleotidi sintetici, largamente
utilizzati anche nella produzione dei microarray.
Le molecole di DNA
naturale, essendo le catene singole instabili, sono bicatenarie e le singole
catene, distanti l'una dall'altra 20 Å, sono tenute insieme da ponti idrogeno
che gli danno un andamento a spirale come in una scala a chiocciola e con le
singole volute corrispondenti a 10 basi. Una catena va dal 5' al 3' e l'altra,
che è complementare dal 3' al 5'. L'accoppiamento delle due catene si realizza
sempre con collegamenti esclusivi, nel senso che all'adenina (A) si lega alla
timina (T), e la guanina (G) si lega alla citosina (C). Questo processo di
interreazione fra le due catene complementari prende il nome di ibridazione.
L’unità fondamentale
del codice genetico è il codone che è
composto da tre nucleotidi.
Le molecole di DNA,
come dimostrato da Watson e Crick, sono costituite da un doppio filamento di
nucleotidi appaiati perfettamente
complementari. Si tratta di molecole filiformi e lunghissime, avvolte a
gomitolo e quindi tridimensionali, di carica negativa, facilmente solubili in
acqua, grazie alla presenza del fosfato e dello zucchero che sono altamente
idrofilici.
Si tratta perciò di
molecole con cui è relativamente facile lavorare in laboratorio. La carica
negativa, conferita dal fosfato, ne facilita il legame sulle superfici dei
microarray quando queste sono rese di carica positiva trattandole per es. con
derivati amminici ( R-NH 3+ ).
Le molecole di RNA
sono molecole intermediarie perché, come mRNA, ovvero RNA messaggero,
trasferiscono l'informazione genetica dal DNA alle proteine che devono essere
sintetizzate, e come t RNA, ovvero RNA trasportatore, raccolgono nel citoplasma
e mettono in fila, presso i ribosomi, i vari aminoacidi in modo che formino la
sequenza proteica prevista in base al segnale che arriva dal DNA. Sono molecole simili a quelle del DNA ma
hanno alcune particolarità, perché sono a catena singola, contengono la base
uracile ( U ) invece che la timina ( T ) ed hanno come molecola di zucchero il
ribosio invece che il desossiribosio.
Le catene di RNA,
oltre che essere singole, sono molto più corte nel senso che non superano mai i
10.000 nucleotidi. Anche queste molecole sono dotate di carica negativa,
facilmente solubili ma molto più instabili rispetto a quelle del DNA, perché
facilmente attaccate dalle ribonucleasi che sono enzimi molto diffusi nell'
ambiente e sulle superfici del nostro corpo per cui, quando ci si lavora
bisogna prendere particolari precauzioni ed indossare guanti di gomma
sintetica.
La maggior parte dei
ricercatori riconoscono tre tipi di RNA cellulari: messaggero ( m RNA ),
ribosomiale ( r RNA ) e di trasferimento ( t RNA ). Le molecole di m RNA,che
sono appunto quelle devolute al trasferimento dell'informazione genetica, non
superano il 5% del RNA totale cellulare, ma, sotto il profilo funzionale, sono
le più importanti, perché ciascuna molecola di m RNA corrisponde, come sequenza
di basi, ad uno specifico gene. Pertanto siccome i geni umani sono circa
30.000, ci sono 30.000 differenti molecole di mRNA nelle nostre cellule,
ciascuna formata da una catena di 1000-10.000 ribonucleotidi.
Sono le molecole di r
RNA le più abbondanti ( fino al 85% del totale ), ciascuna comprendente
100-5000 ribonucleotidi, che sono quelle che coordinano direttamente la sintesi
delle proteine che avviene proprio a livello dei ribosomi, che sono larghe
strutture citoplasmatiche devolute a questa funzione.
Le t RNA, che
costituiscono circa il 10% del totale, hanno la funzione di legare i singoli
aminoacidi al m RNA per rendere possibile poi il trasferimento ai ribosomi e
favorire così la sintesi delle proteine.
Ma si va facendo
strada il sospetto che esista un quarto tipo di RNA, che si potrebbe chiamare
RNA attivo, cosi chiamato perché sembra che simuli proprio la funzione dei
geni, tanto che qualcuno comincia a parlare di geni di solo RNA ( Eddy
Il dogma centrale su
cui si è basata la genetica molecolare, a partire dagli anni cinquanta, è molto
semplice: Il DNA fa l' RNA, l' RNA fa le proteine e le proteine svolgono quasi
tutto il lavoro biologico vero e proprio.Più esattamente possiamo dire che i
geni sono codificati nel DNA del nucleo delle cellule. Qui è prodotto (
trascritto) lo RNA messaggero ( m RNA ) che si trasferisce nel citoplasma,
elimina gli introni , subisce una serie di modificazioni e, poi, con l’aiuto dei ribosomi, ciascuno
viene tradotto nella relativa proteina.
Le proteine sono
composte da lunghe catene di centinaia o migliaia di aminoacidi , legati
insieme con legami covalenti fra il gruppo carbossilico di un aminoacido ed il
gruppo amminico del contiguo.
Abbiamo visto che
esistono 20 aminoacidi con formule chimiche diverse, e, quindi, una serie di
componenti elementari molto più numerosi dei quattro nucleotidi che formano le
molecole del DNA e del RNA. Ne deriva che, legandosi in vario modo possono dar
luogo a lunghissime catene diverse che costituiscono poi la struttura di tutto
il mondo biologico sia vegetale che animale.
Quando una proteina si
forma si ripiega in una struttura tridimensionale che è per lo più determinata
dall'affinità degli aminoacidi per l'acqua. Gli aminoacidi idrofobi tendono a
ripiegarsi all'interno della molecola, lasciando le loro controparti idrofile,
come per esempio il glutammato nella molecola dell' emoglobina, a contatto con
il citoplasma acquoso della cellula.
Nelle cellule la
trasmissione del messaggio dal DNA al RNA e poi alla proteina, avviene in modo
collineare sequenziale:
5' -CAC-TTT-GTA-3' DNA
5' -CAC -UUU -GUA -3' RNA
H3N -his -phe -val -COO Proteina
Ognuno dei circa
30.000 geni umani dovrebbe codificare una sola proteina e, quindi, nelle nostre
cellule ci dovrebbero essere circa 30.000 proteine diverse. Invece la realtà è
molto più complessa perché si è visto
che ciascun gene può codificare fino a 20 proteine diverse e che di molte
proteine si conoscono più varianti, simili ma diverse o per la sostituzione di
qualche aminoacido o per una diversa configurazione della forma terziaria
derivante dal ripiegamento. Le proteine sono quindi una vastissima famiglia di
molecole comprendenti enzimi, anticorpi, ricettori, trasportatori, ormoni ecc.
Pertanto oggi si ritiene che il proteoma umano comprenda non meno di un milione
di molecole diverse.
Gli enzimi, come è
noto, sovrintendono a tutte le attività biologiche quali la sintesi del DNA, la
sintesi del RNA, la sintesi delle proteine, il metabolismo cellulare in tutte
le sue forme, la degradazione del RNA, la degradazione delle proteine ecc.
Si sa che nel nostro
organismo i vari enzimi catalizzano, nelle cellule, centinaia e anche migliaia
di reazioni biochimiche al secondo.
Gli anticorpi sono
invece molecole di difesa che servono a proteggerci dall’invasione di virus,
batteri, e da molti tipi di molecole estranee che penetrano nei nostri tessuti,
che prendono il nome di antigeni.
Gli anticorpi sono
globuline che, in base al peso molecolare si dividono in due grandi categorie:
quelli di peso molecolare compreso fra 150.000 e 190.000 e quelli di peso
molecolare intorno a 900.000- Alla prima categoria appartengono quattro classi
IgA, IgD, IgE ed IgG. Alla seconda soltanto le IgM.
Già alla nascita sono
presenti nei nostri tessuti anticorpi di origine materna, trasmessi attraverso
la placenta e, nei primi giorni di vita, attraverso il colostro. Col tempo
compaiono poi gli anticorpi che poi, in ciascuno di noi, si formano come
risposta ad antigeni ambientali o ad infezioni o per effetto di immunizzazioni
indotte da vaccini. Caratteristica fondamentale degli anticorpi è quella di
reagire in modo specifico con l' antigene che ne ha determinato la formazione.
Sono pertanto noti anche come immunoglobuline.
Il gene è un segmento del
DNA genomico ed è quindi l'unità morfologica funzionale dell'intero organismo.
Il luogo fisico dove ciascun gene è posizionato è detto locus. In ogni locus
possono esistere forme diverse dei geni, perché, eccetto per i cromosomi del
sesso, ogni individuo ha due alleli per ciascun locus.Tali alleli sono analoghi
ai “ fattori “ descritti da Mendel. Gli individui sono omozigoti, per ogni
aspetto morfologico o funzionale, se i due alleli sono identici e, quindi,
indistinguibili l’uno dall’altro. Gli eterozigoti hanno invece alleli diversi.
I maschi sono emizigoti perché hanno una sola copia del cromosoma X.
La differenza fra i
due alleli può essere minima, ossia riguardare una sola coppia di basi. Alcune
volte la non corrispondenza degli alleli non ha conseguenze funzionali mentre
altre volte, come vedremo, anche la diversità di una sola base, può avere
effetti deleteri, come nel caso dell’anemia a cellule falciformi dovuta ad
un’accoppiamento timina-alanina che
porta all’alterazione della ctena B dell’emoglobina A, perché la sostituzione di
un’aminoacido idrofilo con uno idrofobo fa cambiare la struttura terziaria.
Quando gli alleli sono diversi, in genere, uno prevale sull’altro, e pertanto è
detto dominante.
Ciascun gene codifica
un solo tipo di m RNA ed una sola proteina, seppure con diverse varianti
strutturali, ed, attraverso di essi impartisce istruzioni al funzionamento
della cellula. Gruppi di geni adiacenti svolgono spesso funzioni correlate. Ma
i geni non funzionano tutti nello stesso tempo. Ad esempio i geni che
controllano il metabolismo del lattosio funzionano solo quando una cellula
cresce in un terreno contenente, come zucchero essenziale, il lattosio. In
assenza di lattosio non hanno bisogno di lavorare.
Ogni gene è composto
da circa 10.000 nucleotidi, ovvero l0 kb o chilobasi, che sono disposti in modo
da formare la doppia elica di acido desossiribonucleico ( DNA ).
I geni degli
eucarioti, e quindi anche delle cellule umane, contengono un certo numero di
esoni e di introni.
Gli esoni sono segmenti
di gene che vengono copiati sul corrispondente m RNA e sono composti da
sequenze di codoni ovvero da sequenze delle 64 triplette di nucleotidi
contenenti le quattro basi A T C G, ciascuna riferentesi ad uno dei 20
aminoacidi utilizzati per la sintesi delle proteine. Ma, con eccezione per
metionina e triptofano, anche triplette diverse possono codificare per lo
stesso aminoacido, per esempio quattro codoni codificano la leucina ( CTT, CTC,
CT A, CTG ), e due la lisina ( AAA, AAC ).
Introni sono invece segmenti
di geni che non vengono trasferiti nel m RNA e che quindi non codificano la
sintesi delle proteine. Queste porzioni di sequenze non codificanti, che
costituiscono oltre l’80% del genoma umano, non sono tuttavia inutili, come si
è creduto per molti anni, perché, come vedremo, danno origine a RNA
sorprendentemente attivi, in grado di silenziare o regolare i geni.
Un tipico gene umano è
costituito da 6-8 esoni ed introni, ciascuno lungo 100-1000 paia di basi e,
quindi, 0,1-1 kb. Ma la lunghezza e la struttura dei geni varia
considerevolmente. Per esempio il gene che determina la fibrosi cistica,
malattia che, in alcune aree, colpisce 1 neonato ogni 3000, contiene 25 esoni e
ben 250 kb che codificano una proteina patologica di ben 1480 aminoacidi.
Il più grande gene
umano noto è quello che determina la distrofia muscolare di Duchenne: contiene
75 esoni e 2,4 milioni di paia di basi.
E' interessante il
punto di vista dello zoologo inglese Richard Dawkins che, nel riconsiderare i
concetti di gene, individuo e specie ha affermato che l'organismo deve essere
visto nella sua interezza come una macchina le cui parti concorrono a
realizzare un unico fine che consiste nella replicazione di tutti i geni
dell'organismo. Ogni organismo si è sviluppato grazie ad un patto stabilito fra
loro dai geni che sono sopravvissuti proprio in virtù della propria capacità di
collaborare nel pool genetico per creare organismi individuali dello stesso
tipo. In quest'ottica i geni rappresentano i veri replicatori, mentre l'organismo
è semplicemente il veicolo per il replicatore e la specie è l'agglomerato nel
quale i geni collaborano tra loro perché presentano le stesse aspettative. I
replicatori sopravvivono attraverso il processo di selezione naturale in virtù
della loro compatibilità con l'ambiente.
Si intende l'insieme
di tutto il materiale genetico che costituisce il corredo ereditario di un
organismo vivente. Ogni cellula di un organismo contiene nel proprio nucleo un
insieme di coppie i di cromosomi costituiti da DNA e da proteine. Per esempio
ogni cellula umana contiene nel proprio nucleo 46 cromosomi, 23 di origine
paterna e 23 di origine materna e più precisamente 22 autosomi , che sono
uguali nel maschio e nella femmina e poi X ed Y che sono i cromosomi del sesso
che sono morfologicamente diversi.
Le cellule somatiche
degli animali superiori sono dette diploidi perché hanno due copie di ciascun
cromosoma che, come abbiamo visto, sono di origine diversa, una dal padre ed
una dalla madre. Invece le cellule dell’uovo o dello sperma per ciascun
cromosoma hanno un unico rappresentante e, quindi, sono dette aploidi.
Se si colorano le
cellule in fase di divisione si possono vedere al microscopio i singoli
cromosomi, che sonodistinguibili per la grandezza ed in base alla morfologia
caratterizzata dalla posizione del centromero che è interposto fra le braccia
corte ( p ) e le braccia lunghe ( q.).
All'interno dei
cromosomi risiedono i geni distribuiti l'uno dopo l'altro in modo da formare un
filamento attorcigliato lungo circa
I geni degli organismi
unicellulari primordiali e le cellule batteriche, che hanno preceduto di
miliardi d'anni la comparsa dell'uomo sulla terra, avevano un genoma più
semplice e privo di introni e i cui codoni sequenziavano un numero più ridotto
di aminoacidi. Invece gli organismi unicellulari attuali come i lieviti, hanno
nucleotidi ed aminoacidi simili a quelli umani, che, da un lato, confermano la
teoria evolutiva degli esseri viventi, che va dai più semplici fino all'uomo,
ma sono geni con strutture geniche più piccole e prive di introni.
Il genoma di molti
virus e batteri consiste di un singolo cromosoma circolare, mentre gli
organismi superiori hanno un genoma composto da numerosi cromosomi lineari.
Man mano che si sale
nella scala biologica si vede che il numero dei geni e quello dei cromosomi
aumenta e la struttura diventa più complessa. Quello che già si sospettava lo
ha confermato la completa identificazione delle sequenze genomiche ormai
completa per circa 1000 organismi diversi, che è stata estesa, negli ultimi
anni anche all'uomo.
Gli obiettivi
principali del Progetto Genoma Umano, che ha avuto fra i promotori James Watson
e l'italiano Renato Dulbecco e che, con inzio nel
Comunque ogni specie
di organismi ha un certo numero di cromosomi e di geni caratteristici e, poi,
all'interno di ciascuna specie, ogni individuo ha un proprio genoma specifico.
Notiamo infatti che,
per esempio, la mosca della frutta ( Drosophila melanogaster ) ha 5 cromosomi,
14.000 geni e 140.000.000 paia di basi; il topo ha 20 coppie di cromosomi,
30.000 geni e 3.000.000.000 paia di basi; l'uomo ha 3 coppie di cromosomi più
del topo, ma, all'incirca, lo stesso numero di geni e di paia di basi.
E' stato messo in
evidenza che il genoma di ogni essere umano è identico al 99,9%. Quindi solo
una limitatissima percentuale di geni può variare da persona a persona.Abbiamo
visto che ogni persona è portatrice di due alleli per ogni gene. Quando gli
alleli sono uguali, si dice che quella persona, per quel gene, è omozigota. Se
i due alleli sono diversi si dice che quella persona, per quel gene, è
eterozigota. Negli eterozigoti, come abbiamo già riferito, uno dei due alleli è
spesso dominante ed è espresso, l'altro è recessivo e può restare inattivo.
La presenza di due
versioni per lo stesso gene risulta essere un naturale meccanismo protettivo,
nel senso che, quando un allele risulta essere difettoso, può subentrare
l'altro, che è in grado di compensare.
Per avere un'idea di
come funzionino vediamo quello che succede per i gruppi sanguigni: ogni essere
umano è classificato come gruppo A, B, AB oppure O. Questo perché il gene ABO
ha tre alleli che sono A, B e O. Questi tre alleli hanno la struttura del DNA
quasi identica perché, infatti, differiscono solo per pochissimi nucleotidi.
Gli alleli A e B, che codificano rispettivamente per le proteine A e B, sono
codominanti. Coloro che hanno gli alleli AA o AO, e quindi solo la proteina A,
appartengono al gruppo sanguigno A. Coloro che hanno gli alleli BB o BO, e
quindi solo la proteina B, appartengono al gruppo sanguigno B. Coloro che hanno
ambedue gli alleli AB, appartengono al gruppo sanguigno AB. Coloro che sono 00,
e quindi non hanno nessuna delle due proteine, appartengono al gruppo sanguigno
O.
Come abbiamo già
riferito le variazioni della struttura genomica fra un essere umano ed un altro
sono limitatissime e riguardano praticamente singoli nucleotidi, nel senso che
in una stessa posizione una persona può avere una G invece che una C, mentre
un' altra può mancare di una T. Queste variazioni, meglio note come mutazioni e
polimorfismi possono essere di vario genere e sono contraddistinte dalle
denominazioni seguenti:
Sostituzione: una base
invece di un’ altra.
Delezione: perdita di
una base.
Inserzione: aggiunta
di una base.
Inversione: una breve
sequenza di basi è sostituita da un'altra che ha la stessa sequenza ma con
direzione invertita.
Traslocazione: una breve
sequenza di basi risulta rimossa e trasferita in un settore diverso.
I termini "
mutazione " e " polimorfismo " sono spesso usati in modo
intercambiabile, ma è più corretto considerare il polimorfismo una variazione
di sequenza che si riscontra in almeno 1 % della popolazione e che, in genere,
non produce effetti apprezzabili, mentre la mutazione è una variazione di
sequenza più rara, ma che può essere dannosa.
Nel 1865 un monaco
austriaco, Gregor Mendel, pubblicò il risultato delle sue osservazioni sulle
modalità di trasmissione di tre caratteri dei piselli, ossia il colore dei
semi, l’aspetto della superfice, liscia o rugosa, e l’altezza delle piante.
Egli dimostrò come un certo “fattore” venisse trasmesso immodificato e con
uguale frequenza da ciascuna generazione di piante alla seguente.
Le osservazioni di
Mendel non furono prese in seria considerazione fino al 1902, quando Sir
Archibald Garrod non dimostrò che l’alcaptonuria, una malattia umana, si
trasmettesse in via ereditaria.
Sono dovuti
trascorrere altri 90 anni dopo la prima osservazione di Mendel per capire che
il fattore genetico individuato fosse il gene e come i caratteri ereditari si
trasmettano fondamentalmente in base alle leggi di Mendel con il DNA,
utilizzando un codice molto semplice, perché costituito da un alfabeto di 4
lettere, giustamene definito l’alfabeto della vita: adenina,citosina,guanina e
timina. Tali quattro lettere poi si alternano in gruppi di tre creando 64
triplette o combinazioni, da cui derivano come vedremo, i 20 aminoacidi, che
sono la base costituente di tutte le proteine, che sono a loro volta le più
importanti molecole strutturali di tutti gli esseri viventi.
Appare sorprendente il
fatto che tutti gli esseri viventi sia vegetali che animali si formino utilizzando
lo stesso alfabeto e che sia possibile trasmettere geni anche da una specie ad
un'altra ossia attuare il trasferimento genico che sta rivoluzionando tutta la
biologia ed ha dato il via a non pochi dilemmi etici, perché la gente teme che
gli organismi geneticamente modificati, possano, con il passar del tempo
riservare delle sorprese.
Ogni uomo è formato da
circa 100 miliardi di cellule e ciascuno di noi eredita un certo tipo di
genoma, in cui sono presenti alcune variazioni che sono appunto dette ereditarie
per distinguerle da quelle acquisite che possono comparire nel corso della vita
per effetto di fattori tossici ambientali. Le mutazioni presenti nelle cellule
somatiche spesso dovuti alle interazioni
con l’ambiente, vengono trasmesse solo alle identiche cellule figlie mentre
quelle presenti nelle cellule della riproduzione o germinali sono ovviamente
trasmesse anche alle generazioni seguenti.
Tutti gli organismi
eucariotici, che includono i funghi, le piante, i roditori e i primati,
compreso l'uomo hanno cellule somatiche diploidi, che significa che in ogni
cellula hanno due copie dello stesso gene in una coppia di cromosomi analoghi,
che sono quindi in totale 46 che, come sappiamo, 23 sono di origine paterna e
23 di origine materna. Le cellule germinali, conosciute anche come gameti, sono
dette invece aploidi perché hanno una sola copia di ogni cromosoma, in totale
23, e quindi una sola copia di ogni singolo gene.
Durante la
fertilizzazione, si ha l'incontro e la fusione della cellula germinale uovo con
la cellula germinale spermatozoo, ciascuna portatrice di 23 cromosomi e si
riforma la cellula somatica in cui si ritrovano, per ogni gene, la copia di
origine maschile e quella di origine femminile. Quindi per ogni gene si può
avere l'incontro di alleli omozigoti o di alleli eterozigoti, a secondo se le
due copie sono, per quanto riguarda la sequenza dei nucleotidi, identiche o
diverse. Ma non tutti i caratteri del fenotipo, come vedremo, sono trasmessi ai
discendenti secondo le leggi di Mendel. Per cui c’è sempre una certa differenza
tra il genotipo ed il fenotipo, sia perché i meccanismi di trasmissione
ereditaria sono molto più complessi ma anche perché su tale espressione
interferiscono tutti i componenti ambientali.
Tutte le alterazioni o
mutazioni del codice genetico possono essere neutre, ovvero senza apparente
effetto, oppure benefiche o deleterie. Naturalmente, in questo ultimo caso,
portano ad alterazione di funzioni e quindi possono anche determinare una
malattia.
Un individuo che per
una certa malattia è eterozigote, può non manifestare i caratteri o i sintomi
di quella forma morbosa ma, essendo portatore, essere sempre in grado di
trasmettere quella variante o allele alla prole. Quando però, il carattere
riferentesi a quella malattia è dominante sull'altro allele recessivo, allora,
anche nell' eterozigote può evidenziarsi la sintomatologia della malattia.
Molte variazioni del
genoma, qualora determinino scambi di aminoacidi fondamentalmente simili, non
producono effetti apprezzabili a livello cellulare o producono anche effetti
benefici. Su ciò si basa non solo la grande diversità biologica ma anche ci fa
capire come mai l'evoluzione, condizionata dalle interferenze con l’ambiente,
abbia portato quasi sempre a far prevalere il meglio.
Altre mutazioni
possono essere dannose nel senso che possono essere causa diretta di malattia o
aumentare la suscettibilità ad una data malattia che può condurre anche a
morte. Per esempio una mutazione del gene p53, che codifica una proteina capace
di bloccare la proliferazione cellulare, può anche determinare un'abnorme
crescita cellulare fino alla formazione di tumori. Non c'è quindi da
meravigliarsi se in soggetti in cui sia presente tale mutazione compaiano poi
lesioni cancerose.
La maggior parte delle
mutazioni che si ritrovano nel genoma umano derivanti dalla relativa
instabilità del DNA,riguardano singoli nucleotidi e prendono il nome di
polimorfismi in singoli nucleotidi (SNP s ). Di tali sequenze mutate, nei
cromosomi umani se ne trova all'incirca 1 ogni 1000.
Comunque, come
vedremo, ci sono malattie genetiche ben definite dovute alla mutazione anche di
un solo gene, mentre la maggior parte delle malattie, per non dire tutte, hanno
una base genetica che determina la suscettibilità individuale, ma sono multifattoriali
perché sono espressione delle interazioni di più geni e dei singoli geni con
l’ambientee.
Comunque lo studio
sempre più approfondito del genoma ci sta chiarendo i rapporti fra struttura e
funzioni dei geni. Il Progetto Genoma Umano ha definito le sequenze
nucleotidiche di tutti i vari geni e, quindi di tutti i cromosomi. Alla fine di
questa memorabile impresa Prancis S. Collins ha giustamente esclamato: “Siamo
alla fine dell'inizio”.
Ora, infatti, dobbiamo
capire il funzionamento di tutti questi geni. Le domande che attendono una
risposta sono molte. Ne ricordiamo alcune:
Quali geni sono
espressi nei vari tessuti?
Come l'espressione di
un gene può essere influenzato da influenze extracellulari ?
Quali geni sono
espressi durante lo sviluppo di un organismo?
Come cambia
l'espressione di un gene in fase di sviluppo e di differenziazione ?
Quale effetto deriva
dalla disregolamentazione di un gene ?
Quale tipo di
espressione genica può essere causa di malattia o favorire l'aggravarsi di una
malattia. ?
Quale tipo di
espressione genica può influenzare la risposta ad un certo tipo di trattamento
?
Il diffondersi delle
analisi eseguibili con i microarray permetterà di chiarire questi ed altri
numerosissimi quesiti riguardanti tutta la biologia sia del mondo animale che
vegetale.
Il termine proteoma è
stato coniato circa dieci anni fa per introdurre un concetto simile a quello
del genoma, ma a livello delle proteine. Per qualsiasi essere vivente, lo si può
definire come l'insieme delle proteine che sono codificate dal suo genoma.
Il concetto di
proteoma è molto più complesso del suo predecessore genoma per le seguenti
ragioni:
Ne consegue che
l'identificare la sequenza degli aminoacidi che compongono una proteina può
essere di scarsa importanza se si desidera sapere, non solo come effettivamente
la molecola è strutturata, ma anche come funziona sia in condizioni
fisiologiche che patologiche.
C'è poi un altro
aspetto, non di secondaria importanza, che riguarda le relazioni di ciascuna
proteina con l'ambiente circostante per cui si può avere che la stessa proteina
in cellule diverse ha un comportamento diverso e può assolvere a funzioni
diverse. Poi occorre tener presente che le interazioni fra proteine sono eventi
transitori e la cinetica, secondo le circostanze, può cambiare molto. Ogni
condizione del nostro organismo, a seconda di quanto siamo malati o di quali
farmaci prendiamo, determina radicali cambiamenti del proteoma.
Ma se pure il proteoma
è molto più complicato da studiare di quanto lo sia stato il genoma, moltissime
aziende biotech stanno cercando di capire quali siano gli strumenti e le tecniche più adatti, non solo perché la
proteomica è alla base della biologia ma perché si è convinti che tale
approfondimento può aiutare molto lo sviluppo di nuovi farmaci.
Finora per capire
quali siano le proteine presenti in determinate cellule o tessuti si sono
utilizzate prevalentemente l' elettroforesi bidimensionale su gel, la
spettrometria di massa e la cristallografia a raggi X.
Nell'elettroforesi
bidimensionale si depone un piccolo campione della miscela di proteine sul
bordo di un sottile strato di gel in grado di separare le proteine spostandole
in due direzioni perpendicolari in base alla loro massa e alla loro carica
elettrochimica. Pertanto ognuna diventa identificabile come una macchia
distinta sul gel e quindi può essere prelevata e studiata con altre tecniche.
La spettrometria di
massa utilizza magneti o campi elettrici per separare proteine differenti in
base alla massa degli atomi che le costituiscono e i risultati appaiono come
picchi di un grafico. Ma gli spettrometri di massa sono apparecchi molto
costosi e non sempre si dimostrano utili nell'individuare le nuove proteine.
La cristallografia a
raggi X consente di analizzare proteine preventivamente purificate e
cristallizzate. Esaminando in che modo i raggi X vengano deviati dai singoli
atomi di una proteina, si può capire come sia fatta la molecola ed intravedere
la conformazione tridimensionale, che, come abbiamo già spiegato, per le
proteine è importantissima.
Ma, con questi
apparecchi, si riescono a catalogare le proteine presenti in un campione
biologico ma non è questo l'unico obiettivo che si pongono gli studiosi del
proteoma.
Per capire che cosa
realmente facciano le proteine nel corpo e per sviluppare farmaci efficaci,
dobbiamo sapere come varia la componente proteica da una cellula all'altra e,
all'interno della cellula, con il mutare delle condizioni circostanti. Dobbiamo
inoltre capire come le diverse proteine collaborino per portare a termine le
varie attività della cellula.
Le proteine si
combinano a formare reti funzionali e quindi è importante riuscire a capire con
quali altre proteine una proteina, momento per momento, interagisca.
Servono quindi metodi
nuovi e apparecchi nuovi. Siamo quindi certi che i microarray potranno dare un
contributo fondamentale per la soluzione di tali problemi proprio perché adatti
allo studio sistematico delle interazioni biologiche.
Gli organismi viventi
però non vivono nel vuoto ma, e tantomeno, in un ambiente statico, ma
permanentemente coinvolti in continue e subentranti sfide ambientali che vanno
da quelle dell’ambiente intracellulare a quelle dei singoli organi e sistemi
interni all’ambiente esterno in cui ogni essere vivete compie giorno per giorno
il suo ciclo di vita. Quindi, certamente, con la pubblicazione delle sequenze
del genoma dei singoli esseri viventi fino quelli umani si sono create le basi
di un sistema dinamico di vincoli che permettono alle cellule di agire in un
certo modo. Ora ci si deve muovere verso una nuova frontiera e stabilira non
solo le funzioni dei singoli geni ma anche scoprire i rapporti evolutivi e la
logica che governa l’assemblaggio delle proteine coinvolte in complicate reti
metaboliche che danno la possibilità a tutti gli esseri viventi di reagire in
modo diverso a tutte le sollecitazioni sia dell’ambiente interno che esterno a cui
si devono adattare.
L’elaborazione
dell’informazione ereditaria rende possibile la costruzione di reti dinamiche
d’interazione che caratterizzano le funzioni di tutti gli esseri viventi sia in
condizioni fisiologiche che patologiche.
Ora, mentre conoscendo
i genomi dei microrganismi è relativamente facile stabilire le funzioni dei
singoli geni, lo stesso non si può dire quando si ha a che fare con genomi più
complessi.
E’ ormai noto,
infatti, che non tutta l’informazione biologica è racchiusa nelle sequenze del
DNA che codificano le proteine, né che la funzione delle singole proteine
derivi solo dalle sequenze degli aminoacidi che le compongono. Esistono
certamente delle dinamiche interazionali che si esprimono a vari livelli delle
attività cellulari e che, probabilmente, sono ancora sconosciute.
Un microarray è una
linea ordinata di elementi microscopici su una superficie piana su cui è
possibile immobilizzare sia acidi nucleici che proteine capaci di riconoscere e
legarsi con molecole complementari. Permettono di eseguire, pertanto, sia
reazioni di ibridazione, quando si tratti di acidi nucleici, o reazioni
immunitarie, quando si tratti di antigeni o anticorpi. Ci si possono legare
anche cellule vitali per realizzare ricerche di vario genere.
Microarray è una nuova
parola scientifica composta da " micro ", che in greco significa
" piccolo " e dal francese " arayer ", che significa "
sistemare ".
I microarray, che
qualcuno ha anche chiamato biochips o gene chips, contengono un insieme di
piccoli elementi, detti anche spots, sistemati su file orizzontali e colonne
verticali.
Un microarray può
essere considerato un mezzo diagnostico se presenta quattro caratteristiche
standard ossia essere ordinato, microscopico, planare e specifico.
Ordinato
Significa che gli
elementi analitici, detti anche molecole probe o chip o spot, devono essere
disposti in modo ordinato e preciso lungo file orizzontali diritte ed
incolonnati anche su file verticali perfettamente perpendicolari. I vari
elementi devono essere, ovviamente, di grandezza uniforme e separati da spazi
uniformi.
E' assolutamente
necessario che tali elementi siano disposti in maniera ordinata, sia su linnee
orizzontali che verticali, perché questo ne facilita la produzione in
automazione e, quindi a costi contenuti, ma, ancora più importante, ne facilita
e accelera l'esame e l'interpretazione dei risultati.
Ogni elemento deve
essere uniforme per non rendere ambigua la lettura. Non è ammissibile la se pur
minima sbavatura che rischierebbe di contaminare la lettura dell'elemento
vicino. Elementi di forma diversa o di diversa densità, anche se contenenti lo
stesso numero di molecole, darebbero luogo ad un segnale di diversa intensità,
compromettendo la precisione del risultato.
Inoltre, ovviamente
ogni elemento deve avere una collocazione ben precisa, in base alle sequenze
desiderate, di modo che, automaticamente, si sappia che il dato che la macchina
legge corrisponda ad un unico e ben preciso probe o spot.
Microscopico
Microscopico è
qualsiasi oggetto le cui dimensioni siano inferiori ad
Si tende tuttavia a
realizzare probe quanto più piccoli, e questo sia perché così se ne possono
concentrare anche fino a oltre 5000 per centimetro quadrato. sia perché quanto
più piccolo è il probe o spot tanto più veloce è la cinetica della reazione
realizzabile.
Per rendersi conto
dell' enorme importanza della miniaturizzazione degli elementi, basti pensare
che sono stati già realizzati microarray che comprendono l'intero genoma umano
e, quindi con circa 35.000 spots.
Planare
il substrato di
supporto dei probes può essere di vetro, plastica o silicio ma è importante che
sia perfettamente piano. il materiale finora più usato è stato il vetro sia
perché è più facile realizzare superfici senza imperfezioni sia perché ci si
lavora meglio.
il materiale di
supporto deve essere solido, rigido, planare ed impermeabile e perché solo se
ha queste caratteristiche è possibile realizzare una produzione di alta qualità
in automazione e rendere possibile anche la lettura dei risultati in
automazione.
Comunque, anche se il
vetro è stato preferito, sono allo studio anche altri materiali che forse
potranno essere utilizzati per specifiche applicazioni.
Specifico
Ogni microarray ha la
funzione di misurare in modo preciso il numero, la quantità o la concentrazione
di molecole presenti nel campione. Quindi è fondamentale che le molecole
presenti nel campione o target vengano legate dal probe in modo assolutamente
specifico ed il segnale che ne deriva deve essere esattamente correlato alla
quantità.
Ogni target deve
legare solo una specie delle molecole presenti nel campione ed esprimere la più
accurata misura del gene o del prodotto genico; inoltre il risultato deve
essere riproducibile con un alto livello di confidenza.
L'assoluta specificità
di legame fra il probe o spot che è sul vetrino ed un solo tipo di molecola fra
quelle presenti nel campione o target è il criterio fondamentale per poter
utilizzare un determinato microarray per fare analisi.
I microarrays per il
DNA hanno reso possibile la convergenza di due aree scientifiche molto diverse:
la genetica e l'elettronica. L'origine di tale nuova tecnologia va fatta
risalire agli esperimenti di Southern che, nel 1975, dimostrò come fosse
possibile fissare il DNA ad un supporto solido ed attrarre, in modo specifico,
una catena complementare sempre di DNA. Tale processo, poi largamente
utilizzato per scopi diagnostici, è noto come
“Southern blotting ".
Fu poi Fodor, che nel
1991, fabbricò i primi microarray, combinando il metodo fotolitografico, usato
per i semiconduttori, per realizzarne i primi fissando degli oligonucleotidi su
superfici di vetro. Avendo intuito l'importanza commerciale che tale tecnologia
avrebbe potuto avere, fondò l'Affymetrix che ha avuto il merito di mettere sul
mercato i GeneChip, che sono stati i primi vetrini con DNA utilizzabili per
tests genetici.
Negli anni che sono
seguiti i microarray con DNA hanno trovato una sempre più vasta applicazione in
vari settori e con diversi fini. La tecnologia si è andata progressivamente
affinando fino a produrre vetrini con decine di migliaia di microspots su pochi
centimetri quadrati adatti per indagini molto complesse sulle modalità d'azione
dei vari geni che prima non sarebbe stato possibile realizzare o avrebbero
richiesto tempi molto lunghi.
Infatti solo con
questa tecnologia è diventato possibile identificare, quantificare, e comparare
in modo simultaneo l’espressione dei singoli geni. Quindi solo con questo approccio
sarà possibile decifrare l’impianto regolativo delle reti geniche che
controllano non solo i vari aspetti e funzioni del singolo fenotipo ma capire
anche cosa effettivamente avviene in tante malattie la cui patologia rimane
ancora in tutto o in parte oscura.
Oggi, che conosciamo
la struttura dei singoli geni, dobbiamo capire se in un dato momento siano in
funzione o meno, ma capire anche ed interpretare la dinamica delle migliaia di
informazioni che ne derivano.
Infatti questo è il
problema che interessa moltissimo non solo ai genetisti ma a tutti i medici, i
biologi e tutti coloro che sono interessati a decifrare i più reconditi
meccanismi e rapporti riguardanti tutti gli esseri viventi sia del mondo
animale che vegetale. Ormai conosciamo esattamente la struttura dei geni di
migliaia di piante e animali, uomo compreso, ma ora vogliamo capire come,
quando e perché funzionano.
Abbiamo visto che,
fino a qualche anno fa si credeva che ogni gene codificasse un solo tipo di m
RNA e quindi, almeno teoricamente, una sola proteina ed attraverso di essa,
impartisse istruzioni alle strutture cellulari e quindi al metabolismo. Oggi
sappiamo invece che la realtà è molto più complessa perché ogni gene, con le
varianti, può codificare fra 3 e 20 proteine. Quindi per capire come i geni
funzionano bisogna arrivare alle proteine che essi esprimono e capire anche
come le varie proteine interagiscono fra di loro. Ne deriva che se è stato
molto importante studiare a fondo il genoma è ancora più importante studiare il
proteoma, ossia lo sconfinato mondo delle proteine che è molto più complesso,
anche perché non statico ma continuamente mutevole in un contesto di reti
dinamiche per la continua serie di interazioni che avvengono fra diloro per
effetto sia dei processi metabolici sia come risposta agli stimoli ambientali.
Infatti tutti gli
acidi nucleici sono costituiti da quattro basi, sono sempre idrofilici e di
carica negativa. Le proteine, invece, sono costituite da 20 aminoacidi, possono
essere sia idrofiliche o idrofobiche, e sono alcune acide ed altre basiche. Ne
consegue che, per poterci lavorare, si devono adoperare diversi tipi di
soluzioni. Poi le proteine hanno una struttura terziaria con gruppi attivi che
ne caratterizzano le funzioni individuali e, quindi, mentre il DNA è molto
stabile, alcune proteine sono in genere molto delicate per cui possono essere
denaturate da sbalzi di temperatura o umidità dell' ambiente. Solo gli
anticorpi, che per fortuna sono largamente usati per la produzione dei
microarray come molecole di cattura, sono molecole proteiche piuttosto robuste.
Queste maggiori
difficoltà hanno reso piuttosto difficile il trasferimento delle tecnologie
usate per produrre i microarray con DNA alla produzione dei microarray con
spots di proteine.
C'è poi un altro
aspetto che ha reso più difficile ancora tale trasferimento: mentre i geni
umani, che sono il caso limite, sono circa 30.000, si ritiene, che nel corpo
umano, dato che si possono trovare numerose varianti delle singole proteine, il
numero complessivo di strutture proteiche diverse del proteoma possa arrivare a
circa un milione.
Comunque l'interesse
per allestire microarray per le proteine è enorme sia perché le varie attività
cellulari sono prevalentemente realizzate attraverso interreazioni fra proteine
sia perché la maggior parte dei farmaci esercitano i loro effetti reagendo con
le proteine.
I primi esperimenti
ben riusciti con le proteine sono quelli di Silzel ( 1998 ) che allestì, su un
film di polistirene, degli spots di 200 micron con anticorpi monoclonali e
dimostrò che le reazioni con le proteine del mieloma erano dose dipendenti.
La qualità delle
superfici ha un' importanza enorme nella produzione di microarray che possano
essere usati per eseguire delle analisi ed ottenere risultati riproducibili.
Infatti le superfici dei vetrini che si adoperano giocano un ruolo
importantissimo nel determinare non solo come le molecole probe ci si attaccano
ma anche per far si che le reazioni che ci si svolgono, possano evolvere senza
problemi o inconvenienti.
Riteniamo pertanto
utile elencare le qualità essenziali che microarray ideali dovrebbero avere per
poter operare bene:
Dimensione
L'ampiezza delle
superfici operative dipendono ovviamente dalle dimensioni del supporto. Come
già abbiamo accennato, attualmente si preferisce operare su vetrini
portaoggetto le cui dimensioni ottimali sono in larghezza, lunghezza e spessore
25-76-
Tale dimensione
standard facilita sia l'automazione della produzione che tutte le fasi
operative di utilizzazione che si concludono con la lettura dei risultati.
Liscia
La superficie di
lettura deve essere omogenea e liscia. Non sono accettabili irregolarità in
eccesso o in difetto superiori ai 10 micron. Infatti se la superficie non è
omogenea il diametro e la fissazione dei probes o spots non può risultare
uniforme né si riesce ad ottener una regolarità delle distanze fra un probe e
quelli vicini. Irregolarità della superficie possono creare problemi anche in fase
di lettura perché alcuni lettori hanno una profondità focale che non supera i
20-30 micron
Planare
Tutta la superficie di
25-
Occorre rendersi conto
che lo stesso numero di molecole se disposte su un vetrino che non sia
perfettamente in piano o non sia liscio producono un segnale di intensità
variabile.
Uniforme
L'uniformità dipende
dalla regolarità sia atomica che molecolare del trattamento utilizzato per rendere
la superficie reattiva. Una superficie si può considerare uniforme se le
eventuali variazioni di densità dello strato reattivo non risultino superiori o
inferiori del 25%
Lo strato. reattivo è
costituito da un monostrato, di solito di organosilani, che sono molecole che
stabiliscono un legame covalente con il supporto che, in genere è vetro. Su
questo strato poi va creato un film di acrilamide, polilisina, o nitrocellulosa
che sono molecole capaci di legare i singoli elementi analitici.
Nel complesso, quindi,
l'uniformità della superficie è molto importante per poter avere microarray
affidabili perché capaci di generare segnali che non varino d'intensità per
ragioni che nulla hanno a che fare con la specificità della reazione.
Stabile
La produzione va
curata in modo da ottenere prodotti che, nel periodo di validità che, secondo i
tipi può essere variabile, decadano meno del 10%. Devono essere prodotti molto
stabili, considerando anche che le tecniche di utilizzazione possono essere
diversissime e che alcune utilizzano anche temperature elevate.
Inerte
Premesso che il tipo
di vetro che si sceglie deve essere perfettamente trasparente, anche i
trattamenti a cui lo si sottopone per poterci fissare poi sopra le molecole
dello spot, non devono compromettere tale trasparenza più di un certo livello
standard. Inoltre il tutto non deve presentare fluorescenza anomala né avere
effetto deviante sulla luce.
Efficiente
La capacità di legame,
che va misurata empiricamente da caso a caso, deve essere tale da rendere possibile
la più bassa concentrazione possibile dei reagenti sia perché sono, di solito,
molto cari sia perché cosi si ottiene la massima efficienza. Per esempio
vediamo che, quando si adoperano oligonucleotidi quali molecole spot, la
concentrazione ottimale è di 30 µM, e da tale concentrazione non è
consigliabile derogare, in eccesso o in difetto, più del 30%.
I primi tentativi di
fissare biomolecole su membrane di nylon o cellulosa, eseguiti nel trascorso
decennio, puntando all' adsorbimento elettrostatico, hanno portato a risultati
molto scadenti. Lo stesso è successo utilizzando superfici a base di
poliacrilamide.
I primi risultati
accettabili si sono avuti ricoprendo le superfici con del destrano
carbossilmodificato.
I trattamenti chimici
delle superfici attualmente più usati per gli acidi nucleici sono a base di:
Organosilani: sono
composti che contengono atomi di silicio che si sono dimostrati molto validi
per legare molecole organiche a superfici di vetro.
Esteri del silicio: sono
una sottofamiglia dei precedenti caratterizzati dalla presenza di un atomo di
ossigeno fra il silicio ed il carbonio. Uno dei più rappresentativi è il
trietilmetoxil silano.
Amine primarie: nel
gruppo amminico un atomo di azoto è legato direttamente ad un gruppo organico.
Amine alifatiche: il
gruppo amminico è legato ad una catena di idrocarboni. n legame che si crea con
le biomolecole, in questo caso, è di tipo elettrostatico e quindi si realizza
un semplice assorbimento.
Aldeidi: permettono di
realizzare un legame covalente, e quindi più stabile, ma disturbano la
fluorescenza con un discreto rumore di fondo ovviamente aspecifico.
Le molecole utilizzate
per fissare alle superfici gli acidi nucleici sono state utilizzate con
discreto successo anche per le proteine. Ma oltre a queste, per poter
realizzare un migliore e più regolare orientamento delle biomolecole da legare,
che per le proteine è molto importante, sono stati utilizzati anche altri
trattamenti di cui ricordiamo i seguenti:
Metalli come il nichel,
adoperato per studiare il proteoma dei lieviti, ma che si dissociano
facilmente, specialmente se si adoperano soluzioni che contengono EDTA.
Streptavidina:
permette di creare il legame biotina-avidina, che è uno dei legami più stabili
fra quelli non covalenti.
Ancora migliori si
sono dimostrati i trattamenti delle superfici che creano anche un effetto da
profondità che genera un legame migliore perché tridimensionale. Ricordiamo i
seguenti:
Nitrocellulosa che
praticamente è un polimero a base di glucosio nitrato.
Agarosio che funziona
abbastanza bene ed è di facile preparazione.
Polimeri di vario
genere.
La pubblicazione che
descrive le prime analisi eseguite con i microarray (Schena et al. 1995 ), usa
il termine " target" per descrivere il DNA ( prodotto con la PCR )
attaccato al substrato, e il termine " probe " per descrivere il
campione mRNA stratificato poi sopra ed in grado di interagire. Nella
letteratura che è seguita, non tutta la comunità scientifica ha utilizzato gli stessi
termini, anzi li ha invertiti, per cui ne è derivata una certa confusione.
Molti, per esempio preferiscono il termine spot per indicare la molecola di
cattura. Noi ci adegueremo alla tendenza attualmente più diffusa che è quella
di chiamare probe o spot la molecola di cattura fissata al substrato che
riveste la superficie del vetrino e target la molecola da catturare presente
nel campione.
Gli acidi nucleici
sono il tipo di probe più comune adoperato finora, ma, come riportiamo in
seguito, molte altre molecole o materiali anche complessi, possono essere
fissati sui vetrini per produrre microarray quali enzimi, anticorpi.
carboidrati, lipidi. virus, batteri, cellule vegetali, cellule animali,
estratti proteici, composti inorganici ecc. Spesso ci si legano materiali già
preparati ma, in alcuni casi si preferisce realizzare delle molecole con
sintesi attuate in loco. Praticamente ogni tipo di molecola, se già preparata,
può essere usata come probe o microspot mentre, talora, si preferisce eseguire
delle sintesi in loco solo per gli oligonucleotidi e per. taluni peptidi.
Prodotti da PCR (
Polymerase Chain Reaction ).
I primi esperimenti di
analisi eseguite con i microarray sono stati realizzati usando probe preparati
con la PCR noti come cDNAmicroarrays e long-oligoarrays quando si tratta di
oligo di una certa lunghezza.. Mediante tale processo di sintesi automatizzata
si possono produrre microgrammi di qualsiasi segmento di DNA che interessi e di
qualsiasi tipo di organismo, inclusi batteri, funghi, piante e animali.Tali
prodotti ottenuti con la PCR vanno poi purificati per allontanare i primers e
gli enzimi che influirebbero negativamente sulle ibridazioni causando
interferenza.
I prodotti da PCR sono
generati utilizzando sia primers comuni sia primers specifici per determinati
geni. Nella produzione dei microarray si utilizzano tutti e due i tipi.
Con una coppia di
primers comuni è possibile amplificare migliaia di elementi target utilizzabili
per la produzione di microarray. Infatti una coppia di primers comuni permette
di amplificare diversi tipi di sequenze con lo stesso grado di efficienza,
perché i primers sono ottimizzati per legarsi ad alta efficienza alle sequenze
del vettore che è costituito da un plasmide o qualsiasi molecola trasportatrice
di un inserto di DNA. All'uso di primers comuni consegue un piccolo
inconveniente perché porta alla realizzazione di probe che sono contaminati da
piccole quantità di sequenze del vettore. E' importante quindi la selezione dei
primers, scegliendo quelli che interferiscano meno.
I primers gene
specifici sono utilizzati per ottenere un unico elemento probe. Sono quindi
preferibili perché non inseriscono sequenze contaminanti, ma tutta l'operazione
costa molto di più. Per averne un' idea basti pensare che per amplificare i
6000 geni del Saccaromyces cerevisiae ne occorrono 12000.
I prodotti da PCR
hanno il vantaggio di essere di dimensioni relativamente grandi ( 500-5000 paia
di basi) e quindi forniscono un materiale ampiamente complementare per la
successiva ibridazione, generando un materiale in grado di emettere un
apprezzabile segnale fluorescente praticamente in ogni tipo di esperimento.
Quindi questa tecnologia è largamente utilizzata in ogni tipo di laboratorio
convenzionale anche perché il costo del materiale che se ne ottiene è di gran
lunga inferiore rispetto a quello che deriva da sintesi di oligonucleotidi.
Lo svantaggio dei
prodotti da PCR è dato dal fatto che sono a doppia elica e quindi per poter
essere utilizzati in reazioni di ibridazione sui microarray devono esser prima
denaturati mediante ebollizione per qualche minuto. Ne deriva il fatto che,
siccome le due catene tendono a fondersi di nuovo, si realizza sempre un
materiale contaminato da molecole che non possono ibridizzare e questo disturba
l'espletamento della reazione, riducendo il segnale.
Un secondo
inconveniente è dato dal fatto che danno luogo a spots di dimensioni notevoli e
quindi possono generare l'inconveniente di causare ibridazioni crociate quando
si studino geni che abbiano considerevoli identità di sequenze ( oltre il 70%
pari a migliaia di nucleotidi ).
Oligonucleotidi
Gli oligonucleotidi
sono corte catene singole di DNA o di RNA. e presentano dei vantaggi per la
produzione dei microarray rispetto a quelli realizzati con DNA in quanto non
richiedono né l’uso di batteri né l’amplificazione del clone.
Ne risulta che,
essendo ridotti i problemi di contaminazione, non risulta essere necessario il
controllo delle sequenze. Sono utilizzati largamente, come molecole di cattura,
anche nella produzione dei microarray sia prodotti a parte, e poi legati sul
supporto, sia sintetizzati direttamente in loco con la fosforamidite. La
sintesi in loco è da taluni preferita per produrre probe con non più di 25
nucleotidi, mentre, se prodotti a parte, si può arrivare anche a 120
nucleotidi.
Per quanto riguarda il
genoma umano oggi è possibile acquisire facilmente la serie completa delle
sequenze del DNA ( www,nebi.nlm.nih.gov/ ) e quindi ci si può produrre, in
maniera molto specifica, qualsiasi tipo di sequenza e questo ovviamente
determina un indubbio vantaggio per la produzione di probe rispetto a quelli
ottenibili utilizzando i prodotti da PCR. C'è lo svantaggio, con gli
oligonucleotidi, che, almeno con certi tipi di campioni, si ha un segnale
fluorescente più debole. E, comunque, quando, non sono note le sequenze, non
conviene utilizzarli.
Le proteine sono
considerate le più importanti strutture cellulari per il continuo ed intenso
lavoro che svolgono sia in stato di benessere che in corso di malattia. A
differenza del genoma che è costituito da un numero fisso di geni, il livello a
cui le proteine cellulari operano è molto dinamico perché le proteine,
direttamente sottoposte a tutti gli stimoli dell'ambiente vanno incontro a
continue variazioni di adattamento e risposta. Ecco perché è molto difficile
determinarne accuratamente l'esatto numero o le quantità presenti nelle cellule
viventi. Inoltre le varie famiglie di proteine sono estremamente diverse fra
loro sia per le dimensioni delle molecole, sia per la struttura, che per le
caratteristiche chimiche e le funzioni.
Negli ultimi anni, la
tecnologia dei microarray, messa a punto per studiare gli acidi nucleici, si è
andata espandendo per analizzare meglio il proteoma delle cellule e le
interreazioni che avvengono fra le diverse proteine e fra queste e l' ambiente
esterno, che sono molto importanti nel determinismo delle malattie e le cui
conoscenze certamente faciliteranno la messa a punto di nuovi farmaci.
Abbiamo già riferito
che il primo tentativo ben riuscito di allestimento di microarray con proteine
è stato realizzato utilizzando degli anticorpi. Ebbene riteniamo che l'uso dei
microarray con anticorpi permetterà, nei prossimi anni di mettere a punto
numerosi nuovi farmaci dato che, ormai, nel mondo sono allo studio alcune
decine di anticorpi monoclonali umanizzati che potrebbero superare sia la
sperimentazione di laboratorio che, almeno alcuni, le prove cliniche.
Poi il sequenziamento
di tutto il genoma umano ha aumentato enormemente il numero di molecole che
oggi sono considerate determinanti nella patogenesi di varie forme morbose.
Siamo pertanto convinti che certamente, alcune di queste, diventeranno
bersaglio di nuovi farmaci la cui individuazione e dosaggio sarà certamente
agevolata studiando tali interreazioni con i microarray.
Comunque i microarray
con proteine, oltre che in campo terapeutico, possono trovare sempre più ampia
applicazione in campo diagnostico specialmente per le malattie infettive di
origine virale. Infatti attualmente i metodi più largamente usati per
individuare agenti patogeni virali in campioni biologici, sono quelli che si
basano sull'immunoenzimatica eseguita in piastrine o su la PCR. Ma i primi hanno
una sensibilità che oscilla fra il 70 e 90% ed i secondi hanno un costo elevato
che ne limita la diffusione su larga scala specialmente in nazioni del terzo
mondo che poi sarebbero quelle che ne avrebbero più necessità.
Si ritiene pertanto
che, probabilmente, i microarray potranno assolvere meglio a tale funzione
perché, dato i ridottissimi volumi necessari dei reattivi, alla fine dovranno
costare meno. Le stesse considerazioni valgono per altri settori della
diagnostica quali l'allergia, le malattie autoimmuni, i markers tumorali ecc.
Per la preparazione di
microarray dedicati specificamente, le proteine da usare come probe, che
qualcuno preferisce chiamare " protein chip " o semplicemente "
chip ", possono essere derivate da estratti cellulari oppure sintetizzate
mettendo insieme dei peptidi sintetici. Le proteine possono anche essere
prodotte in colture di batteri, lieviti, cellule ingegnerizzate di insetti.
Tali proteine ricombinanti, sono poi purificate con tecniche diverse e possono
diventare un ottimo materiale da immobilizzare sui vetrini come molecole di
cattura.
I metodi per fissare
le proteine sui supporti sono fondamentalmente simili a quelli utilizzati per
gli acidi nucleici. Come vedremo, però, produrre microarray con le proteine
offre qualche difficoltà in più. Infatti, come primo inconveniente c'è il
problema che le proteine sono molto meno stabili degli acidi nucleici perché
vanno incontro spesso a processi di ossidazione e di denaturazione. Poi le
proteine, quando sono rimosse dal loro ambiente naturale, modificano la loro
struttura nativa e quindi anche la forma, talvolta esponendo all'esterno
aminoacidi diversi da quelli della forma nativa. Ne deriva che, quando le si va
a far reagire, questi aminoacidi esterni, che costituiscono gli epitopi più
esposti, possono pregiudicare il risultato della reazione.
Comunque sono stati
studiati diversi tipi di microarray per le proteine che Dev Kambhampati, nella
sua interessantissima monografia (2004), suddivide così:
Le cellule sono le
unità fondamentali dei tessuti di tutti gli organismi viventi sia da un punto
di vista strutturale che funzionale. La cellula è una entità microscopica ma
estremamente complessa che contiene una mescolanza eterogenea di sostanze
essenziali per la vita.
Nella cellula troviamo
una serie di strutture e di compartimenti, di cui il più importante, difatti è
il più protetto, è il nucleo. Una membrana infatti avvolge il nucleo in modo
che resti immerso ma separato dal citoplasma, che costituisce il resto e la
parte più esterna della cellula e che, a sua volta è avvolto dalla membrana
cellulare. Il nucleo contiene il lunghissimo filamento di DNA, su cui sono
dislocati i geni, che nella cellula agiscono come il programma di un computer.
Ora, con l'aiuto dei
microarray, è da poco iniziato lo studio riguardante le modalità di espressione
dei geni nei diversi tessuti a cominciare, per l'uomo, dalle strutture del
cervello, fegato, prostata, polmoni ecc. Si cerca di integrare quello che già
riusciamo a sapere grazie all'istologia e la biochimica con la comprensione di
come e quando i vari geni si attivino nei diversi organi e tessuti sia in
condizioni di normale attività che nel corso di vari processi patologici.
E' merito della
Cellomics Inc. di Pittsburgh di aver messo in commercio i primi microarray, The
Cell Chip, allestiti anche con cellule viventi.
Sono molto importanti
per la preparazione dei probes sia per gli acidi nucleici che per le proteine
perché devono rendere possibile un efficiente ancoraggio delle molecole di
cattura o microspot stabili ed uniformi, senza nessuna sbavatura ed esaltare la
visibilità dello spot. Inoltre, quando si tratta di proteine, ridurre le
conseguenze dell'essiccamento ed evitare la denaturazione.
I tamponi hanno,
quindi, una notevole importanza nel determinare l'efficienza di deposizione del
probe sul supporto solido. Si deve formare un microscopico menisco omogeneo
nella forma, a contorni netti e perfettamente aderente. Per aumentare
l'efficienza di contatto si cerca di utilizzare miscele saline piuttosto
viscose perché la viscosità aumenta le forze di contatto.
I tamponi hanno anche
una grande influenza nel determinare l'intensità del segnale, che deve essere
colorato, fluorescente o chemiluminescente, ma senza interferenze da parte dei
cristalli della soluzione salina..
Nelle soluzioni
acquose, il cui principale ingrediente è ovviamente l’acqua. le forze coesive
di legame sono dovute all'idrogeno. I tamponi con molti legami idrogeno
producono goccioline o spot più piccoli. Soluzioni contenenti basi, alcool o
solventi hanno legami idrogeno più deboli e quindi portano alla formazione di
goccioline o spot più larghi che possono più facilmente causare fusioni di spot
da sbavature.
La forma e la
grandezza dello spot sono anche determinate però dalle caratteristiche della
superficie del supporto solido. Infatti superfici idrofobiche, che si
realizzano in presenza per es. di aldeidi, producono spot più piccoli di quelli
che si formano su superfici idrofiliche per la presenza di amine.
Un buon tampone deve
anche accrescere la stabilità delle molecole del probe. Tale qualità è
particolarmente importante per i microarray di proteine perché i relativi
polipeptidi sono piuttosto instabili.
Pertanto i tamponi per
la preparazione dei microarray di proteine talvolta contengono il glicerolo o
altri additivi in grado di accrescere la stabilità del prodotto finale perché
evitano la disidratazione totale.
Per la stessa funzione
i tamponi per i microarray per gli acidi nucleici contengono DMSO
(dimetilsulfossido ).
I targets sono i
campioni da fare interagire. Anche questi devono essere in qualche modo
preparati. Per quanto riguarda gli acidi nucleici, spesso occorre fare in modo
che il segnale venga amplificato. In tutti i casi, sia per gli acidi nucleici
come per le proteine poi è necessario legarli ad una molecola rivelatrice che,
per lo più, finora è stato un colore fluorescente.
Il legame con la
molecola fluorescente può essere covalente e diretto oppure non covalente ed
indiretto, quando si usano anticorpi, dendrimeri o altre molecole interposte.
Campioni con acidi nucleici
La preparazione dei
campioni con acidi nucleici utilizza procedure diverse, che variano secondo i
casi. Sono tutte abbastanza complesse per cui preferiamo tabularle cosi come
sono riferite da Schena ( 2002 ).
|
Criteri |
Trascrizione Inversa |
RNA Polimerasi |
Procedura Eberwine |
TSA |
Dendrimeri |
|
Tipo indiretta |
diretta |
diret. o indiret |
diretta indiretta |
|
|
|
Template -DNA |
RNA |
DNA doppia elica e
promotore |
DNA doppia elica e
promot |
RNA o DNA con
piccola molecola di legame |
RNA o DNA in
dendrimeri |
|
Prodotto
oligonucleotide |
T3 o T7 nucleotide |
T7 RNA polim
nucleotide |
nucleotide |
nucleotide |
nucleotide |
|
Reattivo
oligonucleotide fluorescente modificato |
modificato |
modificato o
anticorpo coniugato TSA |
modificato |
modificato |
modificato o
dendrimero |
|
Interazione |
Ibridazione |
Ibridazione o
piccolo anticorpo |
Ibridazione |
piccolo anticorpo |
Ibridazione |
|
Amplificazione |
nessuna |
|
100-1.000.000 |
100 |
10-350 |
|
Tipo di amplific |
nulla |
nulla, enzim o
passiva |
passiva aumento
quantità RNA |
enzimatica |
passiva |
|
Colore fluorescente |
Cianina |
Cianina |
qualsiasi |
Cianina |
Cianina |
|
BIODIP |
Alexa |
|
|
|
Alexa |
|
Processo |
nulla |
fino a 3 ore |
nulla ma
l'amplificazione del RNA diversi giorni |
3 ore |
3 ore |
Riteniamo utile completare
quanto riferito nella su esposta tabella con qualche altro dato che può
risultare utile per interpretarla:
Trascrizione inversa
E' stato il metodo
utilizzato nei primi esperimenti con i microarray. Da questo metodo base sono
poi derivate numerose varianti. usando sia RNA cellulari, che sono molto più
facili da ottenere, che mRNA. Sono state anche utilizzati diversi tipi di
trascriptasi inverse e diversi metodi di purificazione dei campioni.
Il principale
vantaggio di questo metodo è dato dalla coniugazione diretta che elimina i
trattamenti da fare dopo l'ibridazione, che sono sempre ardui e richiedono
molto tempo per essere espletati.
Lo svantaggio maggiore
è data dal fatto che si ottiene un segnale molto meno evidente di quello che si
ha con l'approccio indiretto che si giova dell' effetto dell' amplificazione.
RNA polimerasi
Questo, oltre alle
trascriptasi inverse è un altro gruppo di enzimi largamente usati per preparare
campioni per microarray. Si tratta di una famiglia di enzimi estratti da virus
batterici ( T3 e T7 ), che catalizzano la sintesi del RNA partendo da un DNA a
doppia elica, grazie all'azione di promotori specifici. Si tratta di un
processo robusto e ad alta resa che da la possibilità di produrre quantità
notevoli di RNA, che poi può essere diviso facilmente in piccoli frammenti a
livello di oligonucleotidi con possibilità di amplificazione del segnale anche
di 100 volte.
Bisogna solo stare
molto attenti ad evitare l'azione delle ribonucleasi che attaccano facilmente
le molecole di RNA. Si consiglia quindi di operare in stanze molto ben pulite,
utilizzare guanti di gomma sintetica e, ovviamente, essere certi che reattivi e
tamponi siano assolutamente privi di ribonucleasi.
Procedura Eberwine
Si tratta di un metodo
molto ingegnoso che si basa sull'uso della RNA polimerasi da T7, che converte
mRNA in cDNA con amplificazione, che per ogni procedura è di circa 100 volte e
che, alla fine, può arrivare fino a 1.000.000 volte rispetto al materiale di
partenza. Pertanto questo è il metodo preferito quando si devono risolvere
particolari problemi biologici che non si possono risolvere con altri metodi.
Lo svantaggio di
questo metodo è che è piuttosto arduo e lungo. Infatti occorrono 2-3 giorni per
completarlo e poi si attua attraverso manipolazioni durante le quali non si
riesce a seguire cosa stia succedendo, per cui, se ci sono interferenze da
reagenti inattivi o da contaminazioni da ribonucleasi, lo si capisce solo alla
fine, di fronte a risultati inattesi.
Amplificazione del segnale da
tiramide ( TSA )
La tiramide, in questa
procedura, ha la funzione di potenziare il segnale di varie sostanze
fluorescenti, come la fluoresceina, la cianina 3 o la cianina 5, per cui si
possono realizzare reazioni che portano alla formazione di colori diversi.
La trascriptasi
inversa è usata per incorporare la biotina o il dinitrofenolo al cDNA, che poi
viene ibridizzato su un microarray ed incubato con un anticorpo coniugato alla
perossidasi. Il chip, così composto, è trattato con acqua ossigenata per cui la
perossidasi ossida il segnale fluorescente della tiramide. Ne deriva un segnale
fluorescente molto intenso, fino a 100 volte. E' un segnale, però, che ha
un'emivita molto breve.
Dendrimeri
Il termine dendrimero
deriva dalle parole greche “dendron” e “meros” che significano rispettivamente
“albero” e “parte”. Infatti sono costituiti da ordinati grovigli di monomeri di
oligonucleotidi che ricordano la chioma di alberi e che si formano, per
processi di sintesi progressivi, anellandosi gli uni agli altri attraverso
cicli progressivi che possono arrivare a formare anche molecole di DNA aventi
un PM di 12000 e contenenti 36000 basi. Le singole molecole fluorescenti
attaccate alle numerose estremità sporgenti o braccia del polimero determinano
la comparsa di un segnale fluorescente molto intenso. Un polimero con 300
molecole di colore produce un segnale 300 volte più intenso. Ne deriva che
polimeri aventi un diametro di 0,2 micron si vedono anche ad occhio nudo. Nel
complesso è una tecnica che, anche se non facile da eseguire, presenta molti
vantaggi.
Campioni con proteine
Le proteine, usate
come targets, hanno una storia più recente e, quindi, si può dire, che si
tratta di una tecnologia che è ancora agli albori, ma le prospettive sono
enormi perché nella maggior parte delle malattie si verifica un'alterazione
delle proteine e delle reazioni proteine-proteine. Inoltre la maggior parte dei
farmaci interagisce con le proteine cellulari. Quindi sono le proteine, non i
geni, i veri obiettivi della medicina.
Pertanto, da qualche
anno, si è cominciato a preparare targets con proteine fluorescenti per
approfondire fondamentali problemi di biochimica delle proteine.
Il reattivo
fluorescente finora più utilizzato è stato l'isotiocianato di fluoresceina, che
si lega molto facilmente agli aminoacidi lisina ed arginina, che sono presenti
sulla superficie della maggior parte delle proteine estratte da animali, piante
e microrganismi. La coniugazione di 50 microgrammi di isotiocianato ad 1 mg di
proteina da luogo ad un segnale fluorescente sufficientemente evidente.
I reattivi del gruppo
della cianina, anche, si legano facilmente alla lisina ed alla arginina e ,
quindi, per lo stesso scopo vengono utilizzati con successo.
Un altro reattivo
fluorescente usato per le proteine è la ficoeritrina. Il procedimento, in
questo caso, è più indaginoso perché tale prodotto va pretrattato con la
succinimide ed anche la proteina, prima della coniugazione va attivata con il
ditiotereitolo, per creare gruppi sulfidrilici.
Lavorare con i microarray
è un'attività fine e sofisticata che non si può svolgere dovunque. Pertanto,
specialmente per la produzione, occorrono ambienti ad aria pressurizzata e a
contaminazione controllata. Sono preferiti i filtri laminari verticali a
soffitto che sono più funzionali e non tolgono spazio laterale.
Tale tecnologia ha le
sue radici sia nell'uso che se ne è fatto in microbiologia sia nell'industria
dei semiconduttori, che ha le stesse esigenze per la lavorazione delle lamine
di silicio, utilizzate per la produzione dei computer.
Infatti ci sono cinque
forme di contaminazione ambientale: contaminazione da particelle, biologica,
chimica, termica ed elettrostatica.
Contaminazione da particelle
Si considera essere particella
ogni forma di detrito esistente nell'aria il cui rapporto fra lunghezza e
larghezza non sia superiore di 10: 1. Le particelle più comuni derivano da
polvere, forfora, garza, spore, pollini, funghi e batteri. Sono considerati
invece fibre i detriti più lunghi. La contaminazione può avere origine dalle
strutture dell' ambiente o dalle attrezzature che si adoperano ma spesso c'è
una notevole componente che ha origine umana e specialmente dalle persone che
ci lavorano dentro.
Per quanto riguarda
l'ambiente bisogna considerare almeno tre condizioni o fasi diverse: ambienti
in fase di avvio. ambienti operativi, ambienti in fase di riposo.
Ambienti in fase di avvio
Riguarda la fase
seguente la costruzione e dopo che sono stati introdotti tutti gli apparecchi,
possibilmente nuovi, perché contaminano meno, e solo le attrezzature necessarie
alla lavorazione. Non ci deve essere altro. Dato il grande movimento che c'è
stato, certamente sarà presente una contaminazione di livello molto elevato.
Prima di poter utilizzare un ambiente del genere bisogna, dopo le opportune
pulizie e disinfezioni, far trascorrere almeno una settimana di continuo
funzionamento dei sistemi di filtrazione dell'aria e di decontaminazione per
poter sperare che la concentrazione delle particelle abbia raggiunto un livello
accettabile.
In base agli standard
federali americani, gli ambienti a contaminazione controllata sono stati
suddivisi in classi, in base al numero di particelle presenti di diametro
maggiore di 0,5 micron. La classifica degli ambienti può essere fatta in base
alla seguente tabella:
|
Tipo |
Numero di particelle
per piede cubico |
|
Classe 1 |
1 |
|
Classe 10 |
l0 |
|
Classe 100 |
100 |
|
Classe 1.000 |
1.000 |
|
Classe 10.000 |
10.000 |
|
Classe 100.000 |
100.000 |
|
Laboratori di
ricerca 20.000 |
200.000 |
|
Aria di città
5.000.000 |
500.000.000 |
Quindi, dato che le
particelle di polvere possono creare una fluorescenza di fondo sui vetrini, o
comunque delle immagini alterate oltre che, come abbiamo accennato, alterare la
composizione dello spot, per la presenza di enzimi, è vivamente raccomandato
che gli ambiente in cui si trattano i vetrini con i substrati o si
distribuiscono gli spots siano di classe 1000 o, ancora meglio, di classe 100.
Ambienti in fase operativa
Sono quelli in cui è
stata avviata l'attività e si svolge il lavoro che implica ingresso e
spostamenti di persone e cose che vengono dall' ambiente esterno e, quindi,
portano nuova contaminazione nell'aria protetta e, in precedenza,
decontaminata.
Anche in questi
ambienti, ovviamente, la concentrazione delle particelle deve rientrare nei
limiti surriferiti per poter fare un buon lavoro. Sorge il problema di decidere
quando eseguire le misurazioni della concentrazione delle particelle.
Attualmente prevale la tesi di eseguire le misurazioni sia durante l'attività
che alla fine del lavoro, ossia quando gli ambienti sono in fase di riposo, e
di farne poi la media. Le due conte dovrebbero dare risultati abbastanza simili
ma, comunque, la contaminazione, in assenza di personale, dare una
concentrazione più bassa perché, certamente, la contaminazione umana è una
componente importante. Infatti si sa che ogni persona può generare 1.000.000 di
particelle ogni ora, e quindi far si che rapidamente si creino le condizioni
che portino a superare la concentrazione limite.
Per ovviare o ridurre
tale grave componente di contaminazione, il personale addetto ad operare con i
macroarray, specialmente se si tratta della produzione, è bene che faccia la
doccia prima di entrare nell'ambiente di lavoro e lasci fuori gli effetti
personali quali orologio, gioielli, cosmetici ecc. Deve poi, in una prestanza
attrezzata, indossare camici completi nel senso che comprendano in un unico
pezzo anche la copertura dei piedi, dopo aver lasciato le scarpe e indossato
pantofole, e del capo, e siano di polietilene o di materiale, comunque,
assolutamente, chimicamente inerte. Deve inoltre coprire la bocca ed il naso
con una mascherina ed infilare guanti elastici monouso e del tipo di gomma
sintetica e senza polvere.
Alcuni operatori, per
abbassare al minimo la concentrazione di particelle, utilizzano negli ambienti
in cui già entra, a pressione, solo aria opportunamente filtrata, anche altri
superfiltri portatili supplementari dotati di lamine filtranti di tipo ULPA (
ultra high efficiency particulate air ), che hanno un'efficienza del 99.999%,
invece dei soliti HEPA ( high efficiency particulate air ) che hanno un'
efficienza del 99.97%.
Poi è buona regola che
i pavimenti, almeno ogni 30 giorni, siano lavati molto accuratamente con adatti
detersivi.
Contaminazione biologica
La contaminazione
biologica deriva dall'unto delle mani, da impronte digitali, capelli, saliva,
lacrime, o dal rinnovo delle cellule cutanee. Tutti questi contaminanti
contengono macromolecole e contaminanti di vario genere che possono
compromettere la qualità della risposta dei microarray. Notiamo specialmente la
presenza di lipidi, DNA, ribonucleasi ecc.
Ribadiamo, quindi,
che, appena entrati e prima di iniziare a lavorare, tutte e due le mani devono
essere ricoperte con guanti che è bene siano di gomma sintetica perché quelli
prodotti con gomma naturale contengono alte concentrazioni di proteine vegetali
che possono inquinare sia il materiale dei substrati che gli spots. Se si fanno
lavori che possano danneggiare i guanti, è bene infilare due paia di guanti,
l'uno sopra l'altro.
Si deve evitare in
questi ambienti di fare starnuti o colpi di tosse che causano l'emissione di un
elevato numero di goccioline di muco o saliva. In caso di necessità è bene che
il personale abbandoni l'area a contaminazione controllata e, prima di
rientrare, per riprendere il lavoro, indossi un nuovo camice ed un nuovo paio
di guanti.
Contaminazione chimica
Le più comuni fonti di
contaminazione chimica derivano da pitture, colle, adesivi e materiali per
imballaggio. Sono anche fortemente contaminanti apparecchiature che emettano
gas o vapori. Infatti bisogna tener presente che molti composti organici sono
fortemente reattivi ed alcuni sono anche altamente fluorescenti.
Per le stesse ragioni
il personale che lavora in questi ambienti non deve fare uso di acqua di
colonia, profumi, colluttori, tutti prodotti che tendono ad evaporare
facilmente. Deve essere anche proibito di introdurre cibi o masticare gomme.
Contaminazione termica
La temperatura
consigliata è di
Quindi i locali
adibiti a tali attività non dovrebbero contenere apparecchi come i frigoriferi,
i congelatori, le centrifughe, gli agitatori che sono fonti di calore a meno
che, all'atto della costruzione degli ambienti destinati a tale attività, non
se ne sia tenuto conto, calcolando un adeguato rinnovo d'aria oppure non si
immettano dei condizionatori ausiliari al fine di mantenere costantemente la
temperatura desiderata.
Contaminazione elettrostatica
La contaminazione
elettrostatica è generata da squilibri fra cariche elettriche positive e
negative. Le plastiche, le gomme, il cellofan ed altri prodotti possono creare
tali squilibri che possono favorire l'intrappolamento di molecole contaminanti
sui microarray in fase di produzione riducendone la qualità.
Siccome nella
costruzione e l'allestimento di tali ambienti a contaminazione controllata è
praticamente impossibile fare a meno di tali materiali, bisogna fare in modo
che il grado di umidità relativa non superi mai il 35-45%, perché, fino a
questi livelli, l'umidità assorbe tali cariche prevenendone l'accumulo. Bisogna
anche raccomandare al personale di non strofinare l'un l'altro questi
materiali, perché, se lo si fa, si crea squilibrio di cariche.
Bisogna poi curare
che, sia i substrati che i microarray completi, siano subito impacchettati in
appositi sacchetti di carta argentata anti contaminazione elettrostatica. Poi
bisogna raccomandare che l'apertura di queste confezioni sia fatta lentamente,
aiutandosi con le forbici e mai strappando.
Abbiamo elencato le
varie forme di contaminazione ambientale, che vanno tenute sotto stretto
controllo, ma, per quanto riguarda questi ambienti, ci sono altri aspetti
strutturali ed organizzativi anche molto importanti quali la temperatura,
l'umidità relativa, l'illuminazione e l'uniformità.
Temperatura
La temperatura ideale,
come abbiamo già riferito, è
Infatti questa è la
temperatura più confortevole per il personale ed è il livello a cui lavorano
meglio alcune apparecchiature come i robot. Il mantenere sempre la stessa
temperatura è importante anche per impedire fluttuazioni nella cinetica delle
reazioni chimiche.
Umidità relativa
La si valuta facendo
il rapporto fra l'umidità dell'ambiente ad una data temperatura e l'umidità
massima raggiungibile in quell'ambiente a quella temperatura ed a un certo
livello di pressione. Per tali lavorazioni è consigliata un'umidità relativa
del 40% con oscillazioni non superiori al 5%. Infatti livelli più elevati di
umidità possono influire sulla cinetica di alcuni processi che richiedono una
graduale disidratazione. Una fase particolare della produzione dei microarray è
quella che riguarda la distribuzione per contatto delle goccioline degli spots
che è bene si svolga ad un livello di umidità relativa del 55%. Per tale
ragione l'area in cui si svolge tale processo, e solo quella, deve essere
chiusa e condizionata per realizzare in loco le condizioni ottimali desiderate.
Una condizione opposta
si deve creare quando si deve legare il DNA alle amine o alle aldeidi. Sono
queste reazioni che è bene che si attuino ad un'umidità relativa inferiore al
20% e, quindi, facendo uso di una stufa a secco.
Illuminazione
Negli ambienti a
contaminazione controllata bisogna anche controllare sia l'intensità che la
qualità dell'illuminazione. E' consigliabile una sorgente luminosa da lampade
fluorescenti sia perché producono meno calore dei bulbi incandescenti sia
perché fanno una luce più bianca e fra queste bisogna preferire quelle a spettro totale che hanno un tipo di luce
molto simile a quella della luce solare. Infatti se si considera uguale a
Le lampade, che devono
essere completamente chiuse, vanno poi disposte in modo da dare un’
illuminazione uniforme che, come intensità, deve essere circa 4 W per piede
quadrato.
La produzione dei
microarray, per tutte le ragioni suesposte, è un tipo di lavorazione molto fine
che fra l'altro utilizza materiali spesso costosi. Va, quindi, studiata molto
bene per essere di qua1ità ed a costi contenuti perché possa essere utilizzata
da un numero sempre maggiore di laboratori.
In linea di massima un
vetrino con un gran numero di spots, ovviamente, vale di più di uno che ne
contenga di meno. Oggi praticamente è possibile produrre anche singoli vetrini
che contengono tutti i circa 30.000 geni umani, ma hanno, ovviamente, un costo
notevole.
Si tenderà quindi a
produrre microarray dedicati, nel senso che contengano solo alcune decine di
spots, o anche centinaia, ma preparati per risolvere un ben preciso problema
diagnostico o scientifico. Quindi la gamma dei tipi di prodotto che si potranno
fare è praticamente illimitata.
Facciamo seguire le
caratteristiche più importanti che tali prodotti devono avere per poi capire ed
interpretare meglio i vari metodi di produzione.
Densità
E' il criterio che
esprime la densità per unità di area ed è calcolata in base al numero di probes
o spots per centimetro quadrato. Si misura in base alla distanza o spazio
esistente fra due centri degli spots (center-to center spacing ), utilizzando
la seguente formula:
D = 100x ( 1000/CTC )
2
Questo significa che
un microarray che abbia una distanza da centro a centro di 140 micron, ha una
densità di 100 x ( 1000/ 140 ) 2 che è uguale a 5102 spots per cm quadrato.
Così un microarray che ha 1000 targets o spots in un'area di
La densità è una
caratteristica molto importante, perché, a parità di altri fattori, determina
la quantità di dati che si riescono a conoscere per unità di area. Comunque ci
sono microarray a bassa densità, che ovviamente sono più facili da produrre,
costano meno e si leggono anche con scanner molto semplici. I microarray con
densità più elevate, comprese fra 1000 e 10.000 possono essere prodotti e letti
solo con macchine più sofisticate e, naturalmente, costose.
C'è poi un'altra
considerazione da fare. Su molti vetrini o chips gli stessi spots sono ripetuti
più volte, per poi fare la media dei risultati. Ora un 25k microarray con 1250
spots ripetuti in duplicato ha un valore maggiore di un 25k che ha 25 spots
ripetuti 1000 volte.
Dimensione
E' il criterio che
esprime la grandezza fisica del singolo elemento o spot il cui diametro sia
espresso in micron. E' un criterio molto importante perché determina la
densità.
La maggior parte delle
apparecchiature, sia che lavorino a contatto o che lavorino non a contatto
rilasciano elementi o spots il cui diametro medio è compreso fra 75 e 300
micron. Quelle invece, la cui tecnologia si basa sui semiconduttori, rilasciano
elementi o spots di 10-40 micron. La distanza da centro a centro, per i
microarray prodotti a stampo, è calcolata moltiplicando la dimensione media per
un fattore 1.2-1.4. Per esempio la distanza di elementi da 110 micron è di
132-154 micron. Per i microarray preparati con fotolitografia o microspecchi
gli elementi sono praticamente contigui per cui la dimensione e la distanza
sono equivalenti.
Dato che più piccoli
sono i singoli elementi e maggiore è la densità e quindi maggiore è il numero
delle informazioni che ne possono derivare, la tecnologia è andata evolvendo
verso la produzione dI microarray a più elevata densità che ha costretto a
produrre lettori con poteri di risoluzione sempre più sofisticati.
Purezza.
Tale criterio si
riferisce alla omogeneità delle molecole presenti in ogni spot o elemento;
all'atto pratico non dovrebbe essere inferiore al 99%. La purezza è molto
importante perché determina la specificità della rea:l;ione biochimica che ne
deriva.
Deviazioni dal 100%
possono essere causate sia da impurità sia da errori umani sia da difetti di
distribuzione dovuti alle macchine. I contaminanti possono essere eliminati
curando sia i metodi di purificazione sia adottando le migliori procedure di
filtrazione dei materiali da usare per i target Insomma bisogna fare in modo da
evitare che, al momento dell'utilizzo, le molecole del probe interagiscano con
superfici imperfette, dando luogo a segnali aberranti.
Reattività
Un microarray ideale
dovrebbe avere il 100% delle molecole dei probes in grado di reagire con le
molecole dei targets praticamente, non è cosi. Per la maggior parte dei
microarray è molto probabile che sia decisamente più bassa la percentuale delle
molecole che reagiscano. Infatti la reattività può essere compromessa sia nel
corso della produzione sia nelle fasi di successive manipolazioni.
Perdita di reattività
dei microarray per le proteine o gli RNA può essere causata specialmente nel
corso della fase di essiccamento. Le molecole di DNA risultano essere più
resistenti.
Regolarità
Riguarda la regolarità
delle linee e delle colonne degli elementi o spots. Si misura determinando la
distanza di centro da centro ed è accettato un coefficiente di errore non
superiore al 10%. Questo significa che, se per esempio la distanza di centro da
centro è fissata a 140 micron, all'atto pratico ci potranno essere spots ad una
distanza compresa fra 126 e 154 micron da quelli adiacenti. Queste
oscillazioni, praticamente, si riverificano solo con le macchine che
distribuiscono a stampo perché, quando si usano quelle che si basano sulla
tecnologia dei semiconduttori, le linee e le colonne risultano essere molto
regolari.
Deviazioni dalla
regolarità sono in genere dovute ad irregolarità del substrato, derivanti da
aree idrofobiche che determinano forze locali che causano migrazioni delle
goccioline degli spots. Fenomeni analoghi, comunque, possono essere causati
anche da vibrazioni delle macchine che distribuiscono gli spots o anche
correnti d'aria nell' ambiente in cui operano.
Microarray irregolari
rendono difficile la lettura da parte degli scanner e sono causa di grossolani
errori.
Facilità d'uso
E' molto importante
realizzare prodotti che siano facilmente utilizzabili sin dal primo momento
anche da personale di laboratorio che non abbia ancora un'esperienza specifica.
Si tratta di un aspetto pratico non trascurabile perché può avere un impatto
commerciale tale da determinare il successo o meno del prodotto.
Rendimento
E', naturalmente un
aspetto molto importante delle macchine addette alla produzione ed esprime la
velocità, in un determinato tempo, con la quale queste riescono ad espletare
tutti i passaggi che sono necessari per condurre a termine le varie fasi di
produzione dei microarray sia anonimi che dedicati.
Descrivere le macchine
che si utilizzano per produrre i microarray esce un po' fuori dai limiti e
dagli intendimenti di questa sintetica monografIa. Tuttavia riteniamo che possa
essere utile averne un'idea. Se ne distinguono tre tipi: Macchine da contatto;
macchine che non richiedono contatto e macchine fotolitografiche.
Macchine da contatto
E' questo il tipo di
tecnologia più tradizionale ed è quello ancora più largamente utilizzato
specialmente da parte dei ricercatori. Si tratta di un gruppo abbastanza
articolato perché sono presenti sul mercato vari modelli che si differenziano principalmente
per il tipo di gocciolatore o meglio di spillo o pin.
C'è il modello cosi
detto " pin and ring " ossia spillo e anello, caratterizzato appunto
da un pin che fuori esce da un microanello che lo circonda e dall'interspazio
per capillarità scende lo spot che si deposita per contatto sul vetrino.
Un altro modello di
pin, " il micro spotting "che è forse il più noto, è quello che
contiene un sottilissimo canale verticale centrale che rende possibile la deposizione,
per semplice tensione superficiale, di microgocce omogenee, il cui volume, in
base al diametro del canale può essere regolato fra 0,25 e 0,60 microlitri e
che hanno un coefficiente di variazione sempre inferiore al 10%.
Un altro modello
ancora è lo " split pin" o spillo spaccato, che ha le caratteristiche
di una pinzetta fra le cui branche il liquido si ferma per la formazione di un
menisco e poi viene espulso sul vetrino.
Altre macchine ancora
utilizzano dei semplici tubi capillari che rilasciano lo spot per semplice
contatto. Questo sistema permette di fare un ottimo lavoro ma la pulizia e la
manutenzione fra i cicli di lavoro risultano difficili da attuare.
Macchine che non richiedono
contatto
Hanno qualcosa di
simile alle stampanti a colori a getto d'inchiostro in quanto utilizzano un
sistema piezoelettrico che si basa sulla proprietà che hanno dei cristalli di
ceramica, inseriti in tubicini flessibili, di deformarsi per il passaggio della
corrente, permettendo cosi la deposizione di goccioline calibrate.
Questa tecnologia è
utilizzata anche quando si voglia realizzare direttamente sul vetrino la
sintesi di oligonucleotidi. Si usano in questo caso macchine dotate di quattro
dispensatori che lavorano in parallelo dispensando ognuno una delle quattro
basi in base alla sequenza desiderata. Altre macchine dispensatrici di questo
tipo usano lo stesso principio delle stampanti della giapponese Canon che,
semplicemente innalzando la temperatura del liquido, lo rendono meno viscoso
permettendone la discesa sul vetrino.
Fotolitografia
Utilizza un tipo di
microtecnologia simile a quella che viene utilizzata per la produzione dei chip
dei computer e permette di realizzare direttamente sul supporto solido la
sintesi fotochimica ordinata e precisa di qualsiasi tipo di oligonucleotide di
tipo corto, ossia non superiore a 30 nucleotidi. Particolari maschere
fotolitografiche al cromo rendono possibile per frazioni di secondo il
passaggio o meno di raggi ultravioletti che colpiscono le microaree dove si
realizzano le sintesi. Si usano vetrini trattati sia con silani, che rendono la
superficie attiva verso i gruppi amminici, che di un altro prodotto
fotorimovibile noto come MeNOPC ossia
Ovviamente questa
tecnologia può essere usata solo per monitorare l'espressione genica, l'analisi
dei polimorfismi, l'analisi delle mutazioni geniche ed il sequenziamento del
DNA.
La distribuzione degli
spots è indubbiamente una delle fasi più delicate della produzione dei
microarray per cui il controllo di qualità è una fase molto importante del
processo. Le varie compagnie commerciali hanno risolto i problemi in vario
modo, sfruttando l’esperienza accumulata negli ultimi anni. Ma, malgrado l’uso
di robot, sempre più sofisticati, si ha un coefficiente di variabilità degli
spots che oscilla fra lo 0 ed il 22% ed
un C.V. medio del 6,8%.
Quando si esgue la
produzione dei microarray, e più esattamente, quando si utilizzano le macchine
che fanno lo “ spots printing ”, ovvero si depositano sui vetrini le goccioline
o spots dei probes, possono sorgere diversi problemi. Occasionalmente la
morfologia degli spots può risultare decisamente alterata nel senso che si
verificano delle sbavature perché il gocciolatore o pin è difettoso e lo si può
constatare osservandolo al microscopio. Altri ricercatori hanno avuto problemi
analoghi di alterata morfologia degli spots per disturbi di tensione che si
possono verificare sulle superfici dei vetrini specialmente quando si adoperano
tamponi a base di fosfati. Se si fa uso di tamponi a base di SSC, tali inconvenienti non si
verificano.
Altro aspetto della
tecnologia che bisogna curare per avere degli spots omogenei, è un adeguato
volume di campione presente nei pozzetti in cui il pin va a pescare prima di
depositare sui vetrini le goccioline o spots.
Un altro inconveniente
che, talvolta si può verificare è che il
DNA non si fissi bene sul vetrino per cui durante la fase di ibridazione, venga
lavato via. Dopo aver esguito la distribuzione degli spots, un controllo molto
semplice lo si può fare alitando sul vetrino in modo da formare sulla superfice
un sottile strato di vapore. Gli spots dove il DNA si è legato appaiono più
chiari. Altri preferiscono controllare il vetrino sotto il microscopio.
Ma un metodo
tecnicamente più corretto per valutare il lavoro fatto, che è da molti
adottato, è quello di colorare qualche vetrino con un colore fluorescente. Il
più usato per tale genere di controllo è il SybrGold della Molecular Probes.
Dop il lavaggio si fa il controllo con uno scanner al laser che permette di
valutare sia la morfologia che la quantità di DNA degli spots. Il vantaggio di
usare il SybrGold è dato dal fatto che, essendo un colorante non molto
invasivo, i vetrini si possono riusare. Quando si deve valutare l’attività dei
geni, si possono, a tal fine, inserire più geni per ogni singolo spot e poi,
decodificando l’espressione con metodi matematici, capire se il processo di
distribuzione è stato realizzato con una variabilità accettabile ( Khan et al.
2003).
Il principio base
dell’automazione sui microarray è lo stesso del Southern e del Nothern
bllotting con la differenza che i probes sono immobilizzati sul vetrino mentre
lo RNA cellulare è in fase liquida per cui alcuni hanno denominato i microarray
“ reversed phase Southern or Northern blotting assays”.
Molti ricercatori
eseguono ancora manualmente l’ibridazione ma è una manualità che richiede un
buon livello tecnico e molta pazienza. Inoltre, dato che i volumi dei target
sono molto piccoli così facendo, spesso succede che non si realizzi l’incontro
con il probe o che, data la lentezza delle procedure si comincino ad asciugare
i bordi, il che ha poi come conseguenza che si determini un aumento del rumore
di fondo che poi disturba la lettura finale.
D’altro canto il
numero dei potenziali utilizzatori dei vetrini da spottare è in rapido aumento,
come sta crescendo, molto rapidamente, il numero delle possibili applicazioni.
Diverse aziende stanno
quindi tentando di mettere a punto delle apparecchiature automatiche per
l’ibridazione con la speranza di ottenere risultati migliori di quelli
ottenibili manualmente. Le difficoltà da superare non sono poche e questo
spiega perché non ci sembra che il problema sia stato convenientemente risolto.
In base a quanto viene riportato dalla letteratura, uno dei tentativi meglio
riusciti è la stazione d’ibridazione messa in commercio dalla Vantana
Medical Systems di Tucson ( Arizona).
Schena, giustamente,
sentenzia: Gli strumenti per la lettura dei microarray stanno rivoluzionando la
biologia.
Infatti queste
meravigliose macchine possono leggere, in pochi minuti, in automazione, una
quantità tale di dati che le tecnologie usate prima avrebbero richiesto mesi o
anni per fare lo stesso lavoro.
Quindi in questo
capitolo passeremo in preliminare rassegna i sistemi, le tecnologie, i tipi di
segnali, i criteri d'interpretazione e tutto quanto riguarda la lettura dei
microarray.
Infatti è questa una
fase altamente critica perché nel singolo microarray, attraverso l'immagine,
che è praticamente una fotografia. bisogna discernere un gran numero di
risultati. Vediamo quindi quali sono i criteri che ci permettono di valutare
tutti gli aspetti che concorrono alla lettura e alla interpretazione dei dati.
Sistemi di lettura
Sono praticamente due
i tipi di macchine più largamente utilizzate per la lettura dei microarray: gli
scanners e gli imagers.
Gli scanners,
attualmente più largamente usati, sono macchine che catturano l'intera immagine
muovendo l'ottica o il vetrino con piccoli scatti regolari di 10 micron in
orizzontale o in verticale. La maggior parte di queste macchine usa come fonte
luminosa di eccitazione quella di un laser con appropriati filtri, ed un
fotomoltiplicatore per catturare l'immagine.
Gli imagers leggono
progressivamente, e con movimenti regolari, aree dei vetrini di 1 cm2
e poi combinano tutta l' immagine per esprimere l'insieme dei dati leggibili. Utilizzano
luce bianca per l'eccitazione ed un CCD (charge-coupled device) per catturare
l'immagine.
Velocità
E' la velocità alla
quale il robot di lettura riesce a leggere l'area del vetrino ad un dato
livello di risoluzione e si esprime in cm2 / minuto. I primi
prototipi di scanner erano in grado di leggere un area di 50 mm2
/minuto ad una risoluzione di l0 micron. Gli scanner attuali riescono a leggere
ad una velocità di 300, ed alcuni anche 500 mm2 / minuto, sempre ad
una risoluzione di 10 micron.
Comunque, alla
velocità di 300 mm2 / minuto, un intero vetrino di 20x
Precisione
Un ideale mezzo di
lettura dovrebbe essere in grado di leggere una stessa immagine di un
microarray più volte con l'identico risultato. In genere, invece ci sono delle
variazioni derivanti sia da imprecisioni meccaniche sia da fluttuazioni della
forza di eccitazione della sorgente luminosa o del detector.
Il criterio della
precisione esprime, appunto, l'ampiezza della deviazione della capacità di
lettura che non dovrebbe superare il ± 10%
Ripetibilità
Esprime la capacità
dello scanner a ripetere più volte la lettura di una stessa immagine senza
deviare minimamente né in senso orizzontale né in senso verticale. E’ tollerata
una possibilità di errore non superiore al 2%. Comunque bisogna tener presente
che se la qualità del microarray lascia a desiderare, anche questo aspetto può
compromettere la ripetibilità della lettura da parte degli scanner.
I sistemi di lettura
con imagers, che utilizzano un posizionamento fisso del vetrino ed un'ottica
fissa. sono, sotto questo profilo, più affidabili.
Risoluzione
Il potere di
risoluzione si esprime in pixel, che è la misura bidimensionale di un’
immagine, conservata in formato digitale, riportata sullo schermo di un
computer. Si tratta quindi di un'area quadrata misurata in micron. Maggiore è
il numero dei pixel e maggiore è il potere di risoluzione ossia la capacità ad
ingrandire un'immagine senza alterarla ovvero farla apparire granulosa.
I primi sistemi di
lettura arrivavano al massimo ad un livello di risoluzione di 10-20 micron,
quelli attuali arrivano a dare immagini nette anche a livello di 3 micron.
Un potere di
risoluzione che arrivi a 10 micron corrisponde a 10.000 pixels ( 100x100 ) per
mm2.
Ampiezza di segnale
L'ampiezza della
capacità di segnale di un certo sistema di lettura è rappresentato dal
quoziente fra il valore ottenibile più alto ed il più basso, che, in questo
caso, in genere è di circa 1000 volte. Infatti a 16 bit l'ampiezza di segnale,
in numeri assoluti va da
Ma dato che, in alcuni
esperimenti l'ampiezza di espressione genica può arrivare anche a differenze di
100.000 volte, si cerca di potenziare l’ ampiezza di lettura dello strumento
modificando il potere del laser o l'intensità della luce in modo da fare più
letture a livelli diversi di sensibilità.
Sensibilità
Esprime la capacità di
un sistema di lettura di convertire i fotoni fluorescenti del microarray in
segnale elettronico. Può essere portata al massimo agendo sul
fotomoltiplicatore.
Capacità di discernimento
Dato che molti geni
umani hanno bassissimi livelli di espressione, è molto importante poter operare
con sistemi di lettura in grado di apprezzare anche segnali tanto deboli che
non sia facile apprezzante la differenza rispetto al rumore di fondo.
Dato che il più comune
sistema, che si adopera, si basa sulla fluorescenza, che si esprime in numero
di molecole fluorescenti ( fluors ) che si riesce ad apprezzare, anche la
capacità di discernimento viene espressa in fluor per micron quadrato.
I primi sistemi di
lettura avevano una capacità di discernimento di 1 fluor per micron quadrato ma
i più moderni arrivano a 0.01 fluor per micron quadrato.
Dato che il rumore di
fondo dipende in gran parte dal substrato, negli ultimi anni si è fatto molto
lavoro per ridurre al massimo la fluorescenza di fondo che è aspecifica. Così
si è riusciti ad apprezzare segnali specifici anche a concentrazioni 10 volte
più basse.
Uniformità
La valutazione
preliminare della uniformità di segnale in tutte le aree del vetrino ricoperto
dal substrato è un criterio molto importante perché ci garantisce poi la
specificità e la correttezza delle letture quando la partita verrà utilizzata
per le analisi. Dato che non esistono substrati perfetti. è accettata una non
uniformità che non ecceda il 10% per aree di 5x5 mm.
Per eseguire la
misurazione dell'uniformità si esegue la prova dei 180 gradi: Si passa sotto lo
scanner un'area di 10x22 mm e, se si nota l'esistenza di un gradiente, si
rimuove il vetrino con il substrato da sotto allo scanner, lo si ruota di 180
gradi e si legge di nuovo la stessa area. Se il gradiente delle due letture ha
la stessa forma, la non uniformità è dovuta allo scanner. Se invece il
gradiente, nelle due misurazioni, prende forme opposte, la non uniformità è
attribuibile al substrato.
Quando la non
uniformità di lettura è dovuta allo scanner, questo può dipendere sia da
variazione di eccitazione della sorgente luminosa che da problemi concernenti
la distanza focale della lente.
Sono due difetti che,
se sono presenti nel sistema, vanno corretti preventivamente.
Numero di canali
I primi scanner
artigianali usati per la lettura dei microarray avevano un solo canale e quindi
potevano leggere ad un'unica lunghezza d'onda. Poi sono stati costruiti
strumenti che potevano leggere contemporaneamente due microarray, in cui uno
funzionava da controllo. La maggior parte degli strumenti attuali hanno tre
canali, di cui due sono utilizzati per leggere in parallelo due campioni
diversi, mentre il terzo canale serve per leggere in simultanea il controllo.
Ci sono poi strumenti
dedicati a particolari applicazioni anche a cinque canali per la lettura, per
esempio del DNA . Di questi, quattro servono per leggere, ciascuno una delle
quattro basi, mentre il quinto canale serve per il controllo.
Ci sono poi strumenti
che hanno più canali per leggere a lunghezze d'onda diverse, nell'ambito dello
spettro visibile, compreso fra 400 e 700 nm, con frequenze di emissione che
devono essere di almeno 50 nm fra un livello di segnale e l'altro.
Sovrapposizioni
In alcuni strumenti,
per questo aspetto difettosi, ed in particolari condizioni sperimentali, può
succedere che il segnale fluorescente di un canale si mescoli con quello di un
altro canale, fenomeno indesiderato che gli anglo-americani chiamano "
Cross- Talk ".
E' un fenomeno che,
naturalmente, porta a letture errate, perché succede che le letture di due
canali si sommino, creando non pochi problemi di interpretazione. Per gli
scanner tale fenomeno lo si riesce a minimizzare scegliendo bene il tipo di
laser o intervenendo sui filtri di emissione. Per gli imagers, che utilizzano
la luce bianca, la correzione risulta più problematica.
Degrado del campione
I campioni
fluorescenti, nelle fasi di lettura, possono andare incontro a fenomeni di
degrado in cui le molecole fluorescenti sono danneggiate da un'eccessiva
esposizione alla luce, per cui letture. eseguite in tempi diversi, possono dare
risultati non sovrapponibili.
Questo inconveniente,
che era abbastanza frequente con i primi prototipi di scanner, in cui si
arrivava a sbalzi anche del 200-300%, con gli strumenti moderni, raramente si
arriva al 10%. Comunque. per minimizzare gli inconvenienti delle false letture,
è buona regola leggere sempre con un livello di illuminazione il più basso
possibile.
Ampiezza dell'area
Dato che ogni
produttore stampa i vetrini o i supporti di misure diverse e con una diversa
configurazione, è bene preferire sistemi di lettura che coprano simultaneamente
un'area quanto più ampia. Raccomandabili sono gli scanners che leggono, in un
unico insieme, un'area di 25x76 mm, che equivale all'intera superficie del
vetrino portaoggetti standard.
Dimensioni
Le dimensioni
complessive dei primi strumenti di lettura erano di circa 180x 90x30 cm e
pesavano anche più di
Ovviamente si tende
quindi a renderli sempre più maneggevoli
In tutti gli
esperimenti in cui si utilizzano microarray con acidi nucleici o proeine, in
cui si è costretti a fissare materiali biologici su supporti solidi e
cosguentemente ibridare o legare comunque altre molecole,bisogna essere in
grado di gestire correttamente una grande quantità di fasi tecniche che si
devono affrontare sia prima che dopo l’eperimento vero e proprio, Di
particolare importanza è la gestione e interpretazione del segnale che che può essere influenzato da moltissimi
fattori. Intanto dobbiamo chiarire cosa intendiamo per segnale e cosa. invece è
il rumore.
Il segnale è
l'espressione numerica di lettura che corrisponde al vero dato sperimentale.
Il rumore, invece, è
dato dalla somma delle interferenze aspecifiche, che disturbano la lettura del
segnale, e che, come in seguito riportiamo, possono avere origini diverse. Il
quoziente segnale/ rumore è molto importante. Infatti, in tutti gli esperimenti
bisogna fare in modo, per ovvie ragioni, che sia quanto più alto.
Componenti del segnale
Sono tre le componenti
determinanti del segnale che si evidenziano a conclusione di un' analisi: La
componente intrinseca, la estrinseca e la quantità.
La componente
intrinseca deriva direttamente dalle proprietà del tracciante fluorescente
scelto da legare al target, dalla concentrazione e dal suo coefficiente di
estinzione. L'accurata selezione del tracciante fluorescente ha quindi una
grandissima importanza.
La componente
estrinseca deriva da una serie di fattori legati allo strumento di lettura come
il tipo di sorgente luminosa, la lunghezza d'onda, il tempo di esposizione ecc.
Ma deriva anche da fattori ambientati come la polarità del solvente, il pH del
tampone ecc. Si può avere anche un decadimento del segnale quando gli spots non
sono perfettamente allineati per cui si può verificare un trasferimento di
energia da uno all'altro (self- quenching).
Ovviamente il terzo
determinante del segnale deriva dalla quantità ovvero dal numero delle molecole
sia del target che del tracciante ma fra questi due componenti non c'è mai un
rapporto 1:1. E' sempre compito del ricercatore trovare sperimentalmente il
rapporto preciso che esalti al massimo il segnale.
Per quanto riguarda le
proteine non si deve dimenticare che talvolta, trattandosi di molecole
instabili si può arrivare a risultati in tutto o in parte inutilizzabili.
Componenti del rumore
Sono numerose anche le
componenti del rumore che riguardano sia lo strumento di lettura che il vetrino
o fase solida.
Rumore derivante dallo
strumento
Lo strumento può
creare problemi se si verificano cali di tensione ( dark current ) che sono
causati prevalentemente da sorgenti di calore. Questa è la ragione per la quale
la camera di lettura del CCD di molti imagers è tenuta a-50° C. Altra fonte di
rumore può essere dovuta ad un disturbo elettronico del circuito, dell'
amplificatore o del convertitore analogico-digitale.
Rumore può anche
essere causato da inconvenienti del sistema ottico innescati da anomali
riflessi di luce del substrato o da raggi cosmici.
Rumore derivante dal microarray
La maggior parte dei
microarray hanno come fase solida il vetro e, quindi, questo stesso materiale,
se non ben scelto, può essere fonte di rumore. Lo stesso fenomeno può derivare
da non appropriati componenti del substrato stratificato sul vetro. Qualora la
fase solida sia in plastica o abbia dei componenti metallici, il pericolo che
si evidenzino interferenze da rumore è più probabile. Comunque trattamenti
delle superfici con gel o nitrocellulosa sono causa di un rumore molto più
accentuato di quello che si ha per trattamenti con organoamine o organoaldeidi
di alta qualità.
Così anche alcune molecole
del diluente del campione o lo stesso campione possono reagire in modo
aspecifico con il substrato provocando interazioni che oscurano parzialmente il
segnale. Questo tipo di rumore è ben noto come " rumore di fondo ".
Molto lavoro è stato fatto negli ultimi anni per ridurre al minimo queste
interferenze e, quindi, oggi i sistemi di lettura sono stati cosi perfezionati,
che è possibile leggere agevolmente anche segnali di poche dozzine di molecole
dei singoli spot.
Abbiamo anche già
richiamato l’attenzione sul fatto che i microarray possono essere contaminati
da particelle di polvere flottanti nell’aria per cui in fase di lettura si
notano dei falsi spots molto chiari che rendono difficile la finale
interpretazione dei risultati. E’ quidi di fondamentale importanza operare, sia
in fase di produzione che di
utilizzazione in ambieti in cui la concentrazione delle particelle sia molto
bassa e gli operatori indossino camici completi
La fluorescenza è il
tipo di segnale luminoso più comunemente usato nella lettura dei microarray.
Vale quindi la pena di
approfondire come si collochi lo spettro della luce visibile nell'ambito delle
radiazioni elettromagnetiche.
Le radiazioni
elettromagnetiche vanno da un minimo di lunghezza d'onda di 10-3 nm,
dei raggi gamma ad un massimo di 10 12 nm delle onde radio, come
riportato nello schema che segue: luce visibile.
|
raggi gamma |
raggi x |
ultravioletto |
infrarosso |
microonde |
televisione |
radio |
|||||||||||||||
|
10-3 |
10-2 |
10-1 |
10 |
10 1 |
10 2 |
10 3 |
10 4 |
10 5 |
10 6 |
10 7 |
10 8 |
10 9 |
10 10 |
10 11 |
10 12 |
||||||
lunghezze d'onda in
nanometri
In questo ampissimo ambito, di ben 15 ordini di grandezza, in cui si inquadrano progressivamente, in base alla lunghezza d'onda, a partire dai raggi gamma a cui seguono i raggi x, i raggi ultravioletti, la luce visibile, i raggi infrarossi, le microonde, le onde per la te