Analisi mutazionale completa del gene CFTR
Questo progetto è sviluppato in collaborazione tra il Centro
di Riferimento Regionale per la Fibrosi Cistica del Lazio, Istituto di
Clinica Pediatrica, e la Sezione di Biochimica Clinica, Dipartimento di
Biotecnologie Cellulari ed Ematologia; entrambe sono strutture
dell’Università degli Studi di Roma “La
Sapienza”. L’Associazione Laziale Fibrosi Cistica
ha sostenuto con borse di studio parte del personale impegnato nel
progetto. Ogni struttura ha impiegato propri fondi di ricerca per il
finanziamento del progetto. La parte di ricerca riguardante le forme
atipiche è stata recentemente finanziata anche mediante
fondi di ricerca ottenuti congiuntamente dai 2 gruppi come
finanziamento di un “Progetto di Ateneo” e di un
“Progetto della Fondazione per la Ricerca sulla Fibrosi
Cistica”. Lo scopo generale del progetto è quello
di mettere in opera test genetici di II livello per la ricerca delle
mutazioni del CFTR e di caratterizzare completamente (mediante il
ritrovamento di 2 mutazioni) i pazienti afferenti al Centro di
Riferimento FC. Ciò è fondamentale dal punto di
vista diagnostico: il ritrovamento di 2 mutazioni su 2 alleli diversi
consente la piena definizione della diagnosi, con la risoluzione di
eventuali diagnosi dubbie. E’ inoltre importante dal punto di
vista prognostico: la completa individuazione delle mutazioni nei
pazienti affetti e la correlazione con l’aspetto clinico,
consente il miglioramento della definizione del rapporto tra genotipo e
fenotipo potendo permettere (attualmente in maniera limitata ma in
futuro in un numero sempre maggiore di casi) la previsione del decorso
della malattia. Sarà inoltre, speriamo in un immediato
futuro, importante anche nella terapia. Poter infatti prevedere, dal
genotipo, quale sarà l’evoluzione clinica della
malattia può consentire la pianificazione e calibrazione
degli interventi terapeutici, al limite personalizzati. Ad esempio
è attualmente operativo un programma di farmacogenomica per
lo screening di una gran quantità di sostanze specifiche per
classi mutazionali del CFTR (in alcuni casi addirittura per mutazioni
individuali specifiche). Inoltre anche lo studio di strategie di
terapia genica si sta indirizzando più
sull’inserimento di piccoli frammenti di DNA limitati alla
zona della mutazione piuttosto che all’inserimento di tutto
il gene. E’ evidente che per poter accedere, in futuro, a
questi trattamenti è indispensabile la conoscenza di
entrambe le mutazioni del paziente.
Individuazione, ottimizzazione e validazione dei metodi per
la ricerca di mutazione del CFTR
Il test di I livello che viene effettuato, indipendentemente da questo
progetto, per la caratterizzazione genetica iniziale dei pazienti
consiste nella ricerca delle 31 mutazioni più comuni del
CFTR (mediante un test denominato PCR/OLA/SCS), di cui 17 rappresentate
nell’Italia Centrale. Sebbene poco più della
metà dei pazienti siano completamente caratterizzati dal
punto di vista genetico mediante questo test iniziale, tutti gli altri
necessitano di test genetici a più alta
sensibilità diagnostica (test di II livello), che siano in
grado cioè di indagare la quasi totalità delle
mutazioni del CFTR. Inizialmente, quale test di II livello,
è stato deciso di mettere a punto il sequenziamento completo
della regione codificante, delle zone introniche (non codificanti)
adiacenti gli esoni e della zona iniziale, anch’essa non
codificante ma di regolazione (5’-flanking) del gene.
Successivamente questo approccio è stato integrato mediante
un saggio, sempre originalmente messo a punto nell’ambito di
questa ricerca, di indagine rapida (SNaPshot) di 20 mutazioni del CFTR
(aggiuntive alle 31), di cui 14 rappresentate nell’Italia
Centrale (selezionate mediante la precedente fase di sequenziamento).
Sequenziamento completo. Per la messa a punto e validazione del
sequenziamento completo, sono stati progettati, fatti sintetizzare e
verificati dal punto di vista della funzionalità gli
oligonucleotidi necessari all’amplificazione e successivo
sequenziamento delle zone menzionate del gene CFTR. Si tratta di circa
120 oligonucleotidi, costituenti le coppie
“esterne” (per l’amplificazione) e
“interne” (per il sequenziamento
dell’amplificato). Sono stati messi in uso 2 analizzatori
genetici multicapillari ABI PRISM 3100 Avant a 4 capillari che si sono
rivelati estremamente sensibili e rapidi nella produzione delle
sequenze. E’ stato inoltre personalizzato e messo in opera il
programma SeqScape dedicato al confronto di sequenze sperimentalmente
ottenute tra loro e con quelle “wild type” di
riferimento; questo software è particolarmente indicato per
l’analisi semiautomatica di un gran numero di sequenze.
E’ stato inoltre utilizzato un sito web specifico per il CFTR
per la caratterizzazione delle variazioni di sequenza ottenute. I
risultati ottenuti mediante questo metodo di sequenziamento completo
del CFTR, dopo la fase di ottimizzazione e messa in opera, possono
dirsi completamente soddisfacenti. Questo grazie anche al disegno
sperimentale che permette il trattamento di 96 campioni
contemporaneamente in tutte le fasi sperimentali e di analisi:
amplificazione in PCR, purificazione degli amplificati, controllo
elettroforetico, cycle sequencing, purificazione delle sequenze,
esecuzione delle corse elettroforetiche capillari, analisi software.
Questa fase di ottimizzazione del metodo ha consentito di individuare
procedure operative standard e protocolli sperimentali comuni per tutti
gli operatori che si occupano della caratterizzazione genetica.
SNaPshot. Per aumentare la produttività nella ricerca di
quel gruppo di mutazioni del CFTR che significativamente elevano la
sensibilità diagnostica (preliminarmente individuate
mediante il sequenziamento completo) è stato ottimizzato un
metodo di analisi rapido, basato su tecnologia SnaPshot. Anche in
questo caso la funzionalità del test è ottima e
l’architettura generale del saggio permette il trattamento
simultaneo di molti campioni. Formazione del personale. Il personale,
operante sia presso il Centro FC che la Sezione di Biochimica Clinica,
è stato formato all’utilizzo delle specifiche
tecniche di genetica molecolare che vengono impiegate per lo studio in
corso del gene CFTR, nonché all’utilizzo dei
necessari metodi e software di analisi. Questo consentirà di
applicare le tecniche messe a punto grazie a questo progetto anche alle
caratterizzazioni genetiche future. L’IDENTIFICAZIONE DI 3
NUOVE MUTAZIONI DEL CFTR. Nel corso del progetto, analizzando pazienti
affetti non completamente caratterizzati dal punto di vista genetico,
sono state individuate 3 mutazioni del CFTR mai descritte in
precedenza. Quando viene trovata una nuova variazione di sequenza nel
DNA di un certo gene, occorre dimostrare che tale variazione possa (o
meno) originare la malattia in studio, sia cioè una
mutazione causa di malattia e non semplicemente un polimorfismo
(normale variabilità interindividuale). Questo,
contrariamente a quanto si può pensare, non è un
compito semplice. Ad esempio non è sufficiente dimostrare
che la variazione di sequenza cambia l’aminoacido, in quanto
questo cambiamento potrebbe non essere così grave da far
insorgere la malattia. In genere si procede cercando di dimostrare che:
1) la frequenza della variazione di sequenza trovata è
estremamente bassa in una popolazione di non affetti (normalmente
assente analizzando circa 100 soggetti della popolazione generale); 2)
il cambiamento di sequenza provoca un cambiamento di aminoacido in una
regione critica della proteina; 3) nel soggetto affetto in cui
è stata trovata la variazione di sequenza non è
presente nessun’altra mutazione sullo stesso allele (ma
è presente un’altra mutazione sull’altro
allele). Per alcune mutazioni (ad esempio quelle di splicing) sono
praticabili, in maniera relativamente semplice, anche studi funzionali
a livello di RNA messaggero. La nuova mutazione G1244R. E’
questa una mutazione, situata nell’esone 20, che provoca la
sostituzione dell’aminoacido glicina, normalmente presente
nella proteina CFTR, con l’arginina; questo cambiamento
è una modifica strutturale rilevante che avviene in una zona
cruciale della proteina (il secondo dominio di legame
dell’ATP). Questa mutazione è risultata assente in
116 soggetti della popolazione generale. Il soggetto affetto non aveva
nessun’altra mutazione sullo stesso allele. La mutazione
è risultata inoltre assente in un gruppo di soggetti con
ipertripsinemia alla nascita e in un gruppo di pazienti affetti da FC;
ciò suggerisce che la mutazione è probabilmente
rara (forse esclusiva della famiglia in cui è stata
trovata). Altre 2 mutazioni sono già state descritte in
letteratura a carico della tripletta che codifica per la glicina 1244,
caratterizzandola come una zona ad elevato tasso di mutazione. La nuova
mutazione G1247R(G->C). Anche questa mutazione è
situata nell’esone 20. Provoca un cambiamento della glicina
in posizione 1247 (3 aminoacidi più a valle
dell’altra) ad arginina. La modifica strutturale è
la stessa della mutazione precedente con conseguenze sullo stesso
critico dominio proteico. Anche in questo caso la mutazione risulta
assente nella popolazione generale (74 soggetti) ed è
l’unica presente sull’allele del paziente
analizzato. La stessa sostituzione aminoacidica (glicina ad arginina in
posizione 1247) era già stata descritta in letteratura
sebbene originata da una diversa sostituzione nucleotidica
(3871G->A) rispetto a quella da noi trovata (3871G->C).
Anche questi autori descrivono la G1247R(G->A) come una
mutazione causa di malattia. Anche questo caso quindi conferma che la
zona di DNA che codifica per il secondo dominio di legame
dell’ATP è soggetta ad un elevato tasso di
mutazione. La nuova mutazione 3849+29del10(AGACTGTGTT). E’
questa una variazione di sequenza situata nell’introne 19.
Poiché intronica non ha conseguenze dirette sulla proteina.
Tuttavia potrebbe modificare la proteina indirettamente, mediante
un’alterata maturazione dell’RNA messaggero
originando fenomeni di “splicing” anomalo. Che
questo possa essere l’effetto è estremamente
probabile, data l’estensione strutturale della delezione (10
nucleotidi), proprio in prossimità della giunzione
esone/introne. Rimane comunque un’ipotesi da convalidare
sperimentalmente. A questo scopo gli studi di frequenza sono
già in corso e abbiamo pianificato studi funzionali per la
valutazione dell’RNA messaggero.
Analisi mutazionale del CTFR dei pazienti affetti.
L’approccio a 3 step. La procedura standard di ricerca
mutazionale individuata, ed attualmente applicata, grazie al presente
progetto è: ricerca a pannello mediante PCR/OLA/SCS di 31
mutazioni (di cui 17 rappresentate) -> ricerca a pannello
mediante SNaPshot di 20 mutazioni (di cui 14 rappresentate) ->
sequenziamento completo. Il primo step costituisce il test di I
livello; gli altri 2 step il test di II livello. La ricerca delle 31
mutazioni e il test SNaPshot sono relativamente rapidi e poco costosi.
Il sequenziamento completo, più costoso e laborioso delle 2
tecniche precedenti, si rende necessario solo per un numero ristretto
di pazienti (quelli con genetica ancora incompleta dopo le precedenti
caratterizzazioni). Sebbene il 3° step di sequenziamento
completo non sia ancora stato applicato a tutti quei pazienti che pure
ne avrebbero bisogno, i risultati ottenuti lasciano prevedere che la
sensibilità complessiva di questo approccio sia molto alta,
probabilmente superiore al 95% degli alleli e al 90% dei genotipi.
Infatti, finora, tutti i pazienti sottoposti a questa analisi sono
stati completamente caratterizzati con 2 mutazioni sui 2 alleli
diversi. Mutazioni individuate. Sono state individuate 23 differenti
mutazioni del CFTR, aggiuntive rispetto a quelle inserite nel pannello
di I livello e ciascuna causa di malattia, di cui 3 da noi descritte
per la prima volta. Tra queste 23 mutazioni, 14 raggruppate in 7 esoni
sono state inserite nel saggio SnaPshot: D110H, R117C, H139R (esone 4),
G1244R (esone 20, nuova), G1244E (esone 20), A349V, R334L, T338I (esone
7), L997F (esone 17a), R1066C, L1077P, L1065P (esone 17b),
S549R(A->C) (esone 11), Y849X (esone 14a). Le altre mutazioni
individuate ma, per il momento, non inserite in un saggio rapido sono:
711+3A->G (esone 5), L320V, M348K (esone 7), D836Y (esone 14a),
P1013L (esone 17a), G1069R (esone 17b), D1152H (esone 18),
3849+29del10(AGACTGTGTT) (introne 19, nuova), G1247R(G->C)
(esone 20, nuova). Caratterizzazioni genetiche effettuate. Nel data
base degli affetti FC afferenti al Centro di Riferimento risultano 402
pazienti totali. Tra questi, 321 risultano essere già stati
analizzati (indipendentemente da questo progetto) mediante il test di I
livello mentre 81 pazienti non risultano ancora analizzati mediante
questo test (di cui 25 persi al follow-up e 56 in parte già
richiamati per la caratterizzazione di I livello). Il test alle 31
mutazioni ha mostrato una sensibilità allelica del 77.4%
(497 alleli caratterizzati su 642 analizzati) e una
sensibilità genotipica del 62.6% (201 pazienti
caratterizzati con 2 mutazioni su 321 analizzati). I pazienti in cui si
riesce ad evidenziare 1 sola mutazione (mut/unknown) mediante il test
di I livello rappresentano il 30.2% (97 su 321) e quelli con entrambe
le mutazioni non individuate sono il 7.2% (23 su 321).
All’inizio della caratterizzazione genetica estesa i pazienti
che necessitavano del test genetico di II livello erano, quindi, 120;
di questi tuttavia 10 sono stati persi al follow-up: 110 pazienti erano
potenzialmente analizzabili con in totale (tra genotipi mut/unknown e
unknown/unknown) 129 alleli non caratterizzati dal test di I livello.
Ad oggi, di questi 110 pazienti analizzabili ne sono stati studiati 76
(34 sono ancora da analizzare), inizialmente mediante il pannello di
mutazioni relativo al test SNaPshot. Questo test ha mostrato un
incremento della sensibilità allelica, rispetto al test di I
livello, dell’8.7% (34 alleli caratterizzati su 88 non
caratterizzati alle 31 mutazioni) e un incremento della
sensibilità genotipica del 12.8% (26 pazienti a cui
è stato completato il genotipo su 76 originariamente
incompleti dopo test alle 31 mutazioni). I 50 pazienti analizzati
mediante il pannello SNaPshot ma nonostante ciò non ancora
completamente caratterizzati, sono stati ulteriormente studiati
applicando il protocollo di sequenziamento completo. Sebbene il CFTR
non sia ancora stato sequenziato interamente in tutti questi pazienti,
si è ottenuto un ulteriore incremento della
sensibilità allelica del 6.4% (25 alleli ulteriormente
caratterizzati su 54 sfuggiti sia al test alle 31 mutazioni che al test
SNaPshot) e genotipico dell’11.3% (23 pazienti il cui
genotipo è stato completato su 50 incompleti ai 2 test
precedenti). Quindi, la sensibilità allelica cumulativa
risulta: 31 mutazioni -> 77.4% +SNaPshot -> 86.1%
+sequenziamento completo (sebbene ancora non ultimato per alcuni
pazienti) -> 92.5%. La sensibilità genotipica
cumulativa risulta: 31 mutazioni -> 62.6% +SNaPshot ->
75.4% +sequenziamento completo (sebbene ancora non ultimato per alcuni
pazienti) -> 86.7%. In pratica dei 76 pazienti sottoposti ad
approfondimento, 49 sono stati completamente caratterizzati grazie al
test SnaPshot ed al successivo protocollo di sequenziamento; 27
necessitano invece del completamento del protocollo di sequenziamento.
Mediante questo approccio in meno del 2% dei pazienti affetti non
riusciamo a trovare neanche una mutazione (contro oltre il 7% del test
di I livello), considerando anche che il 3° step non
è ancora stato applicato completamente. In pratica ad un
qualsiasi soggetto che si sottopone a questa metodologia, e a cui non
troviamo nessuna mutazione, possiamo dare l’informazione di
non essere affetto, con una probabilità di sbagliare
inferiore al 2%. Ciò costituisce un ausilio diagnostico
molto potente.
Analisi mutazionale nei soggetti con forme atipiche, con
diagnosi di FC incerta o di casi particolari.
Nel corso del progetto è emerso il problema della diagnosi
nelle forme atipiche di FC. Molti di questi soggetti presentano infatti
una diagnosi incerta, il che pone anche problemi terapeutici e
prognostici. Per affrontare questo argomento sono stati analizzati
alcuni soggetti di popolazioni con forme atipiche di FC (ad esempio
soggetti con infertilità maschile, neonati con
ipertripsinemia alla nascita, soggetti oligosintomatici) per ricercare
mutazioni e/o tratti varianti specifici che possano in qualche modo
costituire la base molecolare della loro eventuale patologia. I
pazienti di questo tipo che sono stati studiati in totale
nell’ambito del gruppo di ricerca sono oltre 200, di cui
tuttavia solo 37 nell’ambito di questo progetto di ricerca.
Ci siamo concentrati soprattutto sulle variazioni introniche o esoniche
silenti (senza cambio aminoacidico), che possono causare forme atipiche
di FC producendo un alterato processamento dell’RNA. Nel
complesso abbiamo evidenziato 35 variazioni di sequenza (di cui 8
nell’ambito di questo progetto di ricerca) tra cui alcune mai
precedentemente descritte, potenzialmente coinvolte nella definizione
di queste forme atipiche. Tutte queste variazioni andranno
caratterizzate mediante confronto della loro frequenza tra la
popolazione generale e le popolazioni sospette. Per le variazioni la
cui frequenza dovesse risultare significativamente più
elevata nelle popolazioni sospette che nella popolazione generale,
andrà effettuata la caratterizzazione funzionale mediante
studi di espressione del CFTR. Per alcune di queste variazioni tali
caratterizzazioni sono già iniziate. Alcune di queste
variazioni di sequenza erano già descritte come tratti
varianti (quindi causa di malattia). Ciò ha permesso di
definire la diagnosi (sia in senso positivo che di esclusione della
malattia) in 32 dei 37 soggetti con diagnosi originariamente incerta
studiati in questo progetto. Neonati eterozigoti per 1 mutazione del
CFTR, positivi allo screening neonatale, con test del sudore
“borderline”. In questi soggetti la diagnosi si
è rivelata particolarmente difficile: il sospetto di
malattia origina dalla concomitante presenza di 1 mutazione al test di
I livello, di alti livelli di tripsina immunoreattiva dosata in corso
di screening neonatale e dal valore incerto del test del sudore.
D’altra parte sono assenti chiari segni clinici della
malattia. Il problema consiste nel fatto che la mancata effettuazione
della diagnosi può significativamente peggiorare le
condizioni di vita future. Solo l’analisi genetica estesa
può individuare la seconda mutazione o escluderla (con un
minimo margine di errore) e quindi risolvere (in un senso o
nell’altro) la diagnosi di questi casi particolari. Alcuni
soggetti di questo tipo sono stati analizzati durante il presente
progetto con la conclusione che, almeno una parte di essi, sono in
effetti malati FC. E’ tuttavia necessario precisare che, ogni
anno, vengono selezionati dallo screening neonatale circa 20 soggetti
con queste caratteristiche che necessitano di un’approfondita
indagine genetica. Analisi mutazionale di famiglie particolarmente
complesse. Durante l’esecuzione del progetto ci si
è imbattuti in casi estremamente particolari per i quali
sono state necessarie indagini molto più complesse che nei
casi usuali. Vengono di seguito descritti 2 esempi. Famiglia N. 1.
L’indagine delle 31 mutazioni ha evidenziato, in un soggetto
definito non malato, dall’assenza di uno dei picchi
wild-type. La successiva analisi di sequenza ha permesso
l’individuazione di 2 mutazioni all’interno dello
stesso esone (E627del/2184insA) probabilmente interferenti con il
metodo usato per l’analisi delle 31 mutazioni. In questo caso
deve essere studiata la segregazione allelica; poiché i
genitori del soggetto non sono disponibili per il prelievo e sfruttando
il fatto che le 2 mutazioni si trovano a distanza ravvicinata,
verrà effettuato il clonaggio del frammento di interesse in
un vettore plasmidico e il sequenziamento dei singoli cloni.
Ciò consentirà l’assegnazione allelica
delle 2 mutazioni. Qualora la segregazione allelica fosse confermata
(cosa estremamente probabile) ci troveremmo di fronte ad un genotipo
raro, che provoca un risultato anomalo in una comune tecnica di ricerca
di mutazioni, con fenotipo praticamente normale. Famiglia N. 2. La
nuova mutazione G1247R(G->C) è stata individuata in
una famiglia in cui l’analisi delle 31 mutazioni
caratterizzava il padre come genotipicamente normale, la madre
apparentemente omozigote per la mutazione W1282X, una delle figlie
eterozigote per la W1282X e l’altra figlia apparentemente
omozigote per la W1282X. Entrambe queste mutazioni, G1247R(G->C)
e W1282X si trovano nell’esone 20. Al sequenziamento si
è evidenziato che la figlia apparentemente omozigote per la
W1282X era in realtà eterozigote composta
W1282X/G1247R(G->C); quest’ultima mutazione
probabilmente interferisce con le sonde utilizzate nel metodo a 31
mutazioni producendo il risultato anomalo. Il padre risultava
eterozigote per la G1247R(G->C) (mutazione non compresa nel
pannello delle 31). La madre, apparentemente omozigote per la W1282X
risultava invece eterozigote per questa mutazione ma anche eterozigote
per il polimorfismo 4002 A/G che, evidentemente, interferisce
anch’esso con il test delle 31 mutazioni.