Tema 2

Anuncio
Tema 2. El Genoma Humano en acción
La cromatina durante el ciclo celular. La secuencia influye en el estado
funcional de la cromatina. Modificaciones epigenéticas y su importancia en
la regulación del estado funcional de la cromatina. Relación entre
secuencia, estructura y función de la cromatina: territorios cromosómicos.
La cromatina durante el ciclo celular
En las células somáticas que tienen núcleo, la molécula de ADN está presente en una forma peculiar
llamada originalmente cromatina. Por la estructura de la doble hélice del ADN, sabemos que la
distancia entre nucleótidos es de 0,34 nm; si el genoma humano haploide tiene 3x109 pares de
bases, la longitud total del genoma en forma de doble hélice lineal sería algo superior a 1 metro, y
además cada núcleo contiene dos copias del genoma. Todo este material debe entrar en el núcleo de
una célula eucariota, cuyo diámetro medio es de 5 m. Esto significa que el ADN ha de adoptar un alto
grado de empaquetamiento para poder alojarse dentro del núcleo. Este empaquetamiento se lleva a
cabo mediante la unión de la doble hélice con varios tipos de proteínas para dar lugar a una estructura
que es, precisamente, la cromatina.
Las células eucariotas, al proliferar, siguen una serie de etapas en las que se llevan a cabo los procesos
necesarios para dar lugar a dos células hijas: duplicar los componentes celulares, segregarlos
espacialmente y dividir la célula de modo que las dos células resultantes lleven todos los ingredientes
necesarios para su correcto funcionamiento. Estas etapas deben completarse en orden, de un modo
altamente regulado, y constituyen lo que se llama ciclo celular. En cada ciclo celular se distinguen por
tanto varias fases: la interfase (etapa en la que la célula duplica su contenido), la mitosis (etapa en la
que los componentes se separan a polos opuestos de la célula) y citoquinesis (separación física de las
dos células hijas). Probablemente sea la cromatina el componente celular en el que es más importante la
duplicación y segregación correctas, ya que esto va a asegurar que la información genética se transmita
sin alteraciones. Por tanto, es importante saber cómo se comporta la cromatina en las distintas etapas
del ciclo celular.
La Figura 2.1 muestra las distintas fases del ciclo celular de una célula
eucariota y los cambios que sufre la cromatina. El ciclo celular de una
célula
eucariota
se
puede
esquematizar
como
muestra
la
figura.
La INTERFASE está constituida por las fases G1, S y G2; durante la fase S
se replica la cromatina para dar lugar a dos complementos cromosómicos
completos. En la MITOSIS se separan los componentes nucleares y
celulares para dar lugar a dos células hijas.
Durante la interfase, que es la etapa más larga del ciclo, la cromatina está sujeta a un grado de
empaquetamiento de unas 2000 veces, es decir, lo que en su estado natural ocuparía un tamaño de
2000 m se reduce a un tamaño de 1 m. Esto se consigue por la unión de la doble hebra de ADN con
unas proteínas básicas llamadas histonas, cuyos grupos positivos interaccionan con los grupos
negativos del esqueleto fosfato del ADN. Hay 5 tipos principales de histonas, llamadas H1, H2A, H2B,
H3 y H4, que se asocian entre sí para formar un octámero: dos moléculas de H3 junto con dos
moléculas de H4 forman un tetrámero, y dos dímeros H2A/H2B forman otro tetrámero; ambos
tetrámeros se asocian para formar un núcleo proteico (octámero) alrededor del cual se enrolla la
molécula de ADN. En concreto, 146 pares de bases de ADN dan 1,65 vueltas alrededor del
octámero, y sobre este complejo se une la histona H1. Esta estructura, de unos 10 nm de diámetro, es
lo que se conoce con el nombre de nucleosoma, y es la unidad básica de organización de la cromatina.
Los nucleosomas están unidos entre sí por el filamento de ADN que se va enrrollando a su alrededor,
como bolas en una cuerda, y esto da lugar a la fibra de cromatina de 10 nm. En esta estructura, unos
200 pares de bases ocupan 10 nm, lo que significa un grado de empaquetamiento de unas 6 veces
respecto al tamaño lineal que ocuparía un fragmento de ADN de esa longitud (200 X 0,34 nm = 64 nm).
Figura 2.2. Esquema de un nucleosoma, con el ADN rodeando el octámero
de histonas y la histona H1 en el origen del bucle. Imagen obtenida de
http://themedicalbiochemistrypage.org/dna.html
En condiciones fisiológicas, la fibra de 10 nm sufre un segundo grado de enrollamiento sobre sí misma
para dar lugar a una estructura en forma de solenoide, con 6 nucleosomas por vuelta. Esta
configuración constituye la fibra de 30 nm, en la que el grado de empaquetamiento del ADN es de
unas 40 veces. La fibra de 30 nm sufre diferentes grados de empaquetamiento durante interfase y,
especialmente, en la mitosis, en la que la cromatina alcanza su empaquetamiento máximo (unas 10.000
veces) y da lugar a las estructuras visibles que llamamos cromosomas. Estos tipos de alto grado de
enrollamiento se consiguen porque la fibra de 30 nm forma asas que se unen por su base a una
estructura proteica que sirve como andamio. El andamio ("scaffold" en inglés) está constituido por
proteínas no histonas, de las que las principales son la Sc1 (idéntica a la topoisomerasa II) y la Sc2 ó
SMC2, que pertenece a una familia de proteínas llamada
SMC (Structural Maintenance
of
Chromosomes, en inglés). Estas proteínas cumplen también un papel importante en el mantenimiento
de la condensación de la cromatina (de ahí que también se les llame condensinas). Las asas de la fibra
de 30 nm se unen al andamio mediante unas secuencias ricas en Adeninas y Timinas llamadas SAR
(Scaffold Attachment Region en inglés), que tienen gran afinidad por las proteínas del andamio. La
estructura que resulta de este enrollamiento da lugar a una fibra de unos 300 nm de grosor, en la que
el grado total de empaquetamiento del ADN es de unas 2.000 veces. Las SAR son regiones
importantes, dispersas por el genoma, que flanquean genes y a menudo se asocian con los orígenes de
replicación que veremos más adelante, por lo que se piensa que pueden jugar un papel importante en la
función y estructura de la cromatina. Finalmente, el empaquetamiento máximo de la cromatina durante
la mitosis se consigue al espiralizarse la fibra de 300 nm para dar lugar a una estructura de 600 nm de
grosor (una cromátide) en la que el ADN alcanza ya un grado de empaquetamiento de 10.000 veces.
Figura 2.3 video que muestra los distintos grados de empaquetamiento de
la cromatina.
La secuencia influye en el estado funcional de la cromatina
Como ya se ha dicho, el grado de empaquetamiento no es uniforme a lo largo de todo el genoma. De
hecho, en el núcleo en interfase siempre se distinguió una cromatina denominada eucromatina, poco
condensada, y otra llamada heterocromatina, con un mayor grado de condensación. Hoy sabemos que
estas
categorías
morfológicas
tienen
un
correlato
funcional,
ya
que
la
eucromatina
es
transcripcionalmente más activa mientras que los genes incluidos en heterocromatina tienen un bajo
nivel de expresión. La heterocromatina, a su vez, puede ser de dos tipos: constitutiva, que nunca se
transcribe y se localiza en los centrómeros y en la constricción secundaria de algunos cromosomas; ó
facultativa, que en el fondo es un tipo de eucromatina que se heterocromatiniza en situaciones
concretas, como es el caso del cromosoma X inactivo en las mujeres. Además de estas dos grandes
categorías de cromatina, es importante comprender que dentro de las regiones eucromáticas la
cromatina tampoco es totalmente homogénea, como queda reflejado, por ejemplo, en su distinta
repuesta a varias tinciones. Este comportamiento es precisamente la base del patrón de bandas
característico de cada cromosoma y que permite la creación del cariotipo convencional. Como veremos
en un capítulo posterior, la tinción con un colorante llamado Giemsa produce unas bandas oscuras
(bandas G) separadas por bandas claras (bandas R). La tinción con otra sustancia llamada Quinacrina
(que se une específicamente a regiones ricas en adeninas y timinas) produce un patrón de bandas
similar a las bandas G, mientras que la tinción con Cromomicina-A (que se une preferentemente a
regiones ricas en guaninas y citosinas) genera un patrón similar a las bandas R. Por tanto, las
peculiaridades morfológicas de la cromatina son debidas, al menos en parte, a diferencias en la
secuencia de nucleótidos del genoma; el modelo del andamio (scaffold) que vimos en el punto anterior
permite explicar esta relación, ya que las bandas G representan regiones con un mayor grado de
empaquetamiento del ADN, lo que implica una mayor densidad de las regiones de unión al andamio
(llamadas SAR). Como las SAR son relativamente ricas en adenina y timina, esto explica que estas
regiones genómicas se tiñan más intensamente por Quinacrina y Giemsa, mientras las bandas R, más
ricas en guanina y citosina, tienen un menor grado de empaquetamiento, menor densidad de SAR y se
tiñen débilmente por estos colorantes. Por tanto, las distintas bandas del cariotipo reflejan no sólo
diferencias en la condensación de la cromatina, sino también diferencias en su composición: ya hemos
visto que el genoma humano tiene un contenido medio en G+C del 41%, pero que esto no se distribuye
de manera uniforme por todo el genoma.
A su vez, las diferencias en condensación y en composición de las distintas regiones de cromatina se
correlacionan con otra variable importante: la riqueza en genes y su actividad transcripcional. Por
ejemplo, se estima que un 80% de los genes se localizan en bandas R (las más ricas en nucleótidos
G+C), que son las menos condensadas. También se ha observado que, en general, las bandas R son de
replicación temprana, mientras que las bandas G son de replicación más tardía. La replicación del ADN
en eucariotas comienza en muchos orígenes de replicación durante la fase S del ciclo celular, pero no
todos los orígenes de replicación comienzan a funcionar a la vez: hay unos orígenes que siempre
comienzan al principio de la fase S (replicación temprana) y otros que van comenzando a funcionar
más tarde (replicación tardía). Asimismo, se sabe que los genes constitutivos (housekeeping en
inglés), que son los que se expresan en todos los tejidos, se replican temprano; por el contrario, los
genes que están en regiones heterocromáticas (el cromosoma X inactivo, por ejemplo) son de
replicación más tardía. Parece —por tanto— que regiones con alta densidad de genes, ricas en C+G y
descondensadas se replican antes que regiones silenciadas ó con baja densidad de genes.
Otro aspecto que diferencia los distintos tipos de bandas es la acetilación de las histonas. Como se
verá a continuación, se ha podido comprobar que la acetilación de las histonas que forman los
nucleosomas lleva a la formación de una cromatina más abierta, que permite mejor el acceso de
factores de transcripción y la expresión de los genes contenidos en esas regiones. Esto se debe a que las
colas amino-terminales de las histonas interaccionan con más fuerza entre sí y con el ADN cuando los
grupos épsilon-amino de las lisinas están en su forma des-acetilada; la acetilación relaja esas
interacciones y descondensa parcialmente la fibra de 30 nm y la unión del ADN con los nucleososmas.
Curiosamente, se ha comprobado que las histonas de las bandas G están menos acetiladas que las
histonas de las bandas R. Esto ayudaría también a explicar la menor condensación de la cromatina en
las bandas R, y nos proporciona un mecanismo para entender por qué las bandas R se replican
antes y son más activas transcripcionalmente: por un lado, no necesitan descondensarse para que
se lleve a cabo la replicación, y por otro constituyen unos dominios en los que el ADN es más accesible a
los factores de transcripción.
Figura 2.4 Este video muestra el proceso de acetilación de la lisina, y las
modificaciones covalentes que sufren algunas lisinas de los extremos Nterminales de las histonas H3 y H4. También se explica esquemáticamente
cómo
estas
modificaciones
contribuyen
compactación de una región de cromatina.
a
modificar
el
grado
de
En resumen, es importante darse cuenta de que los mecanismos básicos de regulación de la expresión
génica están sometidos a un nivel superior de regulación, dependiente de la situación de un gen
dentro del genoma y del estado funcional de la cromatina en que se encuentra, que a su vez está
influido por el tipo de secuencias que la componen. Generalizando, podemos resumir las principales
características de los dos estados de cromatina más frecuentes, representados por los dos tipos
principales de bandas citogenéticas (banda G, oscuras, y bandas R, claras):
Densidad en genes
Porcentaje de G+C
Replicación
Composición
Bandas G
Bandas R
Baja
Alta
Bajo
Alto
Tardía
Temprana
Ricas en A+T
Ricas en G+C
Acetilación Histonas
Baja
Alta
Repeticiones predominantes
LINE
SINE
Modificaciones epigenéticas y su importancia en la regulación del estado
funcional de la cromatina
Es muy importante comprender que los aspectos estructurales y funcionales se integran en un modelo
"dinámico", según el cual una región de cromatina estará en un estado más o menos favorable a la
expresión génica dependiendo del tipo de secuencias que la forman y también de las modificaciones
epigenéticas a ese nivel. Por modificaciones epigenéticas se entienden todos aquellos cambios que
sufre la cromatina pero que no afectan a la secuencia de nucleótidos: por eso no son modificaciones
"genéticas", sino que están "por encima" (que es lo que significa epi en griego). En los últimos años se
ha comprobado experimentalmente la gran importancia que tienen los mecanismos que regulan la
actividad de la cromatina mediante cambios epigenéticos. Para entender esto, es importante recordar
que la actividad transcripcional basal en eucariotas es esencialmente restrictiva, en el sentido de que
los promotores están en estado inactivo hasta que se ponen en marcha por la acción de los elementos
llamados ―activadores‖ y el ensamblaje del complejo basal de transcripción. Para que estos factores
proteicos se unan a sus dianas en el ADN es necesario que la cromatina de esa región esté relativamente
descondensada, para exponer más fácilmente la doble hélice y permitir el acceso de factores proteicos.
De hecho, los genes que son transcripcionalmente activos se asocian habitualmente con sitios
hipersensibles a DNAsa I, regiones cortas (unos pocos cientos de pares de bases) formadas por ADN
que no está asociado a nucleosomas, precisamente porque se encuentra unido a factores de
transcripción.
Figura 2.5 Las modificaciones de las histonas influyen en las interacciones
entre nucleosomas y, por tanto, en el grado de condensación de la
cromatina. En esta figura se muestra una región abierta (con nucleosomas
más separados) flanqueada por regiones más condensadas. Estas regiones
menos
condensadas
pueden
reconocerse
porque
constituyen
sitios
hipersensibles a ADNasa I, ya que permiten el acceso de esta nucleasa a la
molécula de ADN. También se ha visto que la unión al ADN de factores
proteicos, como factores de transcripción, se ve favorecida en estas
regiones.
Los nucleosomas son, por tanto, un elemento fundamental para mantener este estado basal restrictivo,
al impedir el acceso de la maquinaria transcripcional a los promotores. La represión transcripcional
mediada por nucleosomas se debe tanto a las interacciones directas del octámero de histonas con el
ADN, como a las interacciones que se originan entre nucleosomas vecinos para dar lugar a la fibra de
cromatina. Como hemos visto más arriba, las colas N-terminales de las histonas de los nucleosomas
quedan libres hacia fuera, y son las regiones más susceptibles de ser modificadas químicamente para
variar su carga y alterar las interacciones, tanto entre histonas y ADN como entre nucleosomas vecinos.
Por tanto, si conseguimos relajar alguna de estas interacciones conseguiremos favorecer la transcripción
de los genes que están incluidos en esas regiones. Esta relajación se puede conseguir gracias a que las
colas N-terminales de las histonas tienen una serie de aminoácidos (lisinas y serinas, principalmente)
que pueden sufrir modificaciones covalentes del tipo acetilación, metilación ó fosforilación, y
que van a ser cruciales en la regulación de estos fenómenos. A su vez, estos cambios se coordinan con
otras modificaciones epigenéticas que sufre la propia cadena de ADN en forma de metilación de algunos
nucleótidos concretos, y en su conjunto ambos procesos constituyen un importante mecanismo de
regulación de la actividad transcripcional. A continuación veremos por separado las modificaciones
epigenéticas que sufre la cromatina, por una parte, y el ADN por otra.
A. Modificación de la cromatina. Para superar la represión basal debida a la presencia de
nucleosomas y facilitar la expresión de un gen, los activadores de la transcripción pueden potenciar la
actividad transcripcional alterando, en primer lugar, la propia estructura de la cromatina: aunque el
activador no se una directamente al promotor de un gen, puede reclutar distintas actividades
modificadoras de la cromatina cuya acción sea conferir a esa región un estado que facilite la
transcripción. Estas actividades pueden ser de varios tipos:

complejos proteicos implicados en el remodelamiento nucleosomal: son capaces de mover los
nucleosomas de su posición para dejar expuesta una región promotora y permitir la expresión
génica. Este tipo de actividad está mediada por complejos multiproteicos con actividad ATPasa, de
los cuales el primero en ser aislado fue el complejo SWI/SNF (primero se identificó en levaduras,
después en humanos). Este complejo desestabiliza el nucleosoma al romper los contactos del ADN
con el octámero, que queda libre para moverse y asociarse con una región vecina de la molécula de
ADN. Todos los remodeladotes de nucleosomas pertenecen a la familia SNF2 de ATPasas, y pueden
dividirse en 7 subgrupos dependiendo de los dominios proteicos que contienen.
Figura 2.6 Los complejos "remodeladores" de la cromatina tienen
actividad ATPasa y son capaces de mover nucleosomas para descubrir
regiones del ADN necesarias para la transcripción. En este video se
ilustra la acción de un remodelador típico. Las cuatro familias más
importantes y mejor estudiadas de estos remodeladores son SWI2,
ISWI, CHD e Ino80.

complejos implicados en la acetilación de histonas: el factor Gcn5 de levadura fue el primer
activador transcripcional con actividad acetilasa de histonas descubierto, en 1996. Posteriormente
se vio que otros co-activadores de la transcripción de mamíferos también poseían actividad acetiltransferasa, factores tales como p300, CBP (CREB-BP) y P/CAF, de ahí que hoy en conozcan en
conjunto con el nombre de HAT (Histone AcetylTransferase). Éstos actúan como factores de
transcripción integradores de diversas vías de transducción de señales implicadas en el control del
ciclo celular y de los procesos de diferenciación, reparación y apoptosis. Otros activadores
transcripcionales con actividad HAT son el factor de transcripción TAFII250 (que forma parte del
complejo TFIID), SRC-1 y ACTR (coactivadores de receptores nucleares). Al igual que la acetilación
de las histonas conduce a la activación transcripcional, la des-acetilación de las histonas crea
una estructura cromatínica más condensada que favorece el silenciamiento de la transcripción de los
genes incluidos en la esa región genómica. En este sentido, se ha comprobado que los factores
HDAC1 y HDAC2 (Histone De-Acetylase), cuya función es des-acetilar las histonas, están
presentes en el complejo Sin3-NcoR, un co-represor transcripcional que regula la expresión de
genes importantes en el ciclo celular y en el desarrollo embrionario. En conjunto, acetilasas y desacetilasas actúan sobre los mismos aminoácidos de las colas amino-terminales de las histonas H3 y
H4, especialmente las lisinas 9, 14, 18 y 23 de la histona H3 y las lisinas 5, 8, 12 y 16 de la
histona H4. En la figura 2.4 ya se ha visto el posible mecanismo por el que la des-acetilación de las
histonas favorece la compactación de nucleosomas vecinos e impide la transcripción en esa región.
De hecho, se ha comprobado que la des-acetilación de la lisina 16 en la histona H4 provoca la
condensación de la fibra de 10 nm, mientras que la acetilación de este residuo impide la formación
de la fibra de 30 nm y permite la interacción con co-activadores de la transcripción.

otras modificaciones muy importantes son la fosforilación de la histona H3 en la serina 10 y la
metilación de las lisinas 4, 9, 27, 36 y 79 en la histona H3 y de la lisina 20 de la histona
H4, metilación catalizada por unos complejos proteicos que tienen actividad metil-transferasa. Se
ha comprobado que estas modificaciones actúan en coordinación con la acetilación, estableciendo lo
que ahora se conoce como el "Código de Histonas". Según este código, una región se comportará
como eucromatina ó como heterocromatina dependiendo de las modificaciones epigenéticas de las
histonas que conforman los nucleosomas de la región; las regiones limítrofes, en las que se da una
transición de un tipo de cromatina al otro, muestran características propias de ambos tipos de
cromatina, y son capaces de unir complejos proteicos llamados aisladores (en inglés "insulator"),
que forman una especie de barrera física e impiden que un tipo de cromatina se extienda más allá
del límite de la región e invada la región vecina. De modo general, el código de histonas establece
que una región de eucromatina se caracteriza por tener la lisina 4 de la histona H3 metilada (con
uno, dos o tres grupos metilo), y las lisinas 9 y 14 de la misma histona acetiladas. Se ha
comprobado que esta configuración tiene la propiedad de unirse a un dominio proteico llamado
"bromodominio", que está presente en muchos activadores de la transcripción. Una región con
estas características puede heterocromatinizarse si sufre una cascada de alteraciones: la pérdida de
la metilación de la lisina 4, la desacetilación progresiva de las lisinas 9 y 14, y finalmente la
metilación de la lisina 9 constituyen una marca de heterocromatina, a la que se unen proteínas que
contienen un dominio de silenciamiento llamado "cromodominio" que recluta factores de
silenciamiento como la proteína HP1 (proteína de heterocromatina-1). Estas interacciones están
influidas también por la fosforilación de la serina 10 de la histona H3; por ejemplo, dicha
fosforilación –generada por la quinasa Aurora B— inhibe la unión de HP1 con la lisina 9 metilada
durante la mitosis.
Figura 2.7 El "Código de histonas" permite saber el tipo de cromatina que
formará una región dependiendo de las modificaciones covalentes de las
histonas en esos nucleosomas. En este video se muestran las distintas
modificaciones de una región de la histona H3, y se esquematiza el tipo de
modificaciones típicas de regiones de heterocromatina y de eucromatina.
Estudios recientes han aportado nuevos datos sobre las modificaciones que sufren las histonas. En lo
que se refiere a las metilaciones, diversos estudios de inmunoprecipitación de cromatina han podido
determinar la posición de dichas modificaciones a lo largo de todo el genoma. Esto ha permitido
comparar el estado de la cromatina que rodea al promotor frente al de otras regiones génicas. Además,
combinando estos datos con los niveles de expresión de cada gen, se ha podido definir mejor el código
de metilaciones de histonas que caracteriza los promotores de genes activos y de genes silenciados.
Esta información se resume en la siguiente figura, que muestra un gen activo típico (la flecha hacia la
derecha indica transcripción activa a partir de ese punto). Las líneas de colores indican la intensidad de
unión de anticuerpos frente a ARN polimerasa II (verde), tri-metilación de la lisina 4 de la histona H3
(azul), acetilación de las lisinas 9 y 14 de la histona H3 (marrón) y tri-metilación de la lisina 36 de la
histona H3 (naranja). Puede verse que ésta última se encuentra sobre todo en los nucleosomas que
incluyen el cuerpo y el final del gen, mientras que las otras modificaciones son más intensas en los
nucleosomas correspondientes al sitio de inicio de la transcripción.
La Figura 2.8 muestra las modificaciones de histonas de regiones génicas
según la actividad transcripcional.
Los genes no activos, en cambio, están caracterizados por la ausencia de estas modificaciones y la
presencia de metilación de la lisina 9 de la histona H3 (H3K9me1) y la tri-metilación de la lisina 27 de
la histona H3 (H3K27me3) en la zona del inicio de la transcripción, y la tri-metilación de la lisina 79 de
la histona H3 (H3K79me3) a lo largo de todo el cuerpo del gen.
B. La metilación del ADN juega un papel fundamental en el mantenimiento del silenciamiento
transcripcional. El ADN de vertebrados se metila en el carbono 5 de las citosinas que están en el
dinucleótido CpG (la "p" indica el grupo fosfato que une una citosina con una guanina, en dirección 5' 
3'). Curiosamente, la abundancia de este dinucleótido en el genoma de vertebrados es sólo un 25% de
lo esperado, es decir, el porcentaje normalizado de este dinucleótido es de 0,25. En efecto, si el
contenido en C+G del genoma es del 41%, la probabilidad esperada de encontrar un dinucleótido CpG es
(0,205 x 0,205) = 0,042 (o sea, 4,2%); en cambio, la frecuencia observada de este dinucleótido está en
torno al 1% en el genoma humano, de ahí que el porcentaje normalizado sea 1/4 = 0,25. Además, los
dinucleótidos CpG no están distribuidos homogéneamente a lo largo del genoma, sino que son
más abundantes en los genes, tanto en los exones como, sobre todo, alrededor del inicio de la
transcripción. Pues bien, los dinucleótidos CpG que tienen metilada la citosina son los que están
distribuidos a lo largo de la secuencia de genes. Por el contrario, los dinucleótidos CpG que no
están metilados que tienden a concentrarse en regiones que se denominan islas CpG. Aunque
estas islas se han definido tradicionalmente como las regiones de un tamaño igual o superior a 500 pb,
con un contenido total de G+C superior a 50% y con un cociente de dinucleótidos CpG observados frente
a esperados superior a 0,6, hoy en día se pueden definir por su porcentaje normalizado de CpG. De
hecho, el análisis de todos los promotores del genoma humano identifica dos tipos de genes: los que
tienen un promotor con un porcentaje normalizado de CpG en torno al 0,61 y los que tienen un
promotor con un porcentaje normalizado de CpG en torno al 0,23. Los primeros constituyen un 70% de
todos los promotores, y corresponden a los genes constitutivos ó ―domésticos‖ ("housekeeping" en
inglés). Por el contrario, los promotores con bajo porcentaje normalizado de CpG constituyen un 30%
del total de los promotores, y corresponden a los genes que se expresan en tejidos específicos. Los
promotores que contienen una isla CpG están habitualmente hipometilados en la línea germinal, lo cual
les protege frente a las transiciones CT que sufren las citosinas metiladas.
Figura 2.9 En este video se puede ver el concepto de "isla CpG", al
examinar la distribución de dinucleótidos CpG a lo largo de un gen y ver su
estado de metilación.
La metilación del ADN está catalizada por unas metil-transferasas específicas de las citosinas que forman
parte de dinucleótidos CpG, y se conocen básicamente dos tipos de estas metil-transferasas de ADN.
Las DNMT3A y DNMT3B son responsables de la metilación de novo, es decir, la metilación de
dinucleótidos CpG que no estaban previamente metilados. En cambio, la DNMT1 (ADN-metiltransferasa-1) es responsable de mantener la metilación durante la replicación. En efecto, dado que en
la doble cadena de ADN un dinucleótido CpG tiene realmente dos citosinas metilables (ya que existe un
CpG en cada una de las cadenas de la doble hélice), un sitio totalmente metilado tendrá realmente dos
citosinas metiladas. Tras la replicación del ADN, ambas dobles hélices conservarán una cadena con el
CpG metilado (la proveniente de la molécula original), mientras que la cadena de nueva síntesis estará
sin metilar. Esto genera dinucleótidos CpG hemi-metilados, es decir, metilados en una de las citosinas
pero no en la otra; la DNMT1 tiene la función de re-metilar precisamente estos dinucleótidos para
restablecer el estado inicial de metilación completa que tenía la molécula original.
Figura 2.10 Un dinucleótido CpG totalmente metilado quedará hemimetilado tras la replicación del ADN de esa región. La metilasa de
mantenimiento DNMT1 se encarga de re-metilar estas regiones, como
muestra este video.
Numerosos estudios han mostrado el significado biológico de la metilación del ADN: 1) es un importante
mecanismo epigenético de silenciamiento génico a nivel transcripcional, y permite mantener el
silenciamiento de ciertos genes durante los procesos de diferenciación celular; 2) la metilación es un
mecanismo de defensa frente a elementos móviles del genoma, cuyos promotores están
habitualmente silenciados por metilación; y 3) la metilación es un mecanismo estabilizador de la
cromatina, especialmente de la heterocromatina pericentromérica, ya que la des-metilación de este
tipo de cromatina conduce a la aparición de reordenamientos cromosómicos severos.
Los mecanismos moleculares por los que la metilación conduce al silenciamiento transcripcional pueden
ser múltiples:

impidiendo la unión de factores de transcripción al promotor. Por ejemplo, algunos factores de
transcripción generales como Sp1, CREB, E2F ó NF-kB se unen a dominios que contienen CpG, y
esta unión disminuye cuando estos dominios están metilados. Sin embargo, éste mecanismo no se
puede aplicar de modo general a todos los genes.

mediante la unión específica de represores transcripcionales al ADN metilado. Existen varias
proteínas de unión a los dinucleótidos CpG metilados, denominadas genéricamente MeCP ("MethylCytosine binding Protein") ó MDB ("Methyl Binding Domain"), que forman parte de complejos con
actividad represora de la transcripción. Por ejemplo, MeCP-2 es una proteína que contiene un
dominio de unión a dinucleótidos CpG metilados, así como otro dominio por el que se une a un
represor transcripcional llamado Sin3. Curiosamente, Sin3 reprime la transcripción a través de su
unión con HDAC2 (que, como ya hemos visto, des-acetila las lisinas de la histona H3). De esta
manera, la represión transcripcional debida a la metilación de los dinucleótidos CpG se produce
gracias a la asociación entre metilación del ADN y acetilación de la cromatina, ya que el
dominio de represión transcripcional de MeCP-2 es capaz de reclutar el complejo Sin3-NCoR-HDAC2
y así iniciar un foco de cromatina hipoacetilada en una región específica del genoma. Esto explica
que las regiones en las que el ADN está metilado sean capaces de silenciar genes cercanos (aunque
éstos no tengan sus dinucleótidos CpG metilados), al englobarlos en una región genómica silenciada
por des-acetilación.
Figura 2.11 La regulación epigenética de la transcripción génica incluye
tanto la metilación del ADN como las modificaciones covalentes de las
histonas. Como se muestra en este video, es precisamente la interacción
entre ambos procesos lo que permite modificar la cromatina para facilitar
la transcripción o para silenciar una región.
De todas formas, uno de los hallazgos novedosos del proyecto ENCODE (mencionado en el capítulo 1)
ha sido que la relación entre metilación y unión de factores de transcripción es, a menudo, contraria a lo
que se intuía. La visión clásica es que lo primero es la metilación del ADN, y esto impide (o permite) la
unión de factores de transcripción y así regula la expresión de un gen. Ahora, en cambio, sabemos que
en muchos casos es al revés: la unión de factores de transcripción impide la metilación de esa región
de ADN. Dado que se trata de procesos reversibles, en un equilibrio dinámico, esto permite una
regulación muy fina de la expresión génica.
Como ya se ha mencionado, una propiedad muy importante del silenciamiento por metilación es que es
reversible: se ha comprobado que los promotores que han sido silenciados por metilación pueden
reactivarse si se des-metila esa región. Un mecanismo posible para explicar esta reactivación es la
pérdida de la metilación durante la replicación: esto sucedería si ciertos factores de transcripción ó
activadores nucleares consiguieran unirse a sus promotores inmediatamente después de la replicación y
antes de que actúe la DNMT1 de mantenimiento en los sitios hemi-metilados. Una vez que se estabiliza
el complejo basal de transcripción sobre esa región, éste atraería algunos componentes con actividad
HAT, que a su vez actuarían manteniendo la cromatina abierta y permitiendo la transcripción. Esto,
además, impediría la acción de la DNMT1 y terminaría por eliminar la metilación en esa región tras
varios ciclos de replicación. Este mecanismo se conoce como des-metilación pasiva. Otro mecanismo
alternativo para explicar la re-expresión de genes silenciados por metilación, sobre todo en células
diferenciadas que ya no se replican, es la desmetilación activa, aunque todavía no se ha aislado de
modo concluyente ninguna des-metilasa de ADN. Estudios recientes han demostrado que una proteína
llamada TET1 tiene actividad 5-metilcitosina (5mC)-hidroxilasa, convirtiendo las 5mC en 5-hidroxi-mC
en células de mamíferos. Estas 5-hidroxi-mC son después desaminadas a 5-hidroxi-mU por unas
desaminasas llamadas AID o APOBEC, y los 5-hidroxi-mU son convertidos en citosinas por el sistema
de reparación BER (que se estudiará en detalle en el Tema 3) a través de una ADN-glicosilasa
llamada TDG.
Figura 2.12 Proceso de desaminación activa de citosinas metiladas en
mamíferos.
En el año 2009 se descubrió que algunas células humanas llevan un nuevo tipo de metilación del ADN
(previamente descrito sólo en plantas), que no afecta a las citosinas de dinucleótidos CpG sino a las
citosinas de los trinucleótidos CHG ó CHH (siendo ―H‖ cualquier nucleótido excepto G). En humanos,
esta modalidad de metilación sólo se da en células pluripotenciales, llegando a constituir un 25% de
todas las citosinas metiladas en células madre embrionarias. Al contrario que la metilación de CpGs, esta
metilación ―no-CpG‖ es más intensa en el cuerpo de los genes y su relación con la expresión génica no
es directa. Se piensa que este nuevo tipo de metilación juega un papel importante en el mantenimiento
del estado pluripotencial, ya que desaparece durante la diferenciación celular.
En resumen, la metilación del ADN constituye un importantísimo mecanismo epigenético de regulación
de la expresión génica, debido a su interacción con los mecanismos que modifican la estructura de la
cromatina. El mantenimiento de los patrones de metilación explica también que las modificaciones
epigenéticas sean heredadas establemente tras la replicación del ADN. Además, como ya se ha
mencionado, la metilación tiene importantes implicaciones biológicas, y por tanto la alteración de los
procesos normales de metilación de la cromatina puede
perturbar procesos fisiológicos
importantes. En primer lugar, por ser un mecanismo fundamental en el silenciamiento de retrovirus
endógenos, transposones y ADN satélite, las alteraciones en la metilación de estos elementos puede
provocar numerosas anomalías genéticas. Además, la metilación es la base molecular de los
fenómenos de impronta genómica (imprinting) que se estudiarán más adelante, y es un mecanismo
fundamental en la regulación de la expresión génica durante el desarrollo embrionario. De hecho, el
embrión sufre una onda de des-metilación genómica global en la fase de mórula de 8 células, seguida
por la re-metilación gradual que vuelve a fijar los patrones de metilación en la fase de blastocisto.
También la inactivación del cromosoma X en mujeres es un proceso básicamente controlado por
procesos de metilación, acetilación y silenciamiento.
Por tanto, cada vez está más claro que la des-regulación de las modificaciones epigenéticas de la
cromatina está en la base de algunas enfermedades humanas. El caso más claro es el de una
enfermedad neurológica hereditaria llamada Síndrome de Rett, en el que se han identificado
mutaciones en el gen que codifica la proteína de unión a metil-citosinas MECP2 dando lugar a un exceso
de ―ruido transcripcional‖ por falta de silenciamiento global de muchos genes, con efectos más marcados
en el cerebro que en otros órganos. Además, se ha visto que las células de estos pacientes tienen
desmetilación de los elementos LINE1 (que, por tanto, muestran mayor actividad de retrotransposición
en algunos tejidos). Por otra parte, el papel de la metilación en cáncer también está cobrando cada
vez más importancia, ya que se ha visto que muchos tipos de tumores tienen alteraciones importantes
en los procesos de metilación de la cromatina:

la desaminación de citosinas metiladas (debida habitualmente a la acción de una citidíndesaminasa, ó bien por desaminación hidrolítica espontánea) provoca un cambio de Citosina por
Timina, haciendo que los dinucleótidos CpG metilados sean puntos calientes (hotspots) para la
generación de mutaciones de este tipo. De hecho, se ha estimado que el 30% de las mutaciones
encontradas en tumores en el gen TP53 (que codifica la proteína p53, un supresor tumoral
importante) son transiciones CT que tienen lugar dentro de dinucleótidos CpG.

se ha comprobado que durante el proceso de iniciación tumoral hay una hipometilación global del
genoma de la célula pre-maligna, lo que provoca un aumento en la inestabilidad genómica y la
aparición de anomalías cromosómicas. Por ejemplo, los ratones en los que el gen DNMT1 ha sido
inactivado muestran una elevada tasa de deleciones o duplicaciones de regiones cromosómicas.
Además, algunos oncogenes concretos se sobreexpresan en algunos tumores por des-metilación de
sus promotores (por ejemplo el oncogén BCL2). Del mismo modo, se ha identificado una
enfermedad (Síndrome ICF, siglas de Inmunodeficiencia, inestabilidad Centromérica y defectos
Faciales) en la que los pacientes tienen mutaciones en el gen DNMT3B, que codifica una metiltransferasa que metila específicamente los satélites centroméricos 2 y 3; la desmetilación de esas
regiones de heterocromatina provoca fusiones entre cromosomas. En conjunto, estos datos sugieren
que la metilación es un mecanismo muy importante para mantener la estabilidad del genoma.

al mismo tiempo, la hipermetilación puntual de algunos genes supresores tumorales, con el
consiguiente silenciamiento y pérdida de función, es un mecanismo muy frecuente de generación de
distintos tipos de cáncer. Por ejemplo, el gen RB1 está frecuentemente metilado en un tipo de
tumores llamados retinoblastomas esporádicos. También es frecuente la hipermetilación (y
silenciamiento) del gen supresor tumoral p16 en varios tipos de tumores; la hipermetilación del gen
VHL (Von Hippel-Lindau) en 20% de los carcinomas de células renales esporádicos; la inactivación,
por hipermetilación, del gen de reparación de desemparejamientos hMLH1 en tumores de colon
esporádicos que muestran inestabilidad de microsatélites. En conjunto, se estima que en tejido
tumoral hasta un 10% de las islas CpG están metiladas, en contraste con células normales en las
que este porcentaje es mucho más bajo.

por su parte, algunos complejos con actividad modificadora de la cromatina se han asociado
también con el desarrollo de cáncer. Por ejemplo, el gen AIB1, que tiene actividad acetilasa de
histonas, está amplificado en cáncer de mama y por tanto se expresa a niveles más altos de lo
normal. Por otro lado, el co-activador transcripcional CBP, que también funciona como una acetilasa
de histonas, está fusionado con el gen MOZ ó con el gen MLL en pacientes con leucemia mieloide
aguda; esta fusión hace que la actividad acetilasa esté aumentada en determinadas células de la
médula ósea y esto desencadena la leucemia. Además, otro co-activador transcripcional con
actividad acetilasa de histonas (la proteína p300) está mutado en cáncer colorrectal y delecionado
en el 80% de los glioblastomas, un tipo de tumor cerebral. Lo mismo puede decirse de los
complejos con actividad des-acetilasa de histonas (HDAC): ya hemos visto que la supresión de Myc
y la unión de Rb con el factor de transcripción E2F dependen en gran medida de su unión con
complejos
que
tienen
actividad
des-acetilasa.
Además,
se
ha
demostrado
que
algunas
oncoproteinas virales como HPV E7 ó el antígeno T de SV40 inactivan el gen RB1 al impedir su
unión con complejos que tienen actividad HDAC. Finalmente, las translocaciones asociadas con la
leucemia promielocítica producen fusiones entre factores de transcripción que interaccionan con
diversas acetilasas y des-acetilasas de histonas, con complejos remodeladores de la cromatina y con
proteínas que tienen actividad metil-transferasa de histonas.
Figura 2.13 La regulación de la transcripción de los genes que responden al
ácido retinoico se lleva a cabo mediante la actuación de complejos con
actividad acetilasa o des-acetilasa de histonas. Este video muestra la
regulación normal de la expresión de un gen en respuesta a la presencia de
ácido retinoico, y la alteración de este mecanismo en la leucemia
promielocítica aguda con la translocación cromosómica 15;17.
Considerando todos los ejemplos citados en los párrafos anteriores, podemos concluir que los procesos
que regulan la metilación de la cromatina están implicados en la iniciación y progresión tumoral; esto,
además, abre nuevas posibilidades terapéuticas en muchos tipos de cáncer, ya que el estado de
metilación es potencialmente modificable mediante fármacos.
Relación entre secuencia, estructura y función de la cromatina: territorios
cromosómicos
Al ocuparnos de los mecanismos que regulan la función del genoma a nivel global, es importante tener
en cuenta el nivel superior de organización de un genoma dentro del núcleo. En los últimos años se ha
puesto en evidencia que distintas regiones de la fibra de cromatina tienden a ocupar posiciones
concretas en el núcleo, dependiendo de la secuencia subyacente, del estado transcripcional de los
genes de esa región y de sus modificaciones epigenéticas, del tiempo de replicación del ADN implicado,
etc. Por tanto, cada vez está más claro que si queremos tener una imagen completa de cómo se regula
la función del genoma, no podemos ignorar aspectos estructurales tales como la composición en
nucleótidos o la posición dentro del núcleo.
Uno de los aspectos más intrigantes de la biología genómica de los últimos años es la organización
espacial de la cromatina dentro del núcleo de la célula eucariota, dando lugar a lo que se han
denominado "territorios cromosómicos". Este concepto ha venido a completar la imagen del núcleo
eucariota como una estructura compartimentalizada, en la que distintas regiones contienen maquinarias
específicas que llevan a cabo funciones concretas. Esta noción debe integrarse con la presencia de
dominios cromatínicos definidos y más o menos estables a lo largo de la vida de una célula. Diversos
estudios han mostrado de forma convincente que la cromatina correspondiente a cada uno de los
cromosomas tiende a ocupar unas posiciones concretas en el núcleo en interfase, y que esas posiciones
tienden a mantenerse durante el ciclo celular. Por ejemplo, la posición de un cromosoma concreto dentro
del núcleo está relacionada con el tamaño del cromosoma y con su riqueza en genes, que ―como hemos
visto― se correlaciona también con la secuencia de nucleótidos subyacente. En general, se considera
que los cromosomas pequeños tienden a localizarse hacia el interior del núcleo; igualmente,
cromosomas ricos en genes tienden a ocupar posiciones centrales. También existen datos que muestran
que las regiones pobres en genes y en secuencias Alu se asocian con la periferia del núcleo, dejando la
cromatina rica en genes en el interior. De todas formas, todavía se desconoce cómo se establecen estos
territorios y cómo se mantienen tras la mitosis.
Figura 2.14 En este enlace se pueden ver imágenes que ilustran el
concepto de “territorio cromosómico”. Aquí hay una buena revisión en
inglés.
La replicación del ADN y la transcripción génica son dos procesos que tienen lugar dentro del núcleo y
que exigen una remodelación importante de la fibra de cromatina para permitir el acceso de las
maquinarias proteicas que los llevan a cabo. Además, se ha visto que ambos procesos no tienen lugar al
azar, en cualquier lugar del núcleo, sino en compartimentos especializados a los que acuden las fibras de
cromatina que están en la vecindad. Se habla así de "fábricas de replicación" ó de "fabricas de
transcripción", regiones nucleares ocupadas por regiones genómicas que se replican o transcriben
simultáneamente aunque pertenezcan a territorios cromosómicos distintos. Lógicamente, las asas de
cromatina que ocupan una fábrica determinada tendrán una configuración similar, en cuanto al grado de
condensación de la cromatina, la secuencia de nucleótidos, la riqueza en genes, etc; esto explica que el
genoma se organice como un mosaico de regiones que comparten características similares, ya que esas
regiones podrían interaccionar dentro del núcleo al situarse en una misma fábrica de replicación o de
transcripción. Por ejemplo, se ha visto que en el genoma humano existen unas regiones llamadas
RIDGES (Regions of IncreaseD Gene Expression, en inglés) en las que son más abundantes los genes
que se transcriben activamente, y son regiones ricas en G+C, pobres en repeticiones tipo LINE y con
densidad génica alta. Junto a éstas, se observan también regiones con poca densidad en genes, bajo
nivel transcripcional y relativamente pobres en G+C, que se llaman por tanto anti-RIDGES. Algo similar
detectó el proyecto ENCODE, del que se ha hablado en el capítulo anterior, al analizar una gran cantidad
de modificaciones epigenéticas a lo largo de todo el genoma. Según los datos de ENCODE, se pueden
definir dos tipos de regiones genómicas: a) dominios “activos”, que serían las regiones definidas
por niveles altos de transcripción, replicación temprana, acetilación de la histona H3 y des-metilación de
la lisina 27 de la histona H3 (H3K27); b) dominios “inactivos”, correspondientes a regiones de
replicación tardía con poca actividad transcripcional, baja acetilación de H3 y metilación de H3K27. Los
dominios activos son muy ricos en sitios de inicio de la transcripción, islas CpG y repeticiones Alu,
mientras que las repeticiones tipo LINE1 y LTR están sobre-representadas en los dominios inactivos.
Pues bien, los genes presentes en RIDGES (equivalentes a los dominios activos de ENCODE) tienden a
localizarse, dentro del núcleo, en torno a las fábricas de transcripción. Lo mismo sucede con los genes
de replicación temprana, que se asocian significativamente con las fábricas de replicación nucleares. Por
tanto, los modelos actuales postulan que los genes que son replicados o transcritos residen en regiones
cromatínicas
relativamente
descondensadas,
las
cuales
salen
de
sus
propios
territorios
cromosómicos hacia fábricas de replicación o transcripción vecinas. En esas fábricas, por tanto,
pueden interaccionar regiones alejadas de un mismo cromosoma, o incluso asas de cromatina de
territorios cromosómicos distintos; esto permite explicar, en el caso de la transcripción, la acción de
potenciadores de la expresión que actúan a larga distancia ó incluso en trans.
Una de las aportaciones del proyecto ENCODE ha sido la de analizar, a nivel global en todo el genoma,
interacciones físicas entre regiones distantes (interacciones de promotores con enhancers y otros
elementos reguladores relativamente alejados o incluso situados en otros cromosomas). Esto da lugar a
un cuadro bastante complejo en el que los promotores interaccionan con muchos sitios, la mayoría de
los cuales están a bastante distancia (>120 kilobases). De hecho, sólo el 7% de las interacciones se
producen entre sitios reguladores y el gen más cercano. Además, se observaron interacciones entre
múltiples elementos a la vez, lo que da lugar a redes de interacción que permiten una primera visión del
genoma en tres dimensiones.
Como es lógico, en todas estas interacciones son importantes las modificaciones epigenéticas de la
cromatina y del ADN que hemos estudiado en este Capítulo, que en el fondo constituyen la base
molecular que permite los fenómemos de condensación y descondensación necesarios para la
replicación, transcripción y desplazamiento físico de las asas de cromatina. Conjugando todos estos
elementos, obtenemos una visión dinámica de la cromatina nuclear en la que la estructura del núcleo se
integra con la función y secuencia del genoma. Esta visión es mucho más rica que los modelos
anteriores, que no tenían en cuenta todos estos factores, y además permite explicar mucho mejor la
regulación fina de la expresión génica durante el desarrollo embrionario ó la diferenciación celular. La
otra cara de la moneda es que se trata de procesos tremendamente complicados y, por ello,
potencialmente frágiles, de modo que pequeñas perturbaciones en estos mecanismos pueden dar lugar a
alteraciones genéticas y enfermedades humanas. En este sentido, el cáncer es un ejemplo típico de
proceso complejo de des-regulación de la diferenciación celular, en el que se observan importantes
alteraciones epigenéticas y una fuerte desorganización de la estructura nuclear.
Descargar