GENOMA HUMANO Y CÓDIGO GENÉTICO

Anuncio
GENOMA HUMANO Y CÓDIGO GENÉTICO
Resumen por Mauricio de la clase de José Fernando Piqueras sobre genoma humano y código
genético. Es más bien una lluvia de ideas sobre los temas, más que una exposición estructurada.
Temario
1. Estructura y organización del material genético humano
2. Variación
3. Función
El genoma tiene 3.1 Gigabases en 22 cromosomas y 2 cromosomas sexuales. Aproximadamente el
1% del genoma es mitocondrial (16500 bases, es circular).
Demostración de la naturaleza del material genético en bacterias fue realizada por Avery y MacLeod;
Delbruc y Luria establecieron la naturaleza de bacteriófagos.
Las bases nucleotídicas son citidina, uracilo, timina, adenina y guanina. El uracilo sustituye la timina en el
RNA.
Las bases nucleotidicas se unen a azucares formando ribosa o desoxirribosa formando los
nucleósidos. Cuando se adiciona uno o más fosfatos se forman los nucleótidos. Los nucleótidos
pueden sufrir modificaciones adicionales.
La organización del DNA es una Doble Hélice: dos cadenas antiparalelas, hélice dextrógira, con
complementaridad A:T; G:C, y enrollamiento plectomérico. La robustez del DNA se basa en su
naturaleza hidrofóbica. La replicación del DNA lleva implícito un modelo de replicación
semiconservativo.
El proceso de replicación ocurre durante la fase S del ciclo celular, que dura 6-8 horas.
La replicación de los extremos de DNA – los telómeros: las cadenas parentales tienen sus extremos
3’ y 5’; pero las DNA polimerasas sólo son capaces de iniciar replicación a través de cebadores de
RNA; y las polimerasas sólo sintetizan en la dirección 5’ a 3’. Una de las cadenas parentales se
sintetiza en forma continua, mientras que la cadena complementaria se sintetiza en fragmentos de
Okasaki, utilizando cebadores de RNA que después son retirados, seguido por las ligasas que rellenan
los agujeros. El último cebador no puede ser reparado creando un acortamiento en los telómeros. La
telomerosa es un complejo ribonucleoproteico con actividad transcripatasa reversa que adiciona
TTAGGG a los extremos. Las células somáticas no tienen actividad telomerasa y se genera
acortamiento progresivo de los cromosomas causando diversas anormalidades como fusión
cromosomal, aneuploidía, y en una crisis telomérica que normalmente desencadena senescencia
celular con la activación de la p53.
La organización de la cromatina
Para el superenrollamiento de DNA hasta alcanzar la compresión mayor que sucede en la metafase.
1. Fibra nucleosómica: es la que incorpora los octámeros de unas proteínas básicas denominadas
histonas (2 H2A, 2 H2B, 2 H3 y 2 H4) que hacen un carrete con un surco central que le
permite 2.1 vueltas de DNA formando nucleosomas (10 nm de diámetro) . La histona H1
está entre nucleosoma y nucleosoma.
2.
3.
4.
5.
Posteriormente hay un solenoide (30 nm)
Scaffold
Cromatina interfásica
Cromatina metafásica.
Bandeo cromosomal y los patrones estándar para la ubicación de los genes.
FISH.
Chromosome painting
Spectral Kariotype
Reglas de ortología entre el genoma humano y del ratón. Los genes de ratones tienen su mapeo
ortólogo en los humanos, con mapas muy bien especificados.
El proyecto genoma humano (virus es 30000 genes, una página; una bacteria sería un libro de 1000
páginas; el humano serían 1000 libros).
Secuenciación por método de Maxan and Gilbert (1980) se basa en método quimico, ya no se usa
porque no permite grandes secuenciacios; el método de Sanger es enzimático nos permite
secuenciación de grandes genes, y se permitió la automatización. La pirosecuenciación que se basa en
la liberación de pirofosfato que permite la estimación de la frecuencia de base en una secuencia
específica. El proyecto genoma humano se realizó por el método Sanger. En el año 2001 se presenta
el primer draft en un consorcio público y privado. Todavía hay unos 300 gaps del proyecto genoma.
El proyecto genoma del cáncer
El proyecto ENCODE que analizan las secuencias reguladoras.
Hay unos 21 mil genes que codifican proteínas. Hay 6000 genes RNA. La mayoría de los mRNA
pueden dar origen a varios tipos de proteínas por múltiples tipos de splicing. Así que cada gen puede
dar origen a varias proteínas. El 1.1% del genoma humano codifica proteínas. Hay una distribución
heterogénea de los genes humanos con preferencia en regiones subteloméricas y ricas en GC.
La estructura de un gen codificante típica tiene una antesala denominada promotor que es una
secuencia de DNA que tiene subsecuencias que les permite la identificación de la maquinaria basal y
los factores de transcripción. Sigue una región trascripta que no es traducida que tiene el codón de
iniciación AUG (región líder no traducible). Sigue el exón 1, seguido por intrones, que a su vez tienen
secuencias controladores; hay codón de terminación (UGA, UAA, UAG). Posteriormente hay un
tráiler que le adiciona PoliA, terminación en las UTRs.
Tipos de genes por su tamaño y contenido en exones. El tamaño de los genes varía enormemente
entre diferentes genes.
Hay solapamientos. Por ejemplo en la secuencia antiparalela del intrón 26 del gen NF1 hay codificados
3 genes. Otro ejemplo es el ARF/p16.
Los genes repetidos forma familias y superfamilias.
El mayor grado de repetición o redundancia corresponde a secuencias extragénicas repetidas en
tándem o interdispersas que están al lado de los centrómeros denominados satélites (de 100kb a
varios megabases). Hay también minisatélites (de 0.1-20 kilobases) que están ubicados en región
cercana a los telómeros. También hay microsatélites que son de menos de 150 pares de bases,
ubicados en forma dispersa por todos los cromosomas. Así mismo, hay Megasatélites (bloques de
cientos de kilobases) que se ubican en sitios selectos de varios cromosomas. También hay unidades
repetidas interdispersas como LINEs y SINEs que son naufragios virales y que constityen el 21% y
13% del DNA, respectivamente. Es decir, una fracción considerable del genoma humano es una
cacharrería con restos de naufragios virales. En realidad, somos organismos transgénicos.
Tipos de genes o RNAs no codificantes
Hay RNA no codificantes. Hay 6000 genes no codificantes con función conocida en la síntesis de
proteínas y exporte (7SL RNA, rRNA, tRNA); maduración del RNA como splicing (snRNA), ruptura
de pre tRNA (RNasa P), de pre rRNA (RNasa MRP), modificación de base de rRNA (snoRNA) o de
snRNA (scaRNA); regulación génica con efeco en los reguladores de transcripción, interferencia de
RNA, regulación epigenética (como el XistRNA), reguladores trasactivadores largos, RNAs largos con
regulación antisentido cis, reguladores específicos de splicing; control de los transposones como el
piRNA y endo-siRNA. Ejemplos incluyen RNAs de interferencia que sirve para la modulación de la
expresión génica, maduración y modulación de otros mRNA y transposones. Los RNA no
codificantes son importantes en cáncer. Los siRNA editan el mRNA causando una lectura de éste
cambiando la traducción. El Xist RNA se encarga de la inactivación de la inactivación de uno de los
cromosomas X. La lista incluye: RNaseP, miRNA, siRNA, rasiRNA, snoRNA, gRNA, snRNA, rRNA,
XistRNA, tRNA, SRP RNA, 6S RNA.
Hay 3 tipos de básicos de RNA de interferencia que controlan y modulan y expresión de los mRNA.
Los siRNA (small interfering RNA) toman RNA de doble cadena de expresiones virales o moléculas
sentido y antisentido (por ejemplo en secuencia pericentromêricas), y son convertidos en RNA de
una sola cadena en el citoplasma con la habilidad de unirse a mRNA con secuencias homólogas
destruyéndolo. Los miRNA (hay 988 microRNAs maduros en el genoma humano, derivados de 706
genes de miRNA) con habilidad de autoapareamiento que se procesan en el núcleo y son cortados
en fragmentos más peque;o por el DICER. Estos fragmentos de miRNA también impiden la
traducción de mRNA con secuencias homólogas pero no los destruyen en forma directa. Los piRNA
controlan el movimiento de los transposones.
RISC es un complejo multienzimático que utiliza los miRNAs para atenuar la traducción de mRNA,
con un efecto knock-down (y no knock-out).
Los miRNA pueden ser intergenicos o intragenicos; aislados o agrupados; pueden clasificarse en
familias.
miR-23a~24-2 grupo policistrónico (en exón de un transcrito no codificante); miR-15a/16-1 (en
intron del gen no codificante DLEU); miR 106b~25 (grupo policistrónico en intraon del gene
codificante MCM7); miR-985 (en exón del gen codificante CACNG8. El cromosoma 19 humano tiene
54 microRNAs.
Variación
Hay enorme diversidad entre los individuos.
Fuente de variabilidad genética: mutación y recombinación.
La mutacion hace cambios estables en la secuencia de bases de un gen que no se deben a
segregación o recombinación durante la meioisis. Pueden ser: sustituciones de bases, deleciones,
inserciones, inversiones, translocaciones, etc; silenciosa, neutras, delet’erea o letales; sin sentido, de
sentido equivocado, etc.
Polimorfismos: son las variantes alélicas “comunes” de un gen. Al no atentar contra el valor adaptativo
de los individuos (no son deletėreas, ni letales) se reparten aleatoriamente en las poblaciones con
frecuencias superiores a un 1%.
Polimorfismos de repetición: son polimorfismos en donde cambian secuencias de nucleótidos.
SNIPs: Son polimorfismos en donde sólo cambia UN nucleótido. Se encuentran distribuidos por todo
el genoma.
Marcadores polimórficos de DNA: variaciones comunes en la secuencia de DNA de genes o en
secuencia anónimas.
Hay grandes variaciones en el DNA entre los diferentes individuos: copy numbers variations.
Función
Tenemos varios tipos de RNA polimerasa (la tipo I es nucleolar y se encarga de la formación de los
rRNA; la tipo II es única porque sus transcriptos son susceptibles a capping y poliA, y es la utilizada
para todos los genes que generan polipéptidos y la mayoría de los snRNA; la tipo III es importante
para varios tipos de RNA, como el tRNA). La transcripción en organismos eucarióticos sucede en el
núcleo y en las mitocondrias. Los RNA sintetizados en el nucleo han de ser procesado, y exportados
al citoplasma para la síntesis de proteínas. Las mitocondrias tienen su propia factoria de síntesis de
proteínas.
Los genes transcritos por la RNA polimeras II añada una cap, seguida por una ruptura del extremo 3’
no traducible, seguido por la PoliAdenliación en ambos extremos, luego eliminación de intrones y
queda la mRNA funcional.
Las alternativas de splicing son MUY comunes, no son raros. Por ejemplo: en tiroides el gen de la
calcitonina forma calcitonina, y en tejido neural forma un neuropėptido ambas codificadas por el
mismo gen. Eso ocurre con la Apolipoproteina en hígado o intestina.
Transcripción mediante la RNA polimerasa II (genes que codifican polipéptidos): elementos
(secuencias) reguladores en cis: 1. Elementos en el core – promotor como TATA box, BRE, INR, DPE;
2. Elementos en promotor proximal distal como GC boxes, CCAAT boxes que operan como
secuencias intesificadoras o silenciadoras; 3. Elementos específicos de respuesta a estimulos
específicos exteriores: ante hormonas, segundos mensajeros como el AMPc, situados normalmente a
corta distancia antes del promotor; 4. Secuencias enhancers que aumentan niveles basales de
transcripción, y que pueden estar muy alejadas y funcionar en cualquier orientación; 5. Secuencias
silenciadoras como NRSE y 6. Elementos frontera o ailantes (insulators) que bloquean el efecto de los
intensificadores o silenciadores.
Qué es un gen? El gen es una unión de secuencias genómicas que codifican una serie coherente de
productos funcionales potencialmente solapantes.
Descargar