GENOMA HUMANO Y CÓDIGO GENÉTICO Resumen por Mauricio de la clase de José Fernando Piqueras sobre genoma humano y código genético. Es más bien una lluvia de ideas sobre los temas, más que una exposición estructurada. Temario 1. Estructura y organización del material genético humano 2. Variación 3. Función El genoma tiene 3.1 Gigabases en 22 cromosomas y 2 cromosomas sexuales. Aproximadamente el 1% del genoma es mitocondrial (16500 bases, es circular). Demostración de la naturaleza del material genético en bacterias fue realizada por Avery y MacLeod; Delbruc y Luria establecieron la naturaleza de bacteriófagos. Las bases nucleotídicas son citidina, uracilo, timina, adenina y guanina. El uracilo sustituye la timina en el RNA. Las bases nucleotidicas se unen a azucares formando ribosa o desoxirribosa formando los nucleósidos. Cuando se adiciona uno o más fosfatos se forman los nucleótidos. Los nucleótidos pueden sufrir modificaciones adicionales. La organización del DNA es una Doble Hélice: dos cadenas antiparalelas, hélice dextrógira, con complementaridad A:T; G:C, y enrollamiento plectomérico. La robustez del DNA se basa en su naturaleza hidrofóbica. La replicación del DNA lleva implícito un modelo de replicación semiconservativo. El proceso de replicación ocurre durante la fase S del ciclo celular, que dura 6-8 horas. La replicación de los extremos de DNA – los telómeros: las cadenas parentales tienen sus extremos 3’ y 5’; pero las DNA polimerasas sólo son capaces de iniciar replicación a través de cebadores de RNA; y las polimerasas sólo sintetizan en la dirección 5’ a 3’. Una de las cadenas parentales se sintetiza en forma continua, mientras que la cadena complementaria se sintetiza en fragmentos de Okasaki, utilizando cebadores de RNA que después son retirados, seguido por las ligasas que rellenan los agujeros. El último cebador no puede ser reparado creando un acortamiento en los telómeros. La telomerosa es un complejo ribonucleoproteico con actividad transcripatasa reversa que adiciona TTAGGG a los extremos. Las células somáticas no tienen actividad telomerasa y se genera acortamiento progresivo de los cromosomas causando diversas anormalidades como fusión cromosomal, aneuploidía, y en una crisis telomérica que normalmente desencadena senescencia celular con la activación de la p53. La organización de la cromatina Para el superenrollamiento de DNA hasta alcanzar la compresión mayor que sucede en la metafase. 1. Fibra nucleosómica: es la que incorpora los octámeros de unas proteínas básicas denominadas histonas (2 H2A, 2 H2B, 2 H3 y 2 H4) que hacen un carrete con un surco central que le permite 2.1 vueltas de DNA formando nucleosomas (10 nm de diámetro) . La histona H1 está entre nucleosoma y nucleosoma. 2. 3. 4. 5. Posteriormente hay un solenoide (30 nm) Scaffold Cromatina interfásica Cromatina metafásica. Bandeo cromosomal y los patrones estándar para la ubicación de los genes. FISH. Chromosome painting Spectral Kariotype Reglas de ortología entre el genoma humano y del ratón. Los genes de ratones tienen su mapeo ortólogo en los humanos, con mapas muy bien especificados. El proyecto genoma humano (virus es 30000 genes, una página; una bacteria sería un libro de 1000 páginas; el humano serían 1000 libros). Secuenciación por método de Maxan and Gilbert (1980) se basa en método quimico, ya no se usa porque no permite grandes secuenciacios; el método de Sanger es enzimático nos permite secuenciación de grandes genes, y se permitió la automatización. La pirosecuenciación que se basa en la liberación de pirofosfato que permite la estimación de la frecuencia de base en una secuencia específica. El proyecto genoma humano se realizó por el método Sanger. En el año 2001 se presenta el primer draft en un consorcio público y privado. Todavía hay unos 300 gaps del proyecto genoma. El proyecto genoma del cáncer El proyecto ENCODE que analizan las secuencias reguladoras. Hay unos 21 mil genes que codifican proteínas. Hay 6000 genes RNA. La mayoría de los mRNA pueden dar origen a varios tipos de proteínas por múltiples tipos de splicing. Así que cada gen puede dar origen a varias proteínas. El 1.1% del genoma humano codifica proteínas. Hay una distribución heterogénea de los genes humanos con preferencia en regiones subteloméricas y ricas en GC. La estructura de un gen codificante típica tiene una antesala denominada promotor que es una secuencia de DNA que tiene subsecuencias que les permite la identificación de la maquinaria basal y los factores de transcripción. Sigue una región trascripta que no es traducida que tiene el codón de iniciación AUG (región líder no traducible). Sigue el exón 1, seguido por intrones, que a su vez tienen secuencias controladores; hay codón de terminación (UGA, UAA, UAG). Posteriormente hay un tráiler que le adiciona PoliA, terminación en las UTRs. Tipos de genes por su tamaño y contenido en exones. El tamaño de los genes varía enormemente entre diferentes genes. Hay solapamientos. Por ejemplo en la secuencia antiparalela del intrón 26 del gen NF1 hay codificados 3 genes. Otro ejemplo es el ARF/p16. Los genes repetidos forma familias y superfamilias. El mayor grado de repetición o redundancia corresponde a secuencias extragénicas repetidas en tándem o interdispersas que están al lado de los centrómeros denominados satélites (de 100kb a varios megabases). Hay también minisatélites (de 0.1-20 kilobases) que están ubicados en región cercana a los telómeros. También hay microsatélites que son de menos de 150 pares de bases, ubicados en forma dispersa por todos los cromosomas. Así mismo, hay Megasatélites (bloques de cientos de kilobases) que se ubican en sitios selectos de varios cromosomas. También hay unidades repetidas interdispersas como LINEs y SINEs que son naufragios virales y que constityen el 21% y 13% del DNA, respectivamente. Es decir, una fracción considerable del genoma humano es una cacharrería con restos de naufragios virales. En realidad, somos organismos transgénicos. Tipos de genes o RNAs no codificantes Hay RNA no codificantes. Hay 6000 genes no codificantes con función conocida en la síntesis de proteínas y exporte (7SL RNA, rRNA, tRNA); maduración del RNA como splicing (snRNA), ruptura de pre tRNA (RNasa P), de pre rRNA (RNasa MRP), modificación de base de rRNA (snoRNA) o de snRNA (scaRNA); regulación génica con efeco en los reguladores de transcripción, interferencia de RNA, regulación epigenética (como el XistRNA), reguladores trasactivadores largos, RNAs largos con regulación antisentido cis, reguladores específicos de splicing; control de los transposones como el piRNA y endo-siRNA. Ejemplos incluyen RNAs de interferencia que sirve para la modulación de la expresión génica, maduración y modulación de otros mRNA y transposones. Los RNA no codificantes son importantes en cáncer. Los siRNA editan el mRNA causando una lectura de éste cambiando la traducción. El Xist RNA se encarga de la inactivación de la inactivación de uno de los cromosomas X. La lista incluye: RNaseP, miRNA, siRNA, rasiRNA, snoRNA, gRNA, snRNA, rRNA, XistRNA, tRNA, SRP RNA, 6S RNA. Hay 3 tipos de básicos de RNA de interferencia que controlan y modulan y expresión de los mRNA. Los siRNA (small interfering RNA) toman RNA de doble cadena de expresiones virales o moléculas sentido y antisentido (por ejemplo en secuencia pericentromêricas), y son convertidos en RNA de una sola cadena en el citoplasma con la habilidad de unirse a mRNA con secuencias homólogas destruyéndolo. Los miRNA (hay 988 microRNAs maduros en el genoma humano, derivados de 706 genes de miRNA) con habilidad de autoapareamiento que se procesan en el núcleo y son cortados en fragmentos más peque;o por el DICER. Estos fragmentos de miRNA también impiden la traducción de mRNA con secuencias homólogas pero no los destruyen en forma directa. Los piRNA controlan el movimiento de los transposones. RISC es un complejo multienzimático que utiliza los miRNAs para atenuar la traducción de mRNA, con un efecto knock-down (y no knock-out). Los miRNA pueden ser intergenicos o intragenicos; aislados o agrupados; pueden clasificarse en familias. miR-23a~24-2 grupo policistrónico (en exón de un transcrito no codificante); miR-15a/16-1 (en intron del gen no codificante DLEU); miR 106b~25 (grupo policistrónico en intraon del gene codificante MCM7); miR-985 (en exón del gen codificante CACNG8. El cromosoma 19 humano tiene 54 microRNAs. Variación Hay enorme diversidad entre los individuos. Fuente de variabilidad genética: mutación y recombinación. La mutacion hace cambios estables en la secuencia de bases de un gen que no se deben a segregación o recombinación durante la meioisis. Pueden ser: sustituciones de bases, deleciones, inserciones, inversiones, translocaciones, etc; silenciosa, neutras, delet’erea o letales; sin sentido, de sentido equivocado, etc. Polimorfismos: son las variantes alélicas “comunes” de un gen. Al no atentar contra el valor adaptativo de los individuos (no son deletėreas, ni letales) se reparten aleatoriamente en las poblaciones con frecuencias superiores a un 1%. Polimorfismos de repetición: son polimorfismos en donde cambian secuencias de nucleótidos. SNIPs: Son polimorfismos en donde sólo cambia UN nucleótido. Se encuentran distribuidos por todo el genoma. Marcadores polimórficos de DNA: variaciones comunes en la secuencia de DNA de genes o en secuencia anónimas. Hay grandes variaciones en el DNA entre los diferentes individuos: copy numbers variations. Función Tenemos varios tipos de RNA polimerasa (la tipo I es nucleolar y se encarga de la formación de los rRNA; la tipo II es única porque sus transcriptos son susceptibles a capping y poliA, y es la utilizada para todos los genes que generan polipéptidos y la mayoría de los snRNA; la tipo III es importante para varios tipos de RNA, como el tRNA). La transcripción en organismos eucarióticos sucede en el núcleo y en las mitocondrias. Los RNA sintetizados en el nucleo han de ser procesado, y exportados al citoplasma para la síntesis de proteínas. Las mitocondrias tienen su propia factoria de síntesis de proteínas. Los genes transcritos por la RNA polimeras II añada una cap, seguida por una ruptura del extremo 3’ no traducible, seguido por la PoliAdenliación en ambos extremos, luego eliminación de intrones y queda la mRNA funcional. Las alternativas de splicing son MUY comunes, no son raros. Por ejemplo: en tiroides el gen de la calcitonina forma calcitonina, y en tejido neural forma un neuropėptido ambas codificadas por el mismo gen. Eso ocurre con la Apolipoproteina en hígado o intestina. Transcripción mediante la RNA polimerasa II (genes que codifican polipéptidos): elementos (secuencias) reguladores en cis: 1. Elementos en el core – promotor como TATA box, BRE, INR, DPE; 2. Elementos en promotor proximal distal como GC boxes, CCAAT boxes que operan como secuencias intesificadoras o silenciadoras; 3. Elementos específicos de respuesta a estimulos específicos exteriores: ante hormonas, segundos mensajeros como el AMPc, situados normalmente a corta distancia antes del promotor; 4. Secuencias enhancers que aumentan niveles basales de transcripción, y que pueden estar muy alejadas y funcionar en cualquier orientación; 5. Secuencias silenciadoras como NRSE y 6. Elementos frontera o ailantes (insulators) que bloquean el efecto de los intensificadores o silenciadores. Qué es un gen? El gen es una unión de secuencias genómicas que codifican una serie coherente de productos funcionales potencialmente solapantes.