Facultad de Medicina TEMA Genética – 1er Curso 0-2 EXPRESIÓN GÉNICA:FLUJO DE INFORMACIÓN GENÉTICA 9 9 9 9 Genes. El código genético. Dogma central de la Biología Molecular. Expresión génica. Genes Apartados Estructura Promotores Intrones y exones Pseudogenes Genes Estructura La información biológica que necesita un organismo para reproducirse a sí mismo está contenida en el ADN. Esta información está codificada en la secuencia de bases y se organiza en un gran número de genes, cada uno de los cuales contiene las instrucciones para la síntesis de un polipéptido Gen: segmento de ADN con una secuencia de bases que codifica la secuencia de aminoácidos de un polipéptido El tamaño de los genes varía desde <100 pb hasta varios millones de pb. En humanos se estima unos 15.000-20.000 genes ordenados en 23 cromosomas Los genes están muy dispersos, separados por secuencias aparentemente inútiles: ADN intergenómico (>70%) Hay una cadena molde, a partir de la cual se sintetiza el ARNm: antisentido. La otra cadena, que no se usa como molde, es la que contiene la información: “con sentido” Gran capacidad del ADN para almacenar información. ADN n bases de largo, 4n posibles combinaciones Genes Estructura Genes Promotores La expresión de la información biológica presente en los genes está altamente regulada No todos los genes del ADN de una célula se expresan. Diferentes genes están activos en diferentes tipos celulares (músculo, sangre, etc.) La regulación ocurre en un segmento aguas (“upstream”) de la secuencia codificante. Promotor arriba En el promotor se unen la ARN polimerasa y los factores de transcripción Genes Intrones y exones Sorprendentemente, en organismos superiores, la información codificada esta dividida en segmentos de ADN llamados exones. Los exones están separados por secuencias que no contienen información útil, los intrones. El número de intrones varía desde 0 a más de 50 en algunos genes. La longitud de exones e intrones varían, pero los intrones suelen ser mucho más grandes, abarcando la mayoría de la secuencia de un gen. Antes de utilizar la información de un gen para sintetizar una proteína, se deben eliminar los intrones del ARNm, mediante “splicing” Genes Pseudogenes Hay genes que se asemejan a otros pero al examinarlos se observan errores en su secuencia, de modo que no contienen información biológica útil: pseudogenes. Son genes que han adquirido errores o mutaciones en su secuencia de ADN durante la evolución, invalidando su información y no pudiendo codificar proteínas. Un ejemplo, son varios pseudogenes de la globina que están incluidos en los grupos de genes globina. Genes Objetivos Estructura Un gen es una unidad de información y corresponde a un segmento discreto de ADN que codifica la secuencia de aminoácidos de un polipéptido. Las células humanas contienen alrededor de 30.000-50.000 genes en 23 cromosomas. Los genes están dispersos y separados por ADN intergénico no codificante. Promotores La expresión génica está muy regulada. No todos los genes de una célula están activos y diferentes tipos de células expresan diferentes genes. La regulación se ejerce en un segmento de ADN aguas arriba de la secuencia codificante llamado promotor. A ella se unen la ARN polimerasa y factores de transcripción, iniciando la síntesis de una molécula de ARN. Intrones y exones La secuencia codificante de un gen está dividida en una serie de segmentos llamados exones que están separadas por una serie de secuencias no codificantes llamadas intrones que suelen abarcar la mayoría de la secuencia del gen. El número y tamaño de los intrones varía entre genes. Los intrones no suelen presentarse en bacterias. Pseudogenes Son copias de algunos genes, las cuales contienen errores en la secuencia adquiridos durante la evolución previniendo su traducción a proteínas. Código genético Apartados Código genético Tramos de lectura Universalidad del código Código genético Código genético El código genético describe como las secuencias de bases se convierten en secuencias de aminoácidos durante la síntesis de proteínas. La secuencia de ADN de un gen se divide en unidades de tres bases llamadas: codón. Es como una “palabra” de tres “letras” en el lenguaje de las bases. Cada codón especifica un aminoácido. La combinación de las 4 bases de 3 en 3 da un total de 43 = 64 codones que especifican los 20 aminoácidos encontrados en las proteínas. Todos los aminoácidos, excepto la metionina y el triptófano, están codificados por más de un codón Æ degeneración del código genético. Codones sinónimos: especifican el mismo aminoácido. ACU, ACC, ACA, ACG Æ treonina. UAG, UGA, UAA Æ codones de terminación. Son señales de parada para la síntesis proteica. AUG Æ codón de inicio. Código genético Código genético • cada codón sólo codifica un aminoácido (no ambigüedad) • un aminoácido puede ser codificado por más de un codón (redundancia) • la variabilidad está en la 3ª posición del codón (base inestable, “wooble”) Código genético Tramos de lectura Tramo de lectura 1 5 – AUG ACU AAG AGA UCC GG – 3 Met Thr Lys Arg Ser Tramo de lectura 2 5 – AUGA CUA AGA GAU CCG G – 3 Stop Leu Arg Asp Pro Tramo de lectura 3 5 – AUGAC UAA GAG AUC CGG – 3 Asp Stop Glu Ile Arg Código genético Tramos de lectura El codón de inicio, además de indicar el comienzo de la síntesis de proteína, también determina el tramo de lectura de la secuencia de ARN. Según la base que se elija como inicio del codón, tres posibles grupos de codones pueden ser leídos a partir de cualquier secuencia de bases. En la práctica, durante la síntesis proteica, sólo un tramo de lectura contiene información útil; los dos otros tramos suelen contener varios codones stop. Tramo de lectura abierto (“Open Reading Frame”, ORF): conjunto de codones continuos cuyo principio está unido a un codón de inicio y el final a un codón de terminación. Código genético Universalidad del código El código genético se aplica prácticamente de modo universal. Todos los organismos reconocen para cada codón los mismos aminoácidos. Existe alguna variación: - Mitocondrias: contienen un genoma de 20 genes UGA Æ Trp en vez de stop AGA/AGG Æ stop en vez de Arg AUA Æ Met en vez de Ile - Algunos protozoos: UAA/UAG Æ Glu en vez de stop. Código genético Objetivos Código genético Tramos de lectura Los aminoácidos (aa) están codificados por 64 tripletes de bases denominados “codones”, los cuales codifican para los 20 aa. Muchos aa tienen más de un codón: degeneracción del código genético. Esto ayuda a minimizar el efecto de las mutaciones. Los codones que especifican la misma base se llaman sinónimos y se suelen diferenciar en la tercera base, conocida como la posición “inestable”. AUG es el codón de inicio y codifica para metionina; hay 3 codones de parada: UAG, UGA, UAA. Tres posibles juegos de codones pueden ser leídos a partir de cualquier secuencia dependiendo de la base elegida como inicio del codón. Cada juego se conoce como “tramo de lectura “. El codón de inicio determina el tramo de lectura de la secuencia codificante de proteína. Un “tramo de lectura abierto” es una secuencia de codones unidos por los codones de inicio y parada. El código genético se aplica universalmente a todos los organismos: los mismos codones para cada aa. Hay excepciones como son el genoma mitocondrial y algunos organismos unicelulares. Universalidad del código Dogma central Biología Molecular Apartados Dogma central Hipótesis “un gen una enzima” Dogma central Biología Molecular Dogma central Dogma central Biología Molecular Hipótesis “un gen una enzima” Dogma central Biología Molecular Objetivos Dogma central El ADN produce ARN el cual produce proteínas, mediante los procesos de transcripción y traducción respectivamente. Esto es cierto en términos generales. Hay algunos procesos que lo contradicen. Los retrovirus sintetizan ADN a partir de ARN por transcripción inversa. Otros virus replican ARN. Algunos organismos editan la secuencia del ARN mensajero (ARNm) de modo que la proteína no es codificada específicamente por el ADN. Hipótesis “un gen una enzima” Un gen codifica para una proteína. Expresión génica Apartados Expresión génica Expresión génica en eucariotas Expresión génica Expresión génica Es el proceso por el cual la información contenida en la secuencia de bases del ADN se hace asequible a la célula Sólo alrededor del 3-5% de todos los genes en una célula humana se expresan en un determinado momento. Los genes que se expresan pueden ser específicos para un tipo celular particular o un tejido. Expresión génica Expresión génica - los eucariotas llevan a cabo la transcripción en el núcleo. El ARNm es pre-procesado antes de la traducción Célula eucariota Expresión génica Expresión génica en eucariotas La transcripción tiene lugar en el núcleo y la traducción en el citoplasma. Por tanto, los ARNm deben tener una vida más larga que la de los procariotas El ARNm se sintetiza como precursor mediante la ARN polimerasa II. Suele codificar sólo una proteína (monocistrónicos) Los ARN son modificados en el núcleo mediante “capping” en 5’ y añadiendo una cola poli(A) en 3’ que aumentan su estabilidad Los intrones se eliminan por “splicing”, un proceso dirigido por un complejo de proteínas, “ribonucleoproteínas nucleares pequeñas” (snRNP) Expresión génica Objetivos Expresión génica Es el proceso por el cual la información contenida en la secuencia de bases del ADN se hace asequible a la célula Expresión génica en eucariotas La mayoría de ARNm son monocistrónicos. Se sintetiza un ARNm precursor al cual se le añade una caperuza, “cap”, en 5’ y una cola poli(A) en 3’. Los intrones se eliminan por “splicing” antes de que el ARNm maduro se exporte al citoplasma para su traducción.