GENOMAS: Información biológica necesaria para construir y mantener un organismo Flujo de información Genoma Transcriptoma ARN : copia de genes que codifican proteínas Proteoma Repertorio de proteínas celulares 1 ADN: Molécula portadora de la Información Biológica ¾ 1865 Mendel : GenesÆ factores particulados ¾ 1869 Miescher : Descubrimiento del Ácidos Nucleicos ¾ 1903 Sutton, Bovery : Teoría Cromosómica: cromosomas unidades hereditarias (factores hereditarios en cromosomas) ¾ 1911 Morgan: Teoría cromosómica de la herencia ¾ 1944 Avery, Mac Leod, Mc Carty : ADN material genético de bacterias Hershey y Chase: ADN material genético de bacteriófagos 2 3 UNIDAD BÁSICA DE LOS ÁCIDOS NUCLEICOS 4 ¾1953 Watson y Crick: Modelo de doble hélice del ADN -Datos de Difracción de rayos X Æ naturaleza helicoidal del ADN (Rosalind Franklin y Wilkins) -Densidad del ADN -Proporción de G=C y A=T (Chargaff) - Doble Hélice (enrollamiento a la derecha) -Polinucleótidos unidos por puentes H entre bases (Uniones permitidas: A-T y G-C) - 2 cadenas de polinucleótidos interaccionan en direcciones opuestas Æ Antiparalelas - Esqueleto de azúcar y fosfatos hacia el exterior Æcargas negativas - Bases en el interior: interacciones hidrofóbicas 5 6 7 8 •bp = par de bases ( bp corresponde aprox a 3.4 Å) •kb (= kbp) = kilo par de bases = 1,000 bp •Mb = mega par de bases = 1,000,000 bp •Gb = giga par de bases = 1,000,000,000 bp 9 Tm 50% del ADN desnaturalizado Tm genomas entre 85-95ºC Depende del contenido de GC del genoma 10 ARN • • • Unidades: ribonucleótidos Bases: adenina, citosina, guanina y uracilo En general: un único polipéptido Uniones fosfodiester 3’-5’ del ARN menos estables por efecto indirecto del OH en la posición 2’ del azúcar 11 Contenido de ARN en las células 12 Procesamiento de precursores de ARN -Modificaciones de los extremos (ARNm eucariotas: CAP y polyA) - Corte y empalme: eliminación de segmentos internos del ARNm que no contienen información biológica. - Eventos de clivaje: procesamiento de ARNr y ARNt -Modificaciones químicas de las bases (ARNr, ARNt y ARNm): agregado de grupos químicos a nucleótidos específicos 13 Tipos de ARN •ARNt -50-85 nt -Estructura secundaria y terciaria conservada -Bases inusuales •ARN ribosomal •ARN mensajero •Pequeños ARN citoplasmáticos y nucleares 14 Contenido de DNA de genomas haploides (Valor C) y complejidad Valor C: Cantidad total de ADN en el genoma haploide 15 Tamaños mínimos de genomas 16 CINÉTICA DE RENATURALIZACIÓN DEL DNA Renaturalización del DNA: apareamiento de bases complementarias Depende de : La concentración del DNA la temperatura de reasociación la concentración de sales. La velocidad de renaturalización de secuencias de DNA en solución depende del encuentro al azar de las cadenas complementarias. La velocidad de reasociación de una secuencia en particular es proporcional al número de veces que se encuentra presente 17 • Co = concentración de DNAsc al inicio de la reacción de reasociación (moles de nucleótido/litro) • t = tiempo de reasociación (medido en segundos) • C/Co = cantidad de DNA sc remanente. • k = constante de la velocidad de reasociación. 1 C/Co = 1 + k Cot Describe la cinética de reasociación del DNA •Cuando el 50% del DNA está reasociado (C/Co =1/2): Cot 1/2 = 1/k 18 METODOLOGÍA • A) DNA fraccionado en fragmentos de aprox. 450pb (por sonicación) • B) El DNA se alicuota en tubos con una concentración determinada de DNA • C) Desnaturalización del DNA • D) Reasociación del DNA a distintos tiempos. (se colocan los tubos en un baño de agua a una temperatura adecuada, por ejemplo Tm-25ºC). • E) Calculo del % del DNAsc remanente para cada valor de Cot. • F) Se grafica el % de DNAsc remanente en función del valor de Cot (logaritmo) Æ Curva Cot 19 La velocidad de reasociación es inversamente proporcional al largo del ADN con secuencia diferente Complejidad cinética 20 Tamaño de genomas/Complejidad de genomas El valor de Cot ½ aumenta con la complejidad del genoma COMPLEJIDAD Largo total de secuencias diferentes Complejidad del genoma de E.coli = 4 x 106 Cot ½ genoma X Cot ½ E.coli = Complejidad genoma X 4 x 106 21 Curva Cot genoma eucariota Cot ½ E.coli= 4 Complejidad E.coli= 4,2 x 106 Genoma total: 6,7 x 108 componente lento: 3 x 10 8 componente intermedio: 2 x 10 8 componente rápido: 1,7 x 10 8 22 •La velocidad de reasociación de una secuencia de DNA es directamente proporcional al número de veces que ocurre en el genoma. •Secuencias repetitivas reasocian con valores de Cot menores que secuencias de copia única. •En los genomas eucariotas la complejidad del componente lento puede servir para estimar el tamaño del genoma 23 • Mediante el análisis de la curva Cot se puede determinar: • El tamaño del genoma • La proporción relativa de secuencias de copia única y secuencias repetitivas • La fracción del genoma que representa cada componente • La complejidad media de las secuencias de cada componente. 24 1er componente : Complejidad 2000pb (1 especie de ARN) 2ndo componente: Complejidad 15kb (7 a 8 tipos distintos de ARNm) 3er componente: complejidad 26Mb (13000 ARNm distintos) 25 Desnaturalización de los distintos componentes del genoma Componente no repetitivo: curva de desnaturalización similar al genoma total (Tm similar) Componente repetitivo: curva de desnaturalización muy extendida (componentes con distintos Tm) Secuencias apareadas no idénticas La modificación de las condiciones de reasociación (cambio en la rigurosidad) puede determinar un cambio en la proporción de los distintos componentes 26 Proporción de los distintos componentes en los genomas eucariotas (altamente repetitivo, repetitivo, no repetitivo) Species Sequence Distribution Bacteria 99.7% Single Copy Mouse 60% Single Copy 25% Middle Repetitive 10% Highly Repetitive Human 70% Single Copy 13% Middle Repetitive 8% Highly Repetitive Cotton 61% Single Copy 27% Middle Repetitive 8% Highly Repetitive Corn 30% Single Copy 40% Middle Repetitive 20% Highly Repetitive Wheat 10% Single Copy 83% Middle Repetitive 4% Highly Repetitive 55% Single Copy Arabidopsis 27% Middle Repetitive 10% Highly Repetitive Máximo contenido de ADN no repetitivo: 2 x 109 pb 27 28 DNA altamente repetitivo Repeticiones en tandem ORIGEN Errores en la replicación Recombinación desigual – DNA satélite: • secuencias de DNA cortas repetidas en la misma orientación sin secuencias intermedias • 5-200pb • Alrededor del centrómero – Ej: DNA alfoide (centrómero humano) unidades de 171pb (ricas en AT) 29 – Minisatélites (VNTR) • Unidades repetidas de hasta 25pb • Segmentos de DNA de hasta 20kb • Ej: telómeros (humano TTAGGG aprox 100copias) – Microsatélites (SSR) • Unidades repetidas < 13pb (1, 2, 3 o 4pb repetidas 10-20 veces) • Segmentos de DNA < 150pb • Polimórficos Æ número de repeticiones variables en distintos miembros de una sp (perfil genético) Trinucleótidos (CAG, CCG): tipo de microsatélites relacionados con enfermedades genéticas (X Fragil, Huntington, distrofia miotónica) 30 Perfil Genético 31 DNA altamente o moderadamente repetitivo Repeticiones dispersas – Retrotransposones • LINES -> LINE-1 (genoma humano) 6.1kpb, 516.000copias • SINES-> <300pb Alu (humano) 1 x 106 copias – Transposones 32 DNA moderadamente repetitivo • Genes rRNA – E.coli Æ • 7 copias dispersas – EucariotasÆ • >100copias • Grupos de copias repetidas en tandem • Ej: genoma humanoÆ – 5 grupos en 5 cromosomas – 150 a 200 copias – Polimórfico 33 • 5s rRNA • tRNA • Sc RNA • Ej 7SL RNA : 3copias + >100 pseudogenes • Sn RNA • Familias multigénicas • • • • • Globina (cluster) Histona (dispersas) Tubulina Actina Inmunoglobulinas 34 35 36 Species Tamaño de Genomas con secuencia completa o borrador publicada Eukaryotes Arabidopsis thaliana (plant) Caenorhabditis elegans (nematode worm) Drosophila melanogaster (fruit fly) Homo sapiens (human) Saccharomyces cerevisiae (yeast) Bacteria Escherichia coli K12 Mycobacterium tuberculosis H37Rv Mycoplasma genitalium Pseudomonas aeruginosa PA01 Streptococcus pneumoniae Vibrio cholerae El Tor N16961 Yersinia pestis CO92 Archaea Archaeoglobus fulgidus Methanococcus jannaschii Size of Approximate genome (Mb) number of genes References 125 25 500 AGI (2000) 97 19 000 CESC (1998) 180 13 600 Adams et al. (2000) 3200 30 000 40 000 12.1 5800 IHGSC (2001); Venter et al. (2001) Goffeau et al. (1996) 4.64 4.41 4400 4000 Blattner et al. (1997) Cole et al. (1998) 0.58 6.26 500 5700 Fraser et al. (1995) Stover et al. (2000) 2.16 4.03 2300 4000 4.65 4100 Tettelin et al. (2001) Heidelberg et al. (2000) Parkhill et al. (2001) 2.18 1.66 2500 1750 Klenk et al. (1997) Bult et al. (1996) 37 38 Organización genética 39 Segmento del genoma humano 40 41 42 43 Genes interrumpidos en eucariotas 44 Tamaño de genes en levaduras, insectos y mamíferos. 45 Mamíferos Levaduras 46 Largo de exones e intrones 47 Gen humano promedio: 27kb con 9 exones 48 Estructura y anatomía de los genomas Bacterias Procariotas - < 5x106pb - Molécula única de DNAcirc Archae - 1x107pb – 1x 1012pb Nuclear Eucariotas - 2 o + moléculas de DNA linear Genoma Organelas -DNA circular -Múltiples copias 49 Estructura Genoma Procariota Estructura Genoma Eucariota • Organización compacta (poco espacio entre genes) • Genoma compuesto por 2 o más moléculas de ADN linear (cromosomas) •Información adicional en plásmidos • DNA no codificante en pequeños segmentos dispersos en el genoma (<11%) • No hay intrones • Organización menos compacta • DNA repetitivo (disperso y en tandem) • Intrones • Organización en operones (E.coli aprox 600 operones con 2 o más genes) 50 Genoma de Organelas • Herencia “no medeliana”, segregación somática • Origen endosimbiótico • Moléculas de DNA circular, en general • Número de copias por organela elevado (10- 100) • Tamaño variable – Mitocondrias: 16,5kb mamífero – 366kb en plantas (2400 kb en algunas plantas) – Cloroplastos: 100-200kb • Contenido genético – Proteínas involucradas en procesos de la organela – RNA ribosomales y de transferencia • Acumulación de mutaciones diferente a DNA genómico – En mamíferos tasa de mutación mayor, en plantas menor. 51 • Genoma mitocondria •Genoma cloroplastos – Tamaño variable • Mamíferos 16,5 kb • Levaduras 84kb • Plantas superiores: de 100 a 2400kb (Maiz 570kb) – 5 a 90 genes (37 genes en •100- 200kb •Aprox 200genes •20 a 40 copias/ organela •20 a 40 organelas /célula •Intrones mamíferos) – Intrones – Sec.intergénica – Duplicaciones – Círculos subgenómicos 52 Comparación del genoma mitocondrial de levadura y mamífero Mamífero 16kb Extremadamente compacto Sin Intrones Algunos genes superpuestos 13 genes codifican proteínas (cad respiratoria) Levadura 84kb Intrones 53 Genoma mitocondria (levadura) 54 Genoma cloroplasto (arroz) Cloroplasto 120-190kb Intrones 87-183 genes 4 RNA rib 30-32 ARNt genes codifican proteínas aprox 50 Prot ribosomales RNA polimerasa Fotosíntesis 55