Herramientas moleculares para estudios genómicos Analiza la variación a nivel del ADN (genotipo) por diferentes metodologías Dra. M. Carolina Martinez Instituto de Biotecnología CICVyA, INTA Castelar martinez.mc@inta.gob.ar Temas: • Conceptos: Gen, Genoma, Genómica • Organización del genoma • Herramientas para estudiar los genomas: Mapeo genético Mapeo físico , FISH Marcadores Moleculares Random DNA Markers Functional Markers Secuenciación: Teórica de P. Cerdán Genómica: es la rama de la biología que se encarga del estudio de los genomas. Mapeo, secuenciación y análisis de las funciones de genomas completos (Thomas Roderick, 1986) Caracterización molecular de genomas enteros: secuencia y función de cada sector del genoma. Genómica es el conjunto de ciencias y técnicas dedicadas al estudio integral del funcionamiento, el contenido, la evolución y el origen de los genomas. Es una de las áreas más vanguardistas de la biología. La genómica usa conocimientos derivados de distintas ciencias como la biología molecular, la bioquímica, la informática, la estadística, las matemáticas, la física, etc. Genómica funcional, Genómica estructural, Genómica comparativa, Farmacogenómica , Metagenómica, Genómica agropecuaria , Genómica forense, Genómica ambiental, Genómica industrial… Muchas veces, la Genómica es usada como sinónimo de otras áreas de estudio relacionadas como son la Proteómica y la Transcriptómica por ejemplo. Las ciencias genómicas han tenido un importante auge en los últimos años, sobre todo gracias a las avanzadas técnicas de secuenciación, a los avances en bioinformática, y a las técnicas cada vez más sofisticadas para realizar análisis de genomas completos. ¿Qué es un genoma? El genoma representa el contenido de ADN total de una célula, incluídos los genes y las regiones intergénicas. Uno de los desafíos más importantes para la biología a comienzos del siglo XXI es entender la información contenida en las secuencias genómicas. Concepto de gen Genética clásica: es la unidad de herencia que permite transmitir una característica dada de padres a hijos Bioquímica: Características asociadas a proteínas o enzimas Biología Molecular (Dogma central): ADN → ARN → Proteína ● Splicing alternativo ● Ambas cadenas de ADN pueden codificar, transcriptos superpuestos, transcritos fusionados, exones a cientos o miles de bases de distancia (continuum of transcripts) ● Nuevos roles del ARN (ribozimas, microARNs y otros ARN no codificantes con funciones regulatorias, señales), fenómenos epigenéticos Bioinformática: dónde empieza y dónde termina un gen? “Una región localizable de secuencia genómica, correspondiente a una unidad de herencia, la cual está asociada con regiones regulatorias, regiones transcriptas y/u otras regiones de secuencia funcionales.” Pearson H. (2006) What is a gene? Nature, 441:399-401. Estructura básica de un gen eucariota GEN A SECUENCIAS REGULATORIAS PROMOTOR B EXÓN C D E INTRÓN SECUENCIAS TERMINADORAS Transcripción: RNA (transcrito primario) Adición de cap y cola de poli-A Splicing alternativo RNA maduro Exportación Traducción NÚCLEO CITOPLASMA Cuándo producirlas? Cuánto se produce? Cuál producir? Dónde producirlas? A B C PROTEÍNAS E A C D E GEN A PROMOTOR SECUENCIAS REGULATORIAS EXÓN B -25 Caja TATA Secuencias regulatorias D INTRÓN A -100 Caja CAAT C 5´UTR E SECUENCIAS TERMINADORAS E 3´UTR Inicio de la transcripción Promotores “fuertes” y “débiles” Secuencias codificantes Secuencias no codificantes La transcripción depende de múltiples elementos Exones e intrones Genes: Eucariotas vs. Procariotas: diferente estructura y organización Codones: redundancia del código uso diferencial de codones en distintas especies, optimización de codones (Cry1A Bacillus thuringensis vs. Cry1A sintética) Tamaño de genoma vs. Nro de genes Tamaño del genoma y número de genes de varios organismos Tamaño del genoma (Mb) Nro. de genes Mycoplasma genitalium 0.58 500 Streptococcus pneumoniae 2.2 2300 Escherichia coli 4.6 4400 Saccharomyces cerevisiae 12 5800 Arabidopsis thaliana 125 25.500 Caenorhabditis elegans 97 19.000 Drosophila melanogaster 180 13.700 Mus musculus 2500 29.000 Homo sapiens 2900 27.000 Oryza sativa 466 45-55.000 Especies Watson JD, Baker TA, Bell SP, Gann A, Levine M, Losick R (2004). Molecular Biology of the Gene, 5th ed., Peason Benjamin Cummings (Cold Spring Harbor Laboratory Press). Organización del genoma Relevamiento de secuencias de ADN en el genoma vegetal Centrómeros Telómeros Microsatelites y Minisatelites Repeticiones en tandem Satélites Genes Copias Degeneradas Secuencias dispersas Retroelementos Pseudogenes Transposones Cromosoma Modelo Schmid T ySchmid Heslop-Harrison JS (1998) Plant 3, 195-199 T y Heslop-Harrison JS (1998)Trends Trends inin Plant Sci.,Sci., 3, 195-199 Actualmente la Biología Molecular se centra en el estudio de los genomas más que en el de los genes individuales. Si bien, todavía no se pueden explicar adecuadamente todos los eventos que conducen del ADN a las proteínas de manera completa en términos de “Genoma -> Transcriptoma -> Proteoma” VISIÓN INTEGRADORA ¿Por qué estudiar los genomas (Ej. Humanos, Plantas, Animales, microorganismos, etc)? Para: Mapas de ligamiento Mapeo de genes y QTLs Selección asistida por marcadores Clonado posicional de genes Estudios de variabilidad/diversidad genética en distintas especies (plantas y fitopatógenos) germoplasma, identificación de cultivares, etc Estudios evolutivos ¿Qué es un marcador molecular? Puntos de referencia en los cromosomas, permiten conocer el GENOTIPO Todo o cualquier fenotipo molecular oriundo de un gen expresado (ej. Isoenzimas) o de un segmento específico del ADN (correspondiente a regiones expresadas o no del genoma). Estudios de variabilidad/diversidad MBD A B C D E GEL A B C D E 1 Dendrograma 1 0 1 0 1 0 1 1 1 0 0 1 1 0 1 1 1 1 1 1 0 0 1 1 0 0 1 1 1 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 1 1 0 0 1 0 0 1 1 2 Indice de Jaccard (Bandas compartidas / bandas totales) 2 MC MS A 4 3 UPGMA A B C D E B C D E 5/9 3/8 5/8 3/8 4/9 3/7 2/9 2/11 1/9 3/7 Fig. 3. Dendrogram of Diaporthe/Phomopsis isolates based on unweighted pair-group method with arithmetic average obtained using NTSYS program with Jaccard similarity coefficient calculated from random amplified polymorphic DNA. DPM = D. phaseolorum var. meridionalis, DPC = D. phaseolorum var. caulivora, DPS = D. phaseolorum var. sojae, and PL = P. longicolla. Morphologic, Molecular, and Pathogenic Characterization of Diaporthe phaseolorum Variability in the Core SoybeanProducing Area of Argentina Rosanna N. Pioli, Eligio N. Morandi, María C. Martínez, Florencia Lucca, Alejandro Tozzini, Vilma Bisaro, and H. Esteban Hopp PHYTOPATHOLOGY Vol. 93, No. 2, 2003 Mapas de Ligamiento Indican la posición y la distancia genética relativa entre marcadores a lo largo del cromosoma (mapa de ruta) Para identificar regiones cromosómicas que contienes genes que controlan caracteres simples (gen único) y caracteres cuantitativos (usando análisis de QTLs) Fundamento: Los genes y los marcadores segregan vía recombinación cromosómica (crossing-over) durante la meiosis permitiendo su análisis en la progenie. Los genes o marcadores del parental que se encuentran juntos o estrechamente ligados serán transmitidos juntos a la progenie más frecuentemente que aquellos que se encuentran separados. En una población segregante habrá una mezcla de genotipos parentales y recombinantes. La frecuencia de los genotipos recombinantes puede ser usada para calcular la fracción de recombinación, las cuales pueden ser usadas para inferir distancias genéticas entre marcadores. Se pueden así determinar el orden relativo y la distancia entre marcadores (entre marcadores: menor frecuencia de recombinación, menor la distancia) Marcadores con frec. de recombinación >50%, no ligados (muy distantes o en cromosomas diferentes) Las funciones de mapa se usan para convertir las unidades de recombinación en unidades de mapa: cM (centiMorgan) Porque la frecuencia de recombinación y la frec. de crossing-over no están linealmente relacionadas (sólo se da para distancias < 10 cM) Kosambi: tiene en cuenta la interferencia entre dos eventos de recombinación adyacentes Haldane: no asume interferencia OJO: distancia genética no está directamente relacionada con la distancia física, depende del tamaño del genoma, varía a lo largo del cromosoma (sitios donde es más frecuente la recomb. y sitios donde es menos frecuente) ¿Cómo estudiar un genoma? -A partir de una genoteca de insertos grandes (BAC o YAC library) -Contando con un mapa genético saturado (con muchos marcadores) -Por secuenciación directa Mapeo genético de baja resolución (recombinación meiótica) Mapeo genético de alta resolución (marcadores moleculares) Mapeo físico (secuencias de fragmentos clonados solapados) Secuenciación Genómica estructural SINTENIA MAPA COMPARATIVO: comparación de regiones cromosómicas de distintas especies que comparten marcas en un orden conocido. MAPA GENETICO: distancia entre marcas medidas en función de recombinación Estudio de los genomas: técnicas de mapeo PP Green, Current Topics in in Genome Analysis Green, Current Topics Genome Analysis Estudio de los genomas: técnicas de mapeo Mapeo Genético: basado en el empleo de técnicas genéticas para construir mapas mostrando las posiciones de genes y otras secuencias (marcadores) en un genoma. Las técnicas incluyen análisis de cruzamientos, pedigrees (en humanos). Mapeo Físico: basado en el empleo de técnicas de biología molecular para examinar las moléculas de ADN directamente con el objeto de construir mapas que muestren las posiciones de las secuencias (genes, otras). Ej: en genoma pequeño, mapeo por restricción Mapeo Físico •FISH (permite visualizar la posición de marcadores moleculares marcados con fluorescencia en lo cromosomas) In situ hybridization of DNA sequences over sunflower chromosomal glasses stained with DAPI • STS (técnica más poderosa de mapeo físico junto con las genotecas de insertos largos) Genoteca insertos largos BAC Species 'cultivar' Genome size () Arabidopsis thaliana 'Columbia' 100 # BAC clones 12,672 Poncirus trifoliata 'Rubidoux' 382 Glycine max ‘Willams82' insert size (kb) Genome coverage Reference 100 12.0 Choi et al. 1995 45,312 76 9.0 Yang et al. 1999 1,115 40,000 150 4.5 Marek et al. 1997 Lactuca sativa ‘Diana’ 2,500 50,000 111 2.0 Frijters et al. 1997 Hordeum vulgare 'Morex' 5,000 313,344 110 6.3 Yu et al. 1999 Solanum lycopersicum 'Heinz 1706' 954 147,456 115 15.0 Budiman et al. 2002 Oryza sativa indica 'Tequing' 441 14,208 130 4.4 Zhang et al. 1996 3,076 103,296 130 4.5 Tomkins et al. 1999 760 13,440 130 2.6 Woo et al. 1994 5,751 276,480 115 5.6 Lijavetzky et al. 2000 750 36,864 120 5.9 Vinatzer et.al 1998 2.504 422,400 120 20.2 Tomkins et al. 2000 Saccharum officinarum 'R570' Sorghum bicolor 'BTx623' Triticum monococcum ‘DV92’ Malus domestica ‘Florina’ Zea mays 'LH132' (Mb/1C) DNA insert prep BAC vector prep HMW DNA isolation HindIII Serial digestion HindIII digestion Dephosphorylation 1st & 2nd size selection (PFGE) for restricted fragments 100-150kb Library construction Ligation (T4 DNA Ligase) Electroporation into E. coli Plate on CM medium Store recombinant clones in 384 well plates White colonies: recombinants Blue colonies: non-recombinants Manual Picking Manual Copying High density filters • • • 48 384-well plates 18,432 clones 8 clones twice/square https://bacpac.chori.org/fi2.htm Hibridación del filtro Con marcador de interés (sonda) Mapeo Físico •FISH (permite visualizar la posición de marcadores moleculares marcados con fluorescencia en lo cromosomas) In situ hybridization of DNA sequences over sunflower chromosomal glasses stained with DAPI • STS (técnica más poderosa de mapeo físico junto con las genotecas de insertos largos) Mapeo Físico de STS High Throughput Sequencing/Genomics Course (Oct 25-Nov7 2000)/ John McPherson WU Mapeo Físico de STS Minimal tiling path selected for sequencing. High Throughput Sequencing/Genomics Course (Oct 25-Nov7 2000)/ John McPherson WU Estrategia de secuenciación Esquema de Secuenciación de los Genomas Estrategias alternativas de secuenciación ¿Cómo secuenciar un genoma? Estrategias Cuantos más marcadores en el mapa genético, mejor ¿Cómo secuenciar un genoma? Estrategia actual: SECUENCIACIÓN POR TÉCNICAS DE NGS (Next generation Sequencing) Genómica estructural: caracterización física de genomas enteros Mapeo genético→ Mapeo físico Las distancias físicas generalmente no se correlacionan con las distancias genéticas porque las frecuencias de recombinación no son siempre proporcionales a las distancias moleculares. A menudo, las dos correlacionan razonablemente en regiones de eucromatina (ej. Humanos: 1cM = 1 Mb = 1 millón de pb)) - Asignación de loci a cromosomas específicos (ligamiento; PFGE; híbridos celulares interespecíficos) -Ubicación de los genes a lo largo del cromosoma (mapeo por recombinación generando mapas de alta densidad; hibridación in situ FISH; mapeo físico por fragmentos clonados superpuestos, contigs, que representan un cromosoma o genoma siendo la base para la secuenciación) -Secuenciación a gran escala del genoma Secuenciación genómica Secuenciación de ESTs ¿Qué es un marcador molecular? Puntos de referencia en los cromosomas, permiten conocer el GENOTIPO Todo o cualquier fenotipo molecular oriundo de un gen expresado (ej. Isoenzimas) o de un segmento específico del ADN (correspondiente a regiones expresadas o no del genoma). Marcadores Morfológicos Fenotipos que resultan de mutaciones en el ADN Tomado de “The Cartoon Guide to Genetics”, Larry Gonick, Marck Wheelis Tomado de “An Introduction to Genetic Analysis”, Griffiths A.J.F y col. (2000). W.H. Freeman Ediciones Marcadores morfológicos Marcadores moleculares Influencia del ambiente Sin influencia ambiental y neutros Bajo número, en pocas sps. Cantidad ilimitada Baja cobertura del genoma Amplia cobertura del genoma Bajo nivel de polimorfismo Alto nivel de polimorfismo Menos informativos (dominantes o recesivos) Más informativos (en gral. codominantes) Caracteres de madurez Análisis en fases tempranas Entrenamiento y subjetividad Sencillos, rápidos y objetivos Plant Cell Rep (2008) RFLP (Restriction Fragment Length Polymorphism), Polimorfismo en el Largo de los Fragmentos de Restricción RFLP Análisis mediante RFLP de los parentales resistente (R) y susceptble (S) al virus PVX de Solanum commersonii empleando las enzimas de restricción HinfI, DdeI, HindIII, DraI, EcoRI, XbaI y StyI (1 al 7). Autoradiografía de los perfiles de RFLP obtenidos con la sonda s1+A/as1+T(584) marcada radiactivamente. Obtención de sondas para RFLP Vector de clonado Transformación Origen del polimorfismo de los RFLP Adaptado de Ferreira M.E. & Grattapaglia D. Introdução ao uso de marcadores moleculares em análise genética (1995) Mutaciones puntuales: Ocurren en sitios de restricción (Ej de SNP). Mutaciones estructurales: Ocurren mediante inserciones, deleciones y rearreglos. Implica: digestión, hibridación con sondas marcadas que se deben generar (conocer), etc, etc→ laborioso, costo DArT: Diversity Arrays Technology DArT involucra varios pasos: - Reducción de la complejidad del ADN de interés - Creación de la genoteca (library) - Construcción del microarreglo conteniendo los clones de la library (glass slides) - Hibridación del ADN marcado fluorescentemente a los microarreglos - Detección de la señal de hibridación mediante scaneo de los microarreglos - Extracción de datos y análisis Jaccoud et al., NAR 2001 http://www.diversityarrays.com/products-and-services Principales ventajas de DArT: - Bajo costo de desarrollo y genotipado - Permite detectar distintos tipos de variación a nivel de secuencia - Alta densidad de marcadores (High troughput) - Preferencialmente detecta regiones ricas en genes - Independiente de información de secuencia previa Limitaciones: - Falta de selección previa de regiones genómicas o genes a ser ensayados - Requiere secuenciar los clones para comprobar la identidad del marcador - Servicio prestado únicamente por DArT P/L RAPD (Random Amplified Polymorphic DNA) ADN Polimórfico Amplificado al Azar. -Consiste en la amplificación mediante PCR de ADN anónimo, utilizando para ello un único iniciador de secuencia arbitraria. B A -Los oligonucléotidos iniciadores (primers) se diseñan sin tener en cuenta la información de la secuencia genómica de la especie a analizar. -Normalmente se usa un solo iniciador , de 10 nt de longitud (más corto que el de una PCR común) y con un contenido alto en G+C. Ej: iniciador OP-A01 CAGGCCCTTC A B Se genera producto de amplificación No se genera producto de amplificación Amplificación de ADN anónimo con iniciadores de secuencia arbitraria Correspondencia entre los fragmentos amplificados y las bandas obtenidas mediante electroforesis. Los RAPDs son marcadores genéticos dominantes No permiten distinguir el heterocigota del homocigota dominante Origen del polimorfismo de los RAPD Puede deberse a: inserciones (2), deleciones (3), mutaciones de punto: que impiden la unión del iniciador (4) o crean un nuevo sitio de unión del iniciador (5). RAPD Implica: PCR y electroforesis en gel de agarosa, no requieren conocimiento previo del genoma, versatilidad, costo bajo, cobertura del genoma, nivel de polimorfismo. Perfiles de RAPD obtenidos con 12 primers (N01 a N12) y los bulks B2R (R) y B2S (S) de una población segregante para resistencia a PVX MS de Solanum commersonii. Productos de PCR corridos en un gel de agarosa (1,5%, TBE 1x) teñido con bromuro de etidio. Segregación de un marcador RAPD en una población segregante de sorgo para el carácter de resistencia a brotado precosecha. DNAs de IS, B2 (parentales), F1 y 20 individuos F2 amplificados con el primer OP H02. Productos de PCR corridos en un gel de agarosa (1,5 %, TBE 1x) teñido con EtBr. Gentileza Dr. D.C. Lijavetzky. Ensayo solicitado por una empresa Objetivo: Determinar mediante la técnica de marcadores moleculares RAPDs el patrón genético de cuatro muestras de arándano, para definir si las mismas presentan diferencias genotípicas entre sí. Material vegetal: -Se analizaron las hojas de las distintas muestras de arándano rotuladas como 1. O´Neal 2. Muestra problema “Florida” 3. Flordablue in vitro (Oregon). Nota: esta muestra consistió en plántulas in vitro. 4. Flordablue hojas (Michigan) Estas muestras fueron provistas por la empresa XX. Figura 1. Patrones de amplificación de RAPDs obtenidos con 4 iniciadores diagnóstico (A, B, C y D). Las diferentes calles representan los productos de amplificación obtenidos para las distintas muestras: 1 O´Neal, 2 Muestra incógnita “Florida”, 3 Flordablue in vitro (Oregon) y 4 Flordablue hojas (Michigan). Matriz de similitud empleando el índice de asociación de Jaccard entre las muestras O´Neal, Muestra incógnita “Florida”, Flordablue in vitro (Oregon) y Flordablue hojas (Michigan): O´Neal Forida FBiv FBh O´Neal 1.0000000 Florida 0.1343284 1.0000000 FBiv 0.0000000 0.0563380 1.0000000 FBh 0.0384615 0.0694444 0.2656250 1.0000000 Figura 2. Matrices de similitud y dendograma resultantes de la comparación de las muestras O´Neal, Muestra incógnita “Florida”, Flordablue in vitro (FBiv) y Flordablue hojas (FBh) CCC: 0.99222 Obtención de un marcador SCAR Sequence Characterized Amplified Regions (amplificación de regiones de secuencia caracterizada ) Un fragmento polimórfico de interés, puede ser escindido de un gel, clonado (o no) y secuenciado para diseñar iniciadores específicos para ese fragmento en particular, permitiendo su amplificación en condiciones de PCR más rigurosas. -Análisis del marcador SCAR CT220 en la población segregante de S. comersonii Perfiles de de amplificación obtenidos con el marcador CT220. BR: bulk resistente, BS: bulk susceptible, S.p: S. pennellii, S.l: S. lycopersicum, R: individuos resistentes, S: individuos susceptibles, *: individuos recombinantes. A la izquierda se indican los tamaños de los fragmentos en pb. Electroforesis en gel de poliacrilamida desnaturalizante revelado mediante tinción con plata. Marcador CT220 proveniente de cromosoma IX de tomate (Solanum lycopersicum) Empleado en mapeo de Solanaceae. SCARs Sequence Characterized Amplified Regions (amplificación de regiones de secuencia caracterizada ) • Los marcadores SCAR consisten en la amplificación por PCR de un marcador específico • Los marcadores RAPD se pueden convertir en marcadores estables y confiables clonando las bandas amplificadas, secuenciando los extremos y usando luego estas secuencias para diseñar iniciadores específicos • El diseño específico de los iniciadores permite trabajar en condiciones de mayor rigurosidad y astringencia (ej, temperatura de hibridación de los iniciadores mayor) • Los marcadores SCAR son muy útiles en los programas de selección asistida (Mejoramiento Asistido por Marcadores, MAS) AFLP (Amplified Fragment Lehgth Polymorphism) Polimorfismo en el Largo de los Fragmentos Amplificados Procedimiento básico para la obtención de AFLP: - Digestión del ADN con una enzima de corte raro y una enzima de corte frecuente - Ligación de adaptadores específicos - Amplificación selectiva de fragmentos por PCR - Análisis de los fragmentos amplificados mediante electroforesis en geles de poliacrilamida Ejemplo: AFLP (Eucaliptus sp.). Gel de poliacrilamida teñido con nitrato de plata pb 500 450 425 400 375 350 325 300 275 250 225 200 175 150 125 Gentileza Dra. S.N. Marcucci Poltri Ejemplo: AFLP en una población segregante de Solanum commersonii R R * Individuos S * Individuos R * S R Análisis de los segregantes de la población 78 y los bulks B3R(R) y B3S(S) con la combinación de iniciadores E38M42. La banda de interés se indica con una flecha. R: Individuos resistentes, S: Individuos susceptibles, *: Individuos recombinantes. Perfiles de AFLP resueltos e geles de poliacrilamida, visualizados mediante tinción con nitrato de plata. Implica: digestión con enzimas de restricción y amplificación por PCR, no se requiere conocimiento previo del genoma, número ilimitado de marcadores, analizan todo el genoma, altamente reproducibles, polimorfismo elevado, versatilidad (distintas enzimas e iniciadores selectivos),herencia dominante, medianamente laboriosos, posibilidad de automatizar en secuenciador, costo medio. Microsatélites o SSR (Simple Sequence Repeats) Repeticiones de Secuencia Simple Repeticiones en tándem de secuencias cortas de DNA de 1 a 10 pares de bases de longitud Ejemplos: (GA)14 ...GAGAGAGAGAGAGAGAGAGAGAGAGAGA... (GAT)10 ...GATGATGATGATGATGATGATGATGATGAT... (CATC)8 ...CATCCATCCATCCATCCATCCATCCATCCATC.. Sinónimos: SSLP, SSRP, SSR o STMS Microsatélites 5’...TGACAGTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGCGA...3’ 3’...ACTGTCACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCGCT...5’ 16 repeticiones PCR con iniciadores específicos 5’...TGACAGTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGCGA...3’ CTGCGATCAGCCCATCATCG 5’ Iniciador Iniciador 5’ GTGGGTCACGACTTGAGCCAG 3’...ACTGTCACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCGCT...5’ Producto de amplificación obtenido 5’ GTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGC 3’ 3’ CACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCG 5’ 105 pb Electroforesis en gel de poliacrilamida desnaturalizante Origen del polimorfismo de los microsatélites Los microsatélites son marcadores codominantes Ejemplo: variedades de soja (Glycine max) analizadas mediante SSR Patrones obtenidos para 43 variedades de soja. Gel de poliacrilamida teñido con plata. Gentileza Dra. S. Giancola. Obtención de las secuencias flanqueantes ¿Existen secuencias útiles en los bancos de secuencias? NO SI Utilizar microsatélites como sondas para aislar clones en una genoteca Identificar secuencias que contengan microsatélites Ej: secuencias de ESTs Secuenciar los clones positivos Diseñar iniciadores específicos PCR Aislamiento de microsatélites DNA genómico GA GA GA GA GA GA GA GA GA Clonado GA GA GAGA GA GA GA GA GA GA GA GA GAGAGA GAGAGA Hibridación con sondas Purificación de (GA)n/(GT)n/(ATT)n clones positivos GA GA GAGA GA GA GA GA GA GA GA GA GAGAGA GAGAGA Secuenciación de clones genómicos GA GA GAGA GA GA GA GA GA GA GA GA GAGAGA GAGAGA Diseño de primers sobre secuencias flanqueantes al microsatélite GA GA GA GA GA GA GA GA GA Métodos de separación / detección Agarosa/bromuro de etidio Poliacrilamida / nitrato de plata Gentileza Lic. V. Nishinakamasu y Dra. N. Paniego Fluorescencia Gentileza Lic. P. Talia y Dra. N. Paniego Radiactividad Gentileza Lic. V. Nishinakamasu y Dra. N. Paniego Tomado de : www.fsl.orst.edu/ tgerc/risk.htm Métodos de separación / detección Homocigota alelo 1 Pico 147-149 pb Fluorescencia Homocigota alelo 2 Pico 153-155 pb Implica: alto nivel de polimorfismo (multialélico), número elevado de loci, codominantes, interpretación sencilla de los resultados (automatización, multiplex), muy alta reproducibilidad, costo medio-alto, requiere conocimiento previo del genoma (hay que desarrollarlos para cada especie a estudiar), alta tasa de mutación que puede afectar la reproducibilidad en estudios genealógicos Heterocigota: ambos alelos Electroferogramas para 3 genotipos de sorgo Gentileza Téc. L. Fernández Marcadores moleculares SNP Single Nucleotide Polymorphism (polimorfismo de un solo nucleótido) Consisten en sustituciones de una sola base, resultando en un polimorfismo dialélico de secuencia. En el genoma humano su frecuencia es de 1/1000 nt Es una variación puntual a nivel de secuencia. Disponibles por la gran cantidad de secuencias de genomas. Son más frecuentes que SSR. SNPs se ubican cercanos o en el locus de interés (en un gen y por lo tanto influenciará la estructura de la proteína codificada por éste o sus niveles de expresión, etc.). Por lo tanto, pueden asociarse precisamente a caracteres (como enfermedades). Muy útiles como marcadores para la construcción de mapas de ligamiento más densos que los actuales. Detección de SNP - Secuenciación comparativa de ADN amplificado - Métodos conformacionales: SSCP (Single Strand Conformation Polymorphism) - Métodos para análisis de un gran número de muestras: varios métodos TaqMan® y HRM (High Resolution Melting) DHPLC (Denaturing High-Performance Liquide Chromatography) SNaP Shot Illumina (Golden Gate) SNP Array KASPr highthroughput analysis Detección de SNP: Secuenciación comparativa de segmentos amplificados Fundamento: - Diferencias en las secuencias específicas de segmentos conocidos (locus/loci) Metodología: - Extracción y purificación de ADN - PCR con iniciadores caracterizados - Secuenciación del producto de amplificación - Aplicación de alguna de las técnicas de detección InDels Cambio Fig. 1 Example of intraspecies polymorphism of the ITS. The part of sequences of two different clones of M. bovis (a, b) and Mycoplasma conjunctivae (c, d) are present. Appl Microbiol Biotechnol (2006) 71: 680–698. Sequence of the intergenic 16S-23S rRNA spacer (ITS) regionof Mollicutes species and their identification using microarray-based assay and DNA sequencing. Secuenciación comparativa: Ej. Secuenciación nucleotídica de ITS en Oxalis sp. ....|....| ....|....| ....|....| ....|....| ....|....| ....|....| ....|....| ....|....| ....|....| ....|....| ....|....| 5 15 25 35 45 55 65 75 85 95 O.tuberosa 1033 CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG O.tuberosa 1051 CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG O.tuberosa 1018 CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG O.peduncularis CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG O.villosula CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG O.tabaconasensis CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG O.oblongiformis CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG O.articulata ---------- ----ATTGTC GATACCTGCT TTT-CAGCGC AACATGCGAA TGTATTCTGG AAG---AAAG GACCCGAGCT ACGGACGAGT CGGGTGCTGG Clustal Consensu ****** ********** * *** * ********** ****** * *** **** * ****** *** ***** ** ** * 105 CCCT-GGCTA CCCT-GGCTA CCCT-GGCTA CCCT-GGCTA CCCT-GGCTA CCCT-GGCTA CCCT-GGCTA CCCTAGGCCA **** *** * O.tuberosa1 O.tuberosa2 O.tuberosa3 O.peduncularis O.villosula O.tabaconasensis O.oblongiformis O.articulata Clustal Consensu ....|....| 115 GTGCCTCCTT GTGCCTCCTT GTGCCTCCTT GTGCCTCCTT GTGCCTCCTT GTGCCTCCTT GTGCCTCCTT GTTGCTGCTT ** ** *** ....|....| 125 GTTCCGTGGC GTTCCGTGGC GTTCCGTGGC GTTCCGTGGC GTTCCGTGGC GTTCCGTGGC GTTCCGTGGC GTTCCGTGGC ********** ....|....| 135 CTAACCTCAA CTAACCTCAA CTAACCTCAA CTAACCTCAA CTAACCTCAA CTAACCTCAA CTAACCTCAA CTGAAAACAA ** * *** ....|....| 145 AACCTAGCAC AACCTAGCAC AACCTAGCAC AACCCGGCAC AACCCGGCAC AACCCGGCAC AACCCGGCAC ACCCCGGCGC * ** ** * ....|....| 155 GAGTTGTGCC GAGTTGTGCC GAGTTGTGCC GAGTTGTGCC GAGTTGTGCC GAGTTGTGCC GAGTTGTGCC GAGTCGCGC**** * ** ....|....| 165 AAGGAATCTA AAGGAATCTA AAGGAATCTA AAGGAATCTA AAGGAATCTA AAGGAATCTA AAGGAATCTA AAGGAATCTA ********** ....|....| 175 CGATGGG--CGATGGG--CGATGGG--CGATGGG--CGATGGG--CGATGGG--CGATGGG--TAATAGAGAG ** * ....|....| 185 ---------------------------------------------------------------TTTGCTCCGC ....|....| 195 ---------------------------------------------------------------GTGTCTGGAG ....|....| 205 -CGGACTGCG -CGGACTGCG -CGGACTGCG -CGGACTGCG -CGGACTGCG -CGGACTGCG -CGGACTGCG ACGGACCACG ***** ** ....|....| 215 CCTAGAAGCG CCTAGAAGCG CCTAGAAGCG CCTAGAAGCG CCTAGAAGCG CCTAGAAGCG CCTAGAAGCG CGCGTAAGCA * **** O.tuberosa1 O.tuberosa2 O.tuberosa3 O.peduncularis O.villosula O.tabaconasensis O.oblongiformis O.articulata Clustal Consensu ....|....| 225 CACGGTCTCC CACGGTCTCC CACGGTCTCC CACGGTCTCC CACGGTCTCC CACGGTCTCC CACGGTCTCC CGCGATCTCT * ** **** ....|....| 235 TTATATAGTC TTATATAGTC TTATATAGTC TTATATAGTC TTATATAGTC TTATATAGTC TTATATAGTC TCATATTGTC * **** *** ....|....| 245 GATAAAAATG GATAAAAATG GATAAAAATG GATAAAAATG GATAAAAATG GATAAAAATG GATAAAAATG AATGANNNNN ** * ....|....| 255 ACTCTCGGCA ACTCTCGGCA ACTCTCGGCA ACTCTCGGCA ACTCTCGGCA ACTCTCGGCA ACTCTCGGCA NNNNNNNNNN ....|....| 265 ACGGATATCT ACGGATATCT ACGGATATCT ACGGATATCT ACGGATATCT ACGGATATCT ACGGATATCT NNNNNNNNNN ....|....| 275 CGGCTCTCGC CGGCTCTCGC CGGCTCTCGC CGGCTCTCGC CGGCTCTCGC CGGCTCTCGC CGGCTCTCGC NNNNNNNNNN ....|....| 285 ATCGATGAAG ATCGATGAAG ATCGATGAAG ATCGATGAAG ATCGATGAAG ATCGATGAAG ATCGATGAAG NNNNNNNNNN ....|....| 295 AACGTAGCGA AACGTAGCGA AACGTAGCGA AACGTAGCGA AACGTAGCGA AACGTAGCGA AACGTAGCGA NNNNNNNNNN ....|....| 305 AATGCGATAC AATGCGATAC AATGCGATAC AATGCGATAC AATGCGATAC AATGCGATAC AATGCGATAC NNNNNNNNAC ** ....|....| 315 TTGGTGTGAA TTGGTGTGAA TTGGTGTGAA TTGGTGTGAA TTGGTGTGAA TTGGTGTGAA TTGGTGTGAA TTGGTGTGAA ********** ....|....| 325 TTGCAGAATC TTGCAGAATC TTGCAGAATC TTGCAGAATC TTGCAGAATC TTGCAGAATC TTGCAGAATC TTGCAGAATC ********** O.tuberosa1 O.tuberosa2 O.tuberosa3 O.peduncularis O.villosula O.tabaconasensis O.oblongiformis O.articulata Clustal Consensu ....|....| 335 CCGCGAACCA CCGCGAACCA CCGCGAACCA CCGCGAACCA CCGCGAACCA CCGCGAACCA CCGCGAACCA CCGTGAACCA *** ****** ....|....| 345 TCGAGTCTTT TCGAGTCTTT TCGAGTCTTT TCGAGTCTTT TCGAGTCTTT TCGAGTCTTT TCGAGTCTTT TCGAGTCTTT ********** ....|....| 355 GAACGCAAGT GAACGCAAGT GAACGCAAGT GAACGCAAGT GAACGCAAGT GAACGCAAGT GAACGCAAGT GAACGCAAGT ********** ....|....| 365 TGCGCCCTAA TGCGCCCTAA TGCGCCCTAA TGCGCCCTAA TGCGCCCTAA TGCGCCCTAA TGCGCCCTAA TGCGCCCCAA ******* ** ....|....| 375 GC-TTTAGGC GC-TTTAGGC GC-TTTAGGC GC-TTTAGGC GC-TTTAGGC GC-TTTAGGC GC-TTTAGGC GCCTTTAGGC ** ******* ....|....| 385 CGAGGGCACG CGAGGGCACG CGAGGGCACG CGAGGGCACG CGAGGGCACG CGAGGGCACG CGAGGGCACG CGAGGGCACG ********** ....|....| 395 CCTGCCTGGG CCTGCCTGGG CCTGCCTGGG CCTGCCTGGG CCTGCCTGGG CCTGCCTGGG CCTGCCTGGG CCTGCCTGGG ********** ....|....| 405 TGTCACACAT TGTCACACAT TGTCACACAT TGTCACACAT TGTCACACAT TGTCACACAT TGTCACACAT TGTCACACAT ********** ....|....| 415 TGTCGCCTCC TGTCGCCTCC TGTCGCCTCC TGTCGCCTCC TGTCGCCTCC TGTCGCCTCC TGTCGCCTCC TGTCGCCTCC ********** ....|....| 425 AAAGCCCTTT AAAGCCCTTT AAAGCCCTTT AAAGCCCTTT AAAGCCCTTT AAAGCCCTTT AAAGCCCTTT AAAGCC-TTT ****** *** ....|....| 435 GCTCTCGAAG GCTCTCGAAG GCTCTCGAAG GCTCTCGAAG GCTCTCGAAG GCTCTCGAAG GCTCTCGAAG GCTCT--ATG ***** * * Detección de SNP: Métodos conformacionales Fundamento: Detección de polimorfismos de un solo nucleótido (SNP) o pequeñas mutaciones (inserciones y deleciones) mediante el análisis de los cambios de movilidad del ADN simple cadena causado por la sustitución de una sola base. Metodología: 1) Amplificación por PCR de la secuencia de interés 2) El amplicón se desnaturaliza por calor y luego snap-cool. 3) Separación por tamaño y conformación mediante electroforesis en geles de poliacrilamida nativos (native PAGE) La movilidad electroforética de los fragmentos de ADN simple cadena dependerá del tamaño y de la secuencia, adoptando conformaciones de estructura secundaria por apareamientos de bases intramoleculares Detección radioactiva y autoradiografía Detección con nitrato de plata o SYBR Green II Importante: condiciones rigurosas de electroforesis (%acrilamida, fuerza iónica del buffer, temperatura 5ºC) PCR: requiere poco templado fragmento a amplificar no mayor a 200 pb cuidadoso diseño del par de primers no excederse en la concentración de éstos DHPLC Denaturing High-Performance Liquid Chromatography •Detección de moléculas heterodúplex: -Cromatografía líquida de alto rendimiento en condiciones de desnaturalización parcial (dHPLC). DHPLC Denaturing High-Performance Liquid Chromatography - Revela la presencia de polimorfismo en la forma de heteroduplex pero no provee información con respecto a su naturaleza química y localización. Se requiere luego secuenciar. - Cuando la frecuencia de polimorfismo es baja puede ahorrar tiempo y dinero, ya que los fragmentos que no presentan polimorfismo por DHPLC no serán luego secuenciados. Métodos para análisis de un gran número de muestras TaqMan® Antes, repasemos... Hydrolysis probes (TaqManTM) Se emplea una sonda que tiene unidos un fotocromo reporter y un fotocromo quencher. Cuando ambos fotocromos están unidos a la sonda, el reporter no emite señal. Pero, cuando la sonda hibrida con la secuencia de interés (target) durante la reacción de PCR, la actividad exonucleasa de la Taq polimerasa cliva al fotocromo reporter del resto de la sonda, permitiendo la emisión una señal fluorescente. Se monitorea la señal fluorescente del reporter que se va acumulando en los sucesivos ciclos de PCR. FAM: 6-carboxifluoresceína TET: tetracloro-6-carboxifluoresceína VIC, HEX, Texas red, etc. TAMRA: tetrametilrodamida (a)Cuando la sonda, hibridada o no, está intacta el fotocromo reporter no emite por acción del quencher. (b) La sonda es hidrolizada durante la reacción de PCR y el reporter fluoresce. TaqManTM Detección de SNPs empleando sondas TaqMan para cada alelo. Introducción PCR y HRM (High Resolution HRM Melting) para detección de SNPs Introducción Single nucleotide primer extension Detección de SNP: Métodos highthroughput Illumina SNP array KASP Illumina: tecnología de Bead arrays Esquema de trabajo utilizando la tecnología GoldenGate BeadXpress de Illumina. Utilizando 250ng de ADN genómico de cada individuo se realiza la activación o biotinilación del ADN. Este primer paso consiste en la inmovilización de los fragmentos de ADN que fueron biotinilados a partículas paramagnéticas que se encuentran recubiertas de estreptavidina (Paso 1 de la figura). Luego, se procede a una hibridación del ADN activado (Paso 2) aplicando un buffer de hibridación y un conjunto de oligonucleótidos (OPA, del inglés Oligo Pool Assay). Éstos son tres oligonucleótidos por cada locus: dos alelo-específicos (ASO, del inglés allele-specific oligonucleotide) que difieren en su base 3’ y un tercer oligonucleótido locus-específico (LSO, del inglés locus-specific oligonucleotide), que hibrida río abajo del SNP a una distancia de alrededor de 20 nucleótidos. Todos los oligonucleóticos son complementarios a la secuencia a amplificar y contienen sitios para oligonucleótidos universales (P1, P2 y P3); el LSO posee, además, una secuencia llamada IllumiCode Address como en la figura que permite identificar de forma unívoca a cada SNP y le otorga la capacidad al ensayo de realizar amplificaciones en forma simultánea. Durante la etapa de hibridación, los ASOs y LSOs se unen a las moléculas de ADN genómico que se encuentran previamente unidas a partículas paramagnéticas y se procede inmediatamente al lavado de las mismas para la remoción de los oligonucleótidos no hibridados. Después, en el Paso 3, se realiza la extensión y ligación de cada ASO al LSO permitiendo la unión de la variante alélica del SNP con su correspondiente IllumiCode Address. Los marcadores universales P1, P2 y P3 utilizan este producto de ligación como templado para la reacción de PCR (Paso 4). P1 y P2 están marcados con los fluoróforos Cy3 (verde; en la figura se puede observar como círculos verdosos) y Cy5 (rojo; en la figura se ve como cuadrados de color rojo) respectivamente. Por otro lado, el marcador universal P3 tiene biotinilado el extremo 5’. Posteriormente al paso de PCR, las hebras generadas se separan y se purifica la que se encuentra marcada con el fluoróforo (Paso 5) para ser hibridada a las esferas de vidrio (VeraCode Beads) por su secuencia IllumiCode Address (Paso 6). En el Paso 7 se lleva a cabo un lavado para luego realizar el escaneo de alta procesividad mediante el lector BeadXpress (Paso 8). El mismo posee dos láseres de los cuales uno permite identificar el código de cada esfera y el otro detecta la señal generada por el fluoróforo. Los datos escaneados son analizados mediante el programa GenomeStudio con el módulo de genotipado v1.1 (Illumina, San Diego, California, EE.UU.). a b c Figura m.2: Agrupamientos normalizados de las clases genotípicas mediante el programa GenomeStudio. (a) SNP polimórfico; (b) SNP monomórfico; (c) Error en el agrupamiento. Lectura y análisis de datos High-density oligonucleotide arrays Microordenamientos de oligonucleótidos de alta densidad (microarrays o chips de ADN) High-density oligonucleotide arrays Más conocidos por su aplicación en estudios de expresión. Permiten detección de variantes y genotipeado de un gran número de marcadores. Sondas de oligonucleótidos cortas de 20-25 bases de longitud, unidas covalentemente a una superficie inerte (por fotolitografía o por síntesis química de oligonucleótidos fotosensible). 300.000 sondas en 1,28 x 1,28 cm2 Basado en la especificidad de hibridación del ADN. Las sondas en el array están diseñadas para complementar una secuencia de referencia con un set de cuatro sondas, difiriendo cada una sólo en la posición central, extendiéndose a lo largo de la secuencia de referencia de a una base por vez. Resecuenciación. High-density oligonucleotide arrays Detección de SNP: tecnología KASP: Kompetitive Allele Specific PCR (PCR alelo específica) Fin del primer ciclo de PCR 2do ciclo y subsiguientes: -Reducción de costos -Análisis de un gran número de muestras -En mínimo tiempo: 24 hs vs. días para otros métodos -Bajo error en la genotipificación -Flexible LGC Genomics www.lcggenomics.com LGC genomics 64 placas En la últimas décadas: RDMs: Random DNA Markers derivados de cualquier parte del genoma, fenotípicamente neutros FMs: Functional Markers derivan de sitios polimórficos dentro de genes afectando causalmente la variación del carácter fenotípico. Surgen marcadores moleculares de las regiones transcriptas /expresadas del genoma 1) ADNc o ARNm como fuente de marcadores moleculares: cDNA-RFLPs, cDNA-AFLPs, etc 2) Bases de datos de ESTs como fuente de marcadores moleculares basados en PCR ESTs: Expressed Sequence Tags ESTs: Expressed Sequence Tags <1000pb Identificación de genes candidatos Colecciones de ADNc diferenciales órgano – específicas de girasol (SSH) ESTs RELACIONADOS CON ESTRÉS BIÓTICO Y ABIÓTICO (40 secuencias únicas, 20 secuencias nuevas para girasol ) Clasificación funcional de ESTs aislados a partir de la clonoteca diferencial de flor en estadio R1 Clasificación funcional de ESTs aislados a partir de la clonoteca diferencial de flor en estadio R4 Germin – like protein Oxygen-evolving enhancing protein Putative beta-1,3-glucanase protein Polygalacturonase inhibitor protein Lipid transfer protein Thaumatin-like protein Cationic peroxidase protein Fructosyltransferase protein Heat shock protein Dehydrin related protein Cysteine protease Fernandez et al. 2003. BMC Genomics. Sep 30;4(1):40. Identifición y caracterización de nuevas fuentes de Resistencia a PHC mediante herramientas genómicas • Agente •La Podredumbre húmeda del capítulo (PHC) es una de las enfermedades mas devastadoras en la Argentina. •En casos extremos puede causar perdidas totales •La incidencia anual promedio sobre la producción de la pampa húmeda es del 10-20% •La base genética de la resistencia es compleja con varios QTLs involucrados en el carácter 2008 http://www.ncbi.nlm.nih.gov/genbank/dbest/dbest_summary/ dbEST release 130101 Summary by Organism - 01 January 2013 Number of public entries: 74,186,692 Homo sapiens (human) 8,704,790 Mus musculus + domesticus (mouse) 4,853,570 Zea mays (maize) 2,019,137 Sus scrofa (pig) 1,669,337 Bos taurus (cattle) 1,559,495 Arabidopsis thaliana (thale cress) 1,529,700 Danio rerio (zebrafish) 1,488,275 Glycine max (soybean) 1,461,722 Triticum aestivum (wheat) 1,286,372 Xenopus (Silurana) tropicalis (western clawed frog) 1,271,480 Oryza sativa (rice) 1,253,557 ESTPs: Expressed Sequence Tag Polymorphism 3) ESTs-SSR Saturación de un mapa de referencia para girasol cultivado, incluyendo marcadores neutros y funcionales 4) ESTs-SNPs y búsqueda de InDels 1. Extracción de ADN de diferentes líneas de girasol 3. Elección de amplicones únicos 2. Amplificación por PCR Genes candidatos/ESTs Gentileza, C. Fusari 4. Secuenciación de las regiones candidatas en las 19 líneas elite de girasol Gentileza, C. Fusari 5. Identificación de SNPs e indels con SeqScape v2.5 Gentileza, C. Fusari 6: Obtención de parámetros de diversidad con DNAsp • Las frecuencias de SNPs e indels encontradas (1SNP/61 pb y de 1 indel/279 pb) son relativamente altas comparadas con las frecuencias de SNPs e indels encontradas para otras especies vegetales. • En concordancia con lo esperado para materiales cultivados, las estimas de diversidad (θW =0,0058 y πT=0,0064) resultaron inferiores a las encontradas en girasol silvestre. • Evaluación del desequilibrio de ligamiento (LD): distancia máxima de 700bp entre 2 SNPs, la extrapolación de la línea de tendencia que ajustó a los datos sugiere una extensión del LD de hasta 100 kbp (r2~0,1). Esto permitiría utilizar los SNPs para el mapeo fino de genes de interés para el mejoramiento del cultivo con una densidad de marcadores relativamente baja, comparado con otros cultivos de interés económico. Gentileza, C. Fusari 5) Secuencias conocidas de genes como fuente de marcadores moleculares (GTMs, Gene Targeted Markers y FMs): Amplificación de marcadores genéticos consenso: genes conocidos de Arabidopsis y arroz , por ejemplo, amplificación en Brassica napus. SSRs, SNPs, SCARS, CAPs y RFLPs de genes conocidos. Resistance Gene Analogues (RGAs): Análogos a genes de resistencia Instituto de Biotecnología Genes de resistencia a enfermedades en plantas Instituto de Biotecnología Amplificación de análogos a genes de resistencia Marcadores RGA: Resistance Gene Analogs RGAs en población de S. commersonii Análisis de los productos de amplificación obtenidos con las 16 combinaciones de primers de RGAs s1+1/as1+1 (de A a P) comparando los bulks B1R (R) y B1S (S). Electroforesis en gel de poliacrilamida desnaturalizante 6% visualizado mediante tinción con plata. Instituto de Biotecnología Perfiles de amplificación de RGAs de 45 individuos segregantes usando la combinación s1+A/as1+T resueltos en gel de poliacrilamida desnaturalizante 6% y visualizados mediante tinción con plata. Se indican los individuos resistentes (RESISTANT INDIVIDUALS) y susceptibles (SUSCEPTIBLE INDIVIDUALS). Los individuos recombinantes se indican con un asterisco. El fragmento de RGA de interés se destaca mediante una flecha. Resistance gene analogs (RGAs): dos marcadores ligados. Actualmente, se generan nuevos marcadores: Genotipificación por secuenciación (Genotyping by Sequencing) y RAD Sequencing (Restriction Associated site DNA Sequencing) Teórica específica RAD sequencing 36-108 bp Reduced representation of the genome 2 secuencias de 36-108 bp/fragmento Genotipificación por secuenciación (Genotyping by Sequencing) 2011 1) Reducción de la complejidad del genoma por corte con enzima de restricción (RE) (que puede ser sensible a metilación) Genotyping by Sequencing vs. Whole Genome Shotgun y la formación de dímeros de adaptadores Secuenciación por Illumina RAD vs. GBS Temas: • Conceptos: Gen, Genoma, Genómica • Organización del genoma • Herramientas para estudiar los genomas: Marcadores Moleculares Mapeo genético Mapeo físico , FISH Secuenciación Gracias!! Instituto de Biotecnología