Presentacion Curso Genomica Aplicada 2016.pdf

Anuncio
Herramientas moleculares para estudios genómicos
Analiza la variación a nivel del ADN (genotipo) por diferentes metodologías
Dra. M. Carolina Martinez
Instituto de Biotecnología
CICVyA, INTA Castelar
martinez.mc@inta.gob.ar
Temas:
• Conceptos: Gen, Genoma, Genómica
• Organización del genoma
• Herramientas para estudiar los genomas:
Mapeo genético
Mapeo físico , FISH
Marcadores Moleculares
Random DNA Markers
Functional Markers
Secuenciación: Teórica de P. Cerdán
Genómica: es la rama de la biología que se encarga del estudio de los genomas.
Mapeo, secuenciación y análisis de las funciones de genomas completos
(Thomas Roderick, 1986)
Caracterización molecular de genomas enteros: secuencia y función de cada
sector del genoma.
Genómica es el conjunto de ciencias y técnicas dedicadas al estudio integral del
funcionamiento, el contenido, la evolución y el origen de los genomas. Es una de
las áreas más vanguardistas de la biología. La genómica usa conocimientos
derivados de distintas ciencias como la biología molecular, la bioquímica,
la informática, la estadística, las matemáticas, la física, etc.
Genómica funcional, Genómica estructural, Genómica comparativa,
Farmacogenómica , Metagenómica, Genómica agropecuaria , Genómica
forense,
Genómica ambiental, Genómica industrial…
Muchas veces, la Genómica es usada como sinónimo de otras áreas de estudio
relacionadas como son la Proteómica y la Transcriptómica por ejemplo.
Las ciencias genómicas han tenido un importante auge en los últimos años,
sobre todo gracias a las avanzadas técnicas de secuenciación, a los avances
en bioinformática, y a las técnicas cada vez más sofisticadas para realizar
análisis de genomas completos.
¿Qué es un genoma?
El genoma representa el
contenido de ADN total de una
célula, incluídos los genes y las
regiones intergénicas.
Uno de los desafíos más importantes para la
biología a comienzos del siglo XXI es
entender la información contenida en las
secuencias genómicas.
Concepto de gen
Genética clásica: es la unidad de herencia que permite transmitir una
característica dada de padres a hijos
Bioquímica: Características asociadas a proteínas o enzimas
Biología Molecular (Dogma central): ADN → ARN → Proteína
● Splicing alternativo
● Ambas cadenas de ADN pueden codificar, transcriptos
superpuestos, transcritos fusionados, exones a cientos o
miles de bases de distancia (continuum of transcripts)
● Nuevos roles del ARN (ribozimas, microARNs y otros ARN
no codificantes con funciones regulatorias, señales),
fenómenos epigenéticos
Bioinformática: dónde empieza y dónde termina un gen?
“Una región localizable de secuencia genómica, correspondiente a
una unidad de herencia, la cual está asociada con regiones
regulatorias, regiones transcriptas y/u otras regiones de secuencia
funcionales.”
Pearson H. (2006) What is a gene? Nature, 441:399-401.
Estructura básica de un gen eucariota
GEN
A
SECUENCIAS
REGULATORIAS
PROMOTOR
B
EXÓN
C
D
E
INTRÓN
SECUENCIAS
TERMINADORAS
Transcripción: RNA (transcrito primario)
Adición de cap y cola de poli-A
Splicing alternativo
RNA maduro
Exportación
Traducción
NÚCLEO
CITOPLASMA
Cuándo producirlas?
Cuánto se produce?
Cuál producir?
Dónde producirlas?
A
B
C
PROTEÍNAS
E
A
C
D
E
GEN
A
PROMOTOR
SECUENCIAS
REGULATORIAS
EXÓN
B
-25
Caja
TATA
Secuencias regulatorias
D
INTRÓN
A
-100
Caja
CAAT
C
5´UTR
E
SECUENCIAS
TERMINADORAS
E
3´UTR
Inicio de la transcripción
Promotores “fuertes” y “débiles”
Secuencias codificantes Secuencias no codificantes
La transcripción depende de múltiples elementos
Exones e intrones
Genes:
Eucariotas vs. Procariotas: diferente estructura y organización
Codones:
redundancia del código
uso diferencial de codones en distintas especies,
optimización de codones (Cry1A Bacillus thuringensis
vs. Cry1A sintética)
Tamaño de genoma vs. Nro de genes
Tamaño del genoma y número de genes de varios
organismos
Tamaño del genoma
(Mb)
Nro. de genes
Mycoplasma genitalium
0.58
500
Streptococcus pneumoniae
2.2
2300
Escherichia coli
4.6
4400
Saccharomyces cerevisiae
12
5800
Arabidopsis thaliana
125
25.500
Caenorhabditis elegans
97
19.000
Drosophila melanogaster
180
13.700
Mus musculus
2500
29.000
Homo sapiens
2900
27.000
Oryza sativa
466
45-55.000
Especies
Watson JD, Baker TA, Bell SP, Gann A, Levine M, Losick R (2004). Molecular Biology of the
Gene, 5th ed., Peason Benjamin Cummings (Cold Spring Harbor Laboratory Press).
Organización del genoma
Relevamiento de secuencias de ADN en
el genoma vegetal
Centrómeros
Telómeros
Microsatelites y
Minisatelites
Repeticiones en
tandem
Satélites
Genes
Copias
Degeneradas
Secuencias
dispersas
Retroelementos
Pseudogenes
Transposones
Cromosoma Modelo
Schmid T ySchmid
Heslop-Harrison
JS (1998)
Plant
3, 195-199
T y Heslop-Harrison
JS (1998)Trends
Trends inin
Plant
Sci.,Sci.,
3, 195-199
Actualmente la Biología Molecular se centra en el
estudio de los genomas más que en el de los
genes individuales.
Si bien, todavía no se pueden explicar adecuadamente
todos los eventos que conducen del ADN a las
proteínas de manera completa en términos de
“Genoma -> Transcriptoma -> Proteoma”
VISIÓN INTEGRADORA
¿Por qué estudiar los genomas (Ej. Humanos,
Plantas, Animales, microorganismos, etc)?
Para:
Mapas de ligamiento
Mapeo de genes y QTLs
Selección asistida por marcadores
Clonado posicional de genes
Estudios de variabilidad/diversidad genética en distintas
especies (plantas y fitopatógenos) germoplasma,
identificación de cultivares, etc
Estudios evolutivos
¿Qué es un marcador molecular?
 Puntos de referencia en los cromosomas,
permiten conocer el GENOTIPO
Todo o cualquier fenotipo molecular oriundo de un gen expresado
(ej. Isoenzimas) o de un segmento específico del ADN
(correspondiente a regiones expresadas o no del genoma).
Estudios de variabilidad/diversidad
MBD
A B C D E
GEL
A
B
C
D
E
1
Dendrograma
1
0
1
0
1
0
1
1
1
0
0
1
1
0
1
1
1
1
1
1
0
0
1
1
0
0
1
1
1
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
1
1
0
0
1
0
0
1
1
2
Indice de Jaccard
(Bandas compartidas / bandas
totales)
2
MC
MS
A
4
3
UPGMA
A
B
C
D
E
B
C
D
E
5/9
3/8 5/8
3/8 4/9 3/7
2/9 2/11 1/9 3/7
Fig. 3. Dendrogram of Diaporthe/Phomopsis isolates based on unweighted pair-group method with arithmetic average obtained using NTSYS
program with Jaccard similarity coefficient calculated from random amplified polymorphic DNA. DPM = D. phaseolorum var. meridionalis, DPC = D.
phaseolorum var. caulivora, DPS = D. phaseolorum var. sojae, and PL = P. longicolla.
Morphologic, Molecular, and Pathogenic Characterization of Diaporthe phaseolorum Variability in the Core SoybeanProducing Area of Argentina
Rosanna N. Pioli, Eligio N. Morandi, María C. Martínez, Florencia Lucca,
Alejandro Tozzini, Vilma Bisaro, and H. Esteban Hopp PHYTOPATHOLOGY Vol. 93, No. 2, 2003
Mapas de Ligamiento
Indican la posición y la
distancia genética relativa
entre marcadores a lo largo
del cromosoma (mapa de
ruta)
Para identificar regiones
cromosómicas que contienes
genes que controlan caracteres
simples (gen único) y caracteres
cuantitativos (usando análisis de
QTLs)
Fundamento: Los genes y los marcadores segregan vía recombinación
cromosómica (crossing-over) durante la meiosis permitiendo su análisis en
la progenie.
Los genes o marcadores del parental que se encuentran juntos o
estrechamente ligados serán transmitidos juntos a la progenie más
frecuentemente que aquellos que se encuentran separados.
En una población segregante habrá una mezcla de genotipos parentales y
recombinantes. La frecuencia de los genotipos recombinantes puede ser usada
para calcular la fracción de recombinación, las cuales pueden ser usadas para
inferir distancias genéticas entre marcadores.
Se pueden así determinar el orden relativo y la distancia entre marcadores (entre
marcadores: menor frecuencia de recombinación, menor la distancia)
Marcadores con frec. de recombinación
>50%, no ligados (muy distantes o en cromosomas diferentes)
Las funciones de mapa se usan para convertir las unidades de recombinación en
unidades de mapa: cM (centiMorgan)
Porque la frecuencia de recombinación y la frec. de crossing-over no están
linealmente relacionadas (sólo se da para distancias < 10 cM)
Kosambi: tiene en cuenta la interferencia entre dos eventos de
recombinación adyacentes
Haldane: no asume interferencia
OJO: distancia genética no está directamente relacionada con la distancia física,
depende del tamaño del genoma, varía a lo largo del cromosoma (sitios donde es
más frecuente la recomb. y sitios donde es menos frecuente)
¿Cómo estudiar un genoma?
-A partir de una genoteca de insertos grandes (BAC o YAC library)
-Contando con un mapa genético saturado (con muchos marcadores)
-Por secuenciación directa
Mapeo genético de baja resolución
(recombinación meiótica)
Mapeo genético de alta resolución
(marcadores moleculares)
Mapeo físico (secuencias de
fragmentos clonados solapados)
Secuenciación
Genómica estructural
SINTENIA
MAPA COMPARATIVO: comparación de regiones
cromosómicas de distintas especies que comparten
marcas en un orden conocido.
MAPA GENETICO: distancia entre marcas medidas en
función de recombinación
Estudio de los genomas: técnicas de mapeo
PP
Green,
Current
Topics
in in
Genome
Analysis
Green,
Current
Topics
Genome
Analysis
Estudio de los genomas: técnicas de
mapeo
Mapeo Genético: basado en el empleo de técnicas genéticas para construir
mapas mostrando las posiciones de genes y otras secuencias (marcadores)
en un genoma. Las técnicas incluyen análisis de cruzamientos, pedigrees
(en humanos).
Mapeo Físico: basado en el empleo de técnicas de biología molecular para
examinar las moléculas de ADN directamente con el objeto de construir
mapas que muestren las posiciones de las secuencias (genes, otras).
Ej: en genoma pequeño, mapeo por restricción
Mapeo Físico
•FISH (permite visualizar la posición de marcadores moleculares marcados con
fluorescencia en lo cromosomas)
In situ hybridization of DNA sequences over sunflower chromosomal glasses stained with
DAPI
• STS (técnica más poderosa de mapeo físico junto con las genotecas de insertos
largos)
Genoteca insertos
largos BAC
Species 'cultivar'
Genome
size ()
Arabidopsis thaliana 'Columbia'
100
# BAC
clones
12,672
Poncirus trifoliata 'Rubidoux'
382
Glycine max ‘Willams82'
insert
size (kb)
Genome
coverage
Reference
100
12.0
Choi et al. 1995
45,312
76
9.0
Yang et al. 1999
1,115
40,000
150
4.5
Marek et al. 1997
Lactuca sativa ‘Diana’
2,500
50,000
111
2.0
Frijters et al. 1997
Hordeum vulgare 'Morex'
5,000
313,344
110
6.3
Yu et al. 1999
Solanum lycopersicum 'Heinz 1706'
954
147,456
115
15.0
Budiman et al. 2002
Oryza sativa indica 'Tequing'
441
14,208
130
4.4
Zhang et al. 1996
3,076
103,296
130
4.5
Tomkins et al. 1999
760
13,440
130
2.6
Woo et al. 1994
5,751
276,480
115
5.6
Lijavetzky et al. 2000
750
36,864
120
5.9
Vinatzer et.al 1998
2.504
422,400
120
20.2
Tomkins et al. 2000
Saccharum officinarum 'R570'
Sorghum bicolor 'BTx623'
Triticum monococcum ‘DV92’
Malus domestica ‘Florina’
Zea mays 'LH132'
 (Mb/1C)
DNA insert prep
BAC vector prep
 HMW DNA isolation
 HindIII Serial digestion
 HindIII digestion
 Dephosphorylation
 1st & 2nd size selection
(PFGE) for restricted
fragments  100-150kb
Library construction
 Ligation (T4 DNA
Ligase)
 Electroporation into E. coli
 Plate on CM medium
Store recombinant clones
in 384 well plates
White colonies: recombinants
Blue colonies: non-recombinants
Manual Picking
Manual Copying
High density filters
•
•
•
48 384-well plates
18,432 clones
8 clones
twice/square
https://bacpac.chori.org/fi2.htm
Hibridación del filtro
Con marcador de interés (sonda)
Mapeo Físico
•FISH (permite visualizar la posición de marcadores moleculares marcados con
fluorescencia en lo cromosomas)
In situ hybridization of DNA sequences over sunflower chromosomal glasses stained with
DAPI
• STS (técnica más poderosa de mapeo físico junto con las genotecas de insertos
largos)
Mapeo Físico de STS
High Throughput Sequencing/Genomics Course (Oct 25-Nov7 2000)/ John McPherson WU
Mapeo Físico de STS
Minimal tiling path selected for sequencing.
High Throughput Sequencing/Genomics Course (Oct 25-Nov7 2000)/ John McPherson WU
Estrategia de secuenciación
Esquema de Secuenciación de los Genomas
Estrategias alternativas de secuenciación
¿Cómo secuenciar un genoma?
Estrategias
Cuantos
más
marcadores
en el mapa
genético,
mejor
¿Cómo secuenciar un genoma?
Estrategia actual:
SECUENCIACIÓN POR TÉCNICAS DE NGS (Next generation Sequencing)
Genómica estructural: caracterización física de genomas enteros
Mapeo genético→ Mapeo físico
Las distancias físicas generalmente no se correlacionan con las distancias genéticas porque las
frecuencias de recombinación no son siempre proporcionales a las distancias moleculares.
A menudo, las dos correlacionan razonablemente en regiones de eucromatina (ej. Humanos: 1cM = 1 Mb =
1 millón de pb))
- Asignación de loci a cromosomas específicos (ligamiento; PFGE; híbridos
celulares interespecíficos)
-Ubicación de los genes a lo largo del cromosoma (mapeo por recombinación
generando mapas de alta densidad; hibridación in situ FISH; mapeo físico por
fragmentos clonados superpuestos, contigs, que representan un cromosoma o
genoma siendo la base para la secuenciación)
-Secuenciación a gran escala
del genoma
Secuenciación genómica
Secuenciación de ESTs
¿Qué es un marcador molecular?
 Puntos de referencia en los cromosomas,
permiten conocer el GENOTIPO
Todo o cualquier fenotipo molecular oriundo de un gen expresado
(ej. Isoenzimas) o de un segmento específico del ADN
(correspondiente a regiones expresadas o no del genoma).
Marcadores Morfológicos
Fenotipos que resultan de mutaciones en el ADN
Tomado de “The Cartoon Guide to Genetics”, Larry Gonick, Marck Wheelis
Tomado de “An Introduction to Genetic Analysis”, Griffiths A.J.F y col. (2000). W.H. Freeman Ediciones
Marcadores morfológicos Marcadores moleculares
Influencia del ambiente
Sin influencia ambiental y neutros
Bajo número, en pocas sps.
Cantidad ilimitada
Baja cobertura del genoma
Amplia cobertura del genoma
Bajo nivel de polimorfismo
Alto nivel de polimorfismo
Menos informativos
(dominantes o recesivos)
Más informativos
(en gral. codominantes)
Caracteres de madurez
Análisis en fases tempranas
Entrenamiento y subjetividad
Sencillos, rápidos y objetivos
Plant Cell Rep (2008)
RFLP (Restriction Fragment Length Polymorphism), Polimorfismo en el Largo
de los Fragmentos de Restricción
RFLP
Análisis mediante RFLP de los parentales resistente (R) y susceptble (S) al virus
PVX de Solanum commersonii empleando las enzimas de restricción HinfI, DdeI,
HindIII, DraI, EcoRI, XbaI y StyI (1 al 7). Autoradiografía de los perfiles de RFLP
obtenidos con la sonda s1+A/as1+T(584) marcada radiactivamente.
Obtención de sondas para RFLP
Vector de clonado
Transformación
Origen del polimorfismo de los RFLP
Adaptado de Ferreira M.E. & Grattapaglia D. Introdução ao uso de marcadores moleculares em análise genética (1995)
Mutaciones puntuales:
Ocurren en sitios de restricción (Ej de SNP).
Mutaciones estructurales:
Ocurren mediante inserciones, deleciones y rearreglos.
Implica: digestión, hibridación con sondas marcadas que se
deben generar (conocer), etc, etc→ laborioso, costo
DArT: Diversity Arrays Technology
DArT involucra varios pasos:
- Reducción de la complejidad del ADN de interés
- Creación de la genoteca (library)
- Construcción del microarreglo conteniendo los
clones de la library (glass slides)
- Hibridación del ADN marcado fluorescentemente a
los microarreglos
- Detección de la señal de hibridación mediante
scaneo de los microarreglos
- Extracción de datos y análisis
Jaccoud et al., NAR 2001
http://www.diversityarrays.com/products-and-services
Principales ventajas de DArT:
- Bajo costo de desarrollo y genotipado
- Permite detectar distintos tipos de variación a nivel de
secuencia
- Alta densidad de marcadores (High troughput)
- Preferencialmente detecta regiones ricas en genes
- Independiente de información de secuencia previa
Limitaciones:
- Falta de selección previa de regiones genómicas o genes a
ser ensayados
- Requiere secuenciar los clones para comprobar la identidad
del marcador
- Servicio prestado únicamente por DArT P/L
RAPD (Random Amplified Polymorphic DNA) ADN Polimórfico
Amplificado al Azar.
-Consiste en la amplificación
mediante PCR de ADN anónimo,
utilizando para ello un único
iniciador de secuencia arbitraria.
B
A
-Los oligonucléotidos iniciadores
(primers) se diseñan sin tener en
cuenta la información de la
secuencia genómica de la
especie a analizar.
-Normalmente se usa un solo
iniciador , de 10 nt de longitud
(más corto que el de una PCR
común) y con un contenido alto
en G+C.
Ej: iniciador OP-A01
CAGGCCCTTC
A B
Se genera
producto de
amplificación
No se genera
producto de
amplificación
Amplificación de ADN anónimo
con iniciadores de secuencia
arbitraria
Correspondencia entre los
fragmentos amplificados y las
bandas obtenidas mediante
electroforesis.
Los RAPDs son marcadores genéticos dominantes
No permiten distinguir el heterocigota del homocigota dominante
Origen del polimorfismo de los RAPD
Puede deberse a:
inserciones (2),
deleciones (3),
mutaciones de punto:
que impiden la unión del
iniciador (4) o crean un
nuevo sitio de unión del
iniciador (5).
RAPD
Implica: PCR y electroforesis
en gel de agarosa, no
requieren conocimiento previo
del genoma, versatilidad, costo
bajo, cobertura del genoma,
nivel de polimorfismo.
Perfiles de RAPD obtenidos con 12 primers (N01 a N12) y los bulks B2R (R) y B2S (S)
de una población segregante para resistencia a PVX MS de Solanum commersonii. Productos
de PCR corridos en un gel de agarosa (1,5%, TBE 1x) teñido con bromuro de etidio.
Segregación de un marcador RAPD en una población segregante de sorgo para el carácter de resistencia a brotado
precosecha. DNAs de IS, B2 (parentales), F1 y 20 individuos F2 amplificados con el primer OP H02. Productos de
PCR corridos en un gel de agarosa (1,5 %, TBE 1x) teñido con EtBr. Gentileza Dr. D.C. Lijavetzky.
Ensayo solicitado por una empresa
Objetivo:
Determinar mediante la técnica de marcadores moleculares RAPDs el patrón genético de cuatro
muestras de arándano, para definir si las mismas presentan diferencias genotípicas entre sí.
Material vegetal:
-Se analizaron las hojas de las distintas muestras de arándano rotuladas como
1. O´Neal
2. Muestra problema “Florida”
3. Flordablue in vitro (Oregon). Nota: esta muestra consistió en plántulas in vitro.
4. Flordablue hojas (Michigan)
Estas muestras fueron provistas por la empresa XX.
Figura 1. Patrones de amplificación de RAPDs obtenidos con 4 iniciadores diagnóstico (A, B, C y D). Las diferentes calles representan los
productos de amplificación obtenidos para las distintas muestras:
1 O´Neal, 2 Muestra incógnita “Florida”, 3 Flordablue in vitro (Oregon) y 4 Flordablue hojas (Michigan).
Matriz de similitud empleando el índice de asociación de Jaccard entre las muestras
O´Neal, Muestra incógnita “Florida”, Flordablue in vitro (Oregon) y Flordablue hojas
(Michigan):
O´Neal
Forida
FBiv
FBh
O´Neal 1.0000000
Florida 0.1343284 1.0000000
FBiv 0.0000000 0.0563380 1.0000000
FBh
0.0384615 0.0694444 0.2656250 1.0000000
Figura 2. Matrices de similitud y dendograma resultantes de la comparación de las muestras O´Neal, Muestra incógnita “Florida”,
Flordablue in vitro (FBiv) y Flordablue hojas (FBh) CCC: 0.99222
Obtención de un marcador SCAR Sequence Characterized Amplified Regions
(amplificación de regiones de secuencia caracterizada )
Un fragmento polimórfico de interés, puede ser escindido de un
gel, clonado (o no) y secuenciado para diseñar iniciadores
específicos para ese fragmento en particular, permitiendo su
amplificación en condiciones de PCR más rigurosas.
-Análisis del marcador SCAR CT220 en la población segregante de
S. comersonii
Perfiles de de amplificación obtenidos con el marcador CT220. BR: bulk resistente,
BS: bulk susceptible, S.p: S. pennellii, S.l: S. lycopersicum, R: individuos
resistentes, S: individuos susceptibles, *: individuos recombinantes. A la izquierda
se indican los tamaños de los fragmentos en pb. Electroforesis en gel de
poliacrilamida desnaturalizante revelado mediante tinción con plata.
Marcador CT220 proveniente de cromosoma IX de
tomate (Solanum lycopersicum)
Empleado en mapeo de Solanaceae.
SCARs Sequence Characterized Amplified Regions (amplificación de regiones de
secuencia caracterizada )
•
Los marcadores SCAR consisten en la amplificación por PCR
de un marcador específico
•
Los marcadores RAPD se pueden convertir en marcadores
estables y confiables clonando las bandas amplificadas,
secuenciando los extremos y usando luego estas secuencias
para diseñar iniciadores específicos
•
El diseño específico de los iniciadores permite trabajar en
condiciones de mayor rigurosidad y astringencia (ej,
temperatura de hibridación de los iniciadores mayor)
•
Los marcadores SCAR son muy útiles en los programas de
selección asistida (Mejoramiento Asistido por Marcadores,
MAS)
AFLP (Amplified Fragment Lehgth Polymorphism) Polimorfismo en el
Largo de los Fragmentos Amplificados
Procedimiento básico para la obtención
de AFLP:
- Digestión del ADN con una enzima de
corte raro y una enzima de corte
frecuente
- Ligación de adaptadores específicos
- Amplificación selectiva de fragmentos
por PCR
- Análisis de los fragmentos amplificados
mediante electroforesis en geles de
poliacrilamida
Ejemplo: AFLP (Eucaliptus sp.). Gel de poliacrilamida teñido con nitrato de plata
pb
500
450
425
400
375
350
325
300
275
250
225
200
175
150
125
Gentileza Dra. S.N. Marcucci Poltri
Ejemplo: AFLP en una población segregante de Solanum commersonii
R R
*
Individuos S
*
Individuos R
*
S R
Análisis de los segregantes de la población 78 y los bulks B3R(R) y B3S(S) con la combinación de iniciadores E38M42.
La banda de interés se indica con una flecha. R: Individuos resistentes, S: Individuos susceptibles, *: Individuos
recombinantes. Perfiles de AFLP resueltos e geles de poliacrilamida, visualizados mediante tinción con nitrato de plata.
Implica: digestión con enzimas de restricción y amplificación por PCR, no se
requiere conocimiento previo del genoma, número ilimitado de marcadores,
analizan todo el genoma, altamente reproducibles, polimorfismo elevado,
versatilidad (distintas enzimas e iniciadores selectivos),herencia dominante,
medianamente laboriosos, posibilidad de automatizar en secuenciador, costo
medio.
Microsatélites o SSR (Simple Sequence Repeats) Repeticiones de
Secuencia Simple
Repeticiones en tándem de secuencias cortas de DNA
de 1 a 10 pares de bases de longitud
Ejemplos:
(GA)14
...GAGAGAGAGAGAGAGAGAGAGAGAGAGA...
(GAT)10
...GATGATGATGATGATGATGATGATGATGAT...
(CATC)8
...CATCCATCCATCCATCCATCCATCCATCCATC..
Sinónimos: SSLP, SSRP, SSR o STMS
Microsatélites
5’...TGACAGTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGCGA...3’
3’...ACTGTCACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCGCT...5’
16 repeticiones
PCR con iniciadores específicos
5’...TGACAGTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGCGA...3’
CTGCGATCAGCCCATCATCG
5’
Iniciador
Iniciador
5’
GTGGGTCACGACTTGAGCCAG
3’...ACTGTCACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCGCT...5’
Producto de amplificación obtenido
5’ GTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGC 3’
3’
CACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCG 5’
105 pb
Electroforesis en gel de poliacrilamida
desnaturalizante
Origen del polimorfismo de los microsatélites
Los microsatélites son marcadores codominantes
Ejemplo: variedades de soja (Glycine max) analizadas mediante SSR
Patrones obtenidos para 43 variedades de soja. Gel de poliacrilamida teñido con plata.
Gentileza Dra. S. Giancola.
Obtención de las secuencias flanqueantes
¿Existen secuencias útiles en los bancos de secuencias?
NO
SI
Utilizar microsatélites como sondas para
aislar clones en una genoteca
Identificar secuencias que
contengan microsatélites
Ej: secuencias de ESTs
Secuenciar los
clones positivos
Diseñar iniciadores
específicos
PCR
Aislamiento de microsatélites
DNA genómico
GA GA GA GA GA GA GA GA GA
Clonado
GA GA
GAGA
GA GA
GA GA
GA GA
GA GA
GAGAGA
GAGAGA
Hibridación con sondas
Purificación de
(GA)n/(GT)n/(ATT)n
clones positivos
GA GA
GAGA
GA GA
GA GA
GA GA
GA GA
GAGAGA
GAGAGA
Secuenciación de
clones genómicos
GA GA
GAGA
GA GA
GA GA
GA GA
GA GA
GAGAGA
GAGAGA
Diseño de primers sobre secuencias
flanqueantes al microsatélite
GA GA GA GA GA GA GA GA GA
Métodos de separación / detección
Agarosa/bromuro de etidio
Poliacrilamida / nitrato de plata
Gentileza Lic. V. Nishinakamasu y Dra. N. Paniego
Fluorescencia
Gentileza Lic. P. Talia y Dra. N. Paniego
Radiactividad
Gentileza Lic. V. Nishinakamasu y Dra. N. Paniego
Tomado de : www.fsl.orst.edu/ tgerc/risk.htm
Métodos de
separación / detección
Homocigota alelo 1
Pico 147-149 pb
Fluorescencia
Homocigota alelo 2
Pico 153-155 pb
Implica: alto nivel de polimorfismo
(multialélico), número elevado de loci,
codominantes, interpretación sencilla
de los resultados (automatización,
multiplex), muy alta reproducibilidad,
costo medio-alto, requiere
conocimiento previo del genoma (hay
que desarrollarlos para cada especie
a estudiar), alta tasa de mutación que
puede afectar la reproducibilidad en
estudios genealógicos
Heterocigota:
ambos alelos
Electroferogramas para 3 genotipos de sorgo
Gentileza Téc. L. Fernández
Marcadores moleculares SNP Single Nucleotide Polymorphism
(polimorfismo de un solo nucleótido)
Consisten en sustituciones de una sola base, resultando en un polimorfismo dialélico
de secuencia.
En el genoma humano su frecuencia es de 1/1000 nt
Es una variación puntual a nivel de secuencia.
Disponibles por la gran cantidad de secuencias de genomas.
Son más frecuentes que SSR.
SNPs se ubican cercanos o en el locus de interés (en un gen y por lo tanto influenciará
la estructura de la proteína codificada por éste o sus niveles de expresión, etc.). Por lo
tanto, pueden asociarse precisamente a caracteres (como enfermedades).
Muy útiles como marcadores para la construcción de mapas de ligamiento más densos
que los actuales.
Detección de SNP
- Secuenciación comparativa de ADN amplificado
- Métodos conformacionales:
SSCP (Single Strand Conformation Polymorphism)
- Métodos para análisis de un gran número
de muestras: varios métodos
TaqMan® y HRM (High Resolution Melting)
DHPLC (Denaturing High-Performance Liquide Chromatography)
SNaP Shot
Illumina (Golden Gate)
SNP Array
KASPr
highthroughput analysis
Detección de SNP: Secuenciación comparativa de segmentos amplificados
Fundamento:
- Diferencias en las secuencias específicas
de segmentos conocidos (locus/loci)
Metodología:
- Extracción y purificación de ADN
- PCR con iniciadores caracterizados
- Secuenciación del producto
de amplificación
- Aplicación de alguna de las técnicas de
detección
InDels
Cambio
Fig. 1 Example of intraspecies polymorphism of the ITS. The part of sequences of two different
clones of M. bovis (a, b) and Mycoplasma conjunctivae (c, d) are present.
Appl Microbiol Biotechnol (2006) 71: 680–698. Sequence of the intergenic 16S-23S rRNA spacer (ITS)
regionof Mollicutes species and their identification using microarray-based assay and DNA sequencing.
Secuenciación comparativa: Ej. Secuenciación nucleotídica de ITS en Oxalis sp.
....|....| ....|....| ....|....| ....|....| ....|....| ....|....| ....|....| ....|....| ....|....| ....|....| ....|....|
5
15
25
35
45
55
65
75
85
95
O.tuberosa 1033
CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG
O.tuberosa 1051
CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG
O.tuberosa 1018
CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG
O.peduncularis
CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG
O.villosula
CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG
O.tabaconasensis
CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG
O.oblongiformis
CCTGCGGAAG GATCATTGTC GATACCTGCT TG-GCAGAAC AACATGCGAA CGTATTCATG AAGGAAAAAG AATTCGAGCT TCGGGCGAGT TGGCATCTAG
O.articulata
---------- ----ATTGTC GATACCTGCT TTT-CAGCGC AACATGCGAA TGTATTCTGG AAG---AAAG GACCCGAGCT ACGGACGAGT CGGGTGCTGG
Clustal Consensu
****** ********** *
*** * ********** ****** * ***
**** * ****** *** ***** **
** *
105
CCCT-GGCTA
CCCT-GGCTA
CCCT-GGCTA
CCCT-GGCTA
CCCT-GGCTA
CCCT-GGCTA
CCCT-GGCTA
CCCTAGGCCA
**** *** *
O.tuberosa1
O.tuberosa2
O.tuberosa3
O.peduncularis
O.villosula
O.tabaconasensis
O.oblongiformis
O.articulata
Clustal Consensu
....|....|
115
GTGCCTCCTT
GTGCCTCCTT
GTGCCTCCTT
GTGCCTCCTT
GTGCCTCCTT
GTGCCTCCTT
GTGCCTCCTT
GTTGCTGCTT
** ** ***
....|....|
125
GTTCCGTGGC
GTTCCGTGGC
GTTCCGTGGC
GTTCCGTGGC
GTTCCGTGGC
GTTCCGTGGC
GTTCCGTGGC
GTTCCGTGGC
**********
....|....|
135
CTAACCTCAA
CTAACCTCAA
CTAACCTCAA
CTAACCTCAA
CTAACCTCAA
CTAACCTCAA
CTAACCTCAA
CTGAAAACAA
** *
***
....|....|
145
AACCTAGCAC
AACCTAGCAC
AACCTAGCAC
AACCCGGCAC
AACCCGGCAC
AACCCGGCAC
AACCCGGCAC
ACCCCGGCGC
* ** ** *
....|....|
155
GAGTTGTGCC
GAGTTGTGCC
GAGTTGTGCC
GAGTTGTGCC
GAGTTGTGCC
GAGTTGTGCC
GAGTTGTGCC
GAGTCGCGC**** * **
....|....|
165
AAGGAATCTA
AAGGAATCTA
AAGGAATCTA
AAGGAATCTA
AAGGAATCTA
AAGGAATCTA
AAGGAATCTA
AAGGAATCTA
**********
....|....|
175
CGATGGG--CGATGGG--CGATGGG--CGATGGG--CGATGGG--CGATGGG--CGATGGG--TAATAGAGAG
** *
....|....|
185
---------------------------------------------------------------TTTGCTCCGC
....|....|
195
---------------------------------------------------------------GTGTCTGGAG
....|....|
205
-CGGACTGCG
-CGGACTGCG
-CGGACTGCG
-CGGACTGCG
-CGGACTGCG
-CGGACTGCG
-CGGACTGCG
ACGGACCACG
***** **
....|....|
215
CCTAGAAGCG
CCTAGAAGCG
CCTAGAAGCG
CCTAGAAGCG
CCTAGAAGCG
CCTAGAAGCG
CCTAGAAGCG
CGCGTAAGCA
*
****
O.tuberosa1
O.tuberosa2
O.tuberosa3
O.peduncularis
O.villosula
O.tabaconasensis
O.oblongiformis
O.articulata
Clustal Consensu
....|....|
225
CACGGTCTCC
CACGGTCTCC
CACGGTCTCC
CACGGTCTCC
CACGGTCTCC
CACGGTCTCC
CACGGTCTCC
CGCGATCTCT
* ** ****
....|....|
235
TTATATAGTC
TTATATAGTC
TTATATAGTC
TTATATAGTC
TTATATAGTC
TTATATAGTC
TTATATAGTC
TCATATTGTC
* **** ***
....|....|
245
GATAAAAATG
GATAAAAATG
GATAAAAATG
GATAAAAATG
GATAAAAATG
GATAAAAATG
GATAAAAATG
AATGANNNNN
** *
....|....|
255
ACTCTCGGCA
ACTCTCGGCA
ACTCTCGGCA
ACTCTCGGCA
ACTCTCGGCA
ACTCTCGGCA
ACTCTCGGCA
NNNNNNNNNN
....|....|
265
ACGGATATCT
ACGGATATCT
ACGGATATCT
ACGGATATCT
ACGGATATCT
ACGGATATCT
ACGGATATCT
NNNNNNNNNN
....|....|
275
CGGCTCTCGC
CGGCTCTCGC
CGGCTCTCGC
CGGCTCTCGC
CGGCTCTCGC
CGGCTCTCGC
CGGCTCTCGC
NNNNNNNNNN
....|....|
285
ATCGATGAAG
ATCGATGAAG
ATCGATGAAG
ATCGATGAAG
ATCGATGAAG
ATCGATGAAG
ATCGATGAAG
NNNNNNNNNN
....|....|
295
AACGTAGCGA
AACGTAGCGA
AACGTAGCGA
AACGTAGCGA
AACGTAGCGA
AACGTAGCGA
AACGTAGCGA
NNNNNNNNNN
....|....|
305
AATGCGATAC
AATGCGATAC
AATGCGATAC
AATGCGATAC
AATGCGATAC
AATGCGATAC
AATGCGATAC
NNNNNNNNAC
**
....|....|
315
TTGGTGTGAA
TTGGTGTGAA
TTGGTGTGAA
TTGGTGTGAA
TTGGTGTGAA
TTGGTGTGAA
TTGGTGTGAA
TTGGTGTGAA
**********
....|....|
325
TTGCAGAATC
TTGCAGAATC
TTGCAGAATC
TTGCAGAATC
TTGCAGAATC
TTGCAGAATC
TTGCAGAATC
TTGCAGAATC
**********
O.tuberosa1
O.tuberosa2
O.tuberosa3
O.peduncularis
O.villosula
O.tabaconasensis
O.oblongiformis
O.articulata
Clustal Consensu
....|....|
335
CCGCGAACCA
CCGCGAACCA
CCGCGAACCA
CCGCGAACCA
CCGCGAACCA
CCGCGAACCA
CCGCGAACCA
CCGTGAACCA
*** ******
....|....|
345
TCGAGTCTTT
TCGAGTCTTT
TCGAGTCTTT
TCGAGTCTTT
TCGAGTCTTT
TCGAGTCTTT
TCGAGTCTTT
TCGAGTCTTT
**********
....|....|
355
GAACGCAAGT
GAACGCAAGT
GAACGCAAGT
GAACGCAAGT
GAACGCAAGT
GAACGCAAGT
GAACGCAAGT
GAACGCAAGT
**********
....|....|
365
TGCGCCCTAA
TGCGCCCTAA
TGCGCCCTAA
TGCGCCCTAA
TGCGCCCTAA
TGCGCCCTAA
TGCGCCCTAA
TGCGCCCCAA
******* **
....|....|
375
GC-TTTAGGC
GC-TTTAGGC
GC-TTTAGGC
GC-TTTAGGC
GC-TTTAGGC
GC-TTTAGGC
GC-TTTAGGC
GCCTTTAGGC
** *******
....|....|
385
CGAGGGCACG
CGAGGGCACG
CGAGGGCACG
CGAGGGCACG
CGAGGGCACG
CGAGGGCACG
CGAGGGCACG
CGAGGGCACG
**********
....|....|
395
CCTGCCTGGG
CCTGCCTGGG
CCTGCCTGGG
CCTGCCTGGG
CCTGCCTGGG
CCTGCCTGGG
CCTGCCTGGG
CCTGCCTGGG
**********
....|....|
405
TGTCACACAT
TGTCACACAT
TGTCACACAT
TGTCACACAT
TGTCACACAT
TGTCACACAT
TGTCACACAT
TGTCACACAT
**********
....|....|
415
TGTCGCCTCC
TGTCGCCTCC
TGTCGCCTCC
TGTCGCCTCC
TGTCGCCTCC
TGTCGCCTCC
TGTCGCCTCC
TGTCGCCTCC
**********
....|....|
425
AAAGCCCTTT
AAAGCCCTTT
AAAGCCCTTT
AAAGCCCTTT
AAAGCCCTTT
AAAGCCCTTT
AAAGCCCTTT
AAAGCC-TTT
****** ***
....|....|
435
GCTCTCGAAG
GCTCTCGAAG
GCTCTCGAAG
GCTCTCGAAG
GCTCTCGAAG
GCTCTCGAAG
GCTCTCGAAG
GCTCT--ATG
***** * *
Detección de SNP: Métodos conformacionales
Fundamento: Detección de polimorfismos de un solo nucleótido (SNP)
o pequeñas mutaciones (inserciones y deleciones) mediante el
análisis de los cambios de movilidad del ADN simple cadena
causado por la sustitución de una sola base.
Metodología:
1) Amplificación por PCR de la secuencia de interés
2) El amplicón se desnaturaliza por calor y luego snap-cool.
3) Separación por tamaño y conformación mediante electroforesis en
geles de poliacrilamida nativos (native PAGE)
La movilidad electroforética de los fragmentos de ADN simple cadena
dependerá del tamaño y de la secuencia, adoptando conformaciones de
estructura secundaria por apareamientos de bases intramoleculares
Detección radioactiva y autoradiografía
Detección con nitrato de plata o SYBR Green II
Importante: condiciones rigurosas de electroforesis (%acrilamida, fuerza iónica
del buffer, temperatura 5ºC)
PCR:
requiere poco templado
fragmento a amplificar no mayor a 200 pb
cuidadoso diseño del par de primers
no excederse en la concentración de éstos
DHPLC Denaturing High-Performance Liquid Chromatography
•Detección de
moléculas
heterodúplex:
-Cromatografía líquida de alto
rendimiento en condiciones de
desnaturalización parcial (dHPLC).
DHPLC Denaturing High-Performance Liquid Chromatography
- Revela la presencia de polimorfismo en la forma de heteroduplex pero
no provee información con respecto a su naturaleza química y
localización. Se requiere luego secuenciar.
- Cuando la frecuencia de polimorfismo es baja puede ahorrar tiempo y
dinero, ya que los fragmentos que no presentan polimorfismo por
DHPLC no serán luego secuenciados.
Métodos para análisis de un gran número de
muestras
TaqMan®
Antes, repasemos...
Hydrolysis probes
(TaqManTM)
Se emplea una sonda que tiene
unidos un fotocromo reporter y un
fotocromo quencher. Cuando ambos
fotocromos están unidos a la sonda,
el reporter no emite señal. Pero,
cuando la sonda hibrida con la
secuencia de interés (target)
durante la reacción de PCR, la
actividad exonucleasa de la Taq
polimerasa cliva al fotocromo reporter
del resto de la sonda, permitiendo
la emisión una señal fluorescente.
Se monitorea la señal fluorescente del
reporter que se va acumulando en los
sucesivos ciclos de PCR.
FAM: 6-carboxifluoresceína
TET: tetracloro-6-carboxifluoresceína
VIC, HEX, Texas red, etc.
TAMRA: tetrametilrodamida
(a)Cuando la sonda, hibridada o no, está intacta
el fotocromo reporter no emite por acción del
quencher.
(b) La sonda es hidrolizada durante la reacción
de PCR y el reporter fluoresce.
TaqManTM
Detección de SNPs empleando sondas TaqMan para cada alelo.
Introducción
PCR y
HRM (High Resolution
HRM
Melting)
para detección de SNPs
Introducción
Single nucleotide primer extension
Detección de SNP: Métodos highthroughput
Illumina
SNP array
KASP
Illumina:
tecnología de
Bead arrays
Esquema de trabajo utilizando la tecnología
GoldenGate BeadXpress de Illumina.
Utilizando 250ng de ADN genómico de cada individuo se realiza la
activación o biotinilación del ADN. Este primer paso consiste en la
inmovilización de los fragmentos de ADN que fueron biotinilados a
partículas paramagnéticas que se encuentran recubiertas de
estreptavidina (Paso 1 de la figura). Luego, se procede a una hibridación
del ADN activado (Paso 2) aplicando un buffer de hibridación y un
conjunto de oligonucleótidos (OPA, del inglés Oligo Pool Assay). Éstos
son tres oligonucleótidos por cada locus: dos alelo-específicos (ASO, del
inglés allele-specific oligonucleotide) que difieren en su base 3’ y un tercer
oligonucleótido locus-específico (LSO, del inglés locus-specific
oligonucleotide), que hibrida río abajo del SNP a una distancia de
alrededor de 20 nucleótidos. Todos los oligonucleóticos son
complementarios a la secuencia a amplificar y contienen sitios para
oligonucleótidos universales (P1, P2 y P3); el LSO posee, además, una
secuencia llamada IllumiCode Address como en la figura que permite
identificar de forma unívoca a cada SNP y le otorga la capacidad al
ensayo de realizar amplificaciones en forma simultánea. Durante la etapa
de hibridación, los ASOs y LSOs se unen a las moléculas de ADN
genómico que se encuentran previamente unidas a partículas
paramagnéticas y se procede inmediatamente al lavado de las mismas
para la remoción de los oligonucleótidos no hibridados. Después, en el
Paso 3, se realiza la extensión y ligación de cada ASO al LSO
permitiendo la unión de la variante alélica del SNP con su correspondiente
IllumiCode Address. Los marcadores universales P1, P2 y P3 utilizan este
producto de ligación como templado para la reacción de PCR (Paso 4).
P1 y P2 están marcados con los fluoróforos Cy3 (verde; en la figura se
puede observar como círculos verdosos) y Cy5 (rojo; en la figura se ve
como cuadrados de color rojo) respectivamente. Por otro lado, el
marcador universal P3 tiene biotinilado el extremo 5’. Posteriormente al
paso de PCR, las hebras generadas se separan y se purifica la que se
encuentra marcada con el fluoróforo (Paso 5) para ser hibridada a las
esferas de vidrio (VeraCode Beads) por su secuencia IllumiCode Address
(Paso 6). En el Paso 7 se lleva a cabo un lavado para luego realizar el
escaneo de alta procesividad mediante el lector BeadXpress (Paso 8). El
mismo posee dos láseres de los cuales uno permite identificar el código
de cada esfera y el otro detecta la señal generada por el fluoróforo. Los
datos escaneados son analizados mediante el programa GenomeStudio
con el módulo de genotipado v1.1 (Illumina, San Diego, California,
EE.UU.).
a
b
c
Figura m.2: Agrupamientos normalizados de las clases genotípicas mediante el
programa GenomeStudio.
(a) SNP polimórfico; (b) SNP monomórfico; (c) Error en el agrupamiento.
Lectura y análisis de datos
High-density oligonucleotide arrays
Microordenamientos de oligonucleótidos de alta densidad
(microarrays o chips de ADN)
High-density oligonucleotide arrays
Más conocidos por su aplicación en estudios de expresión.
Permiten detección de variantes y genotipeado de un gran número de
marcadores.
Sondas de oligonucleótidos cortas de 20-25 bases de longitud,
unidas covalentemente a una superficie inerte (por fotolitografía o
por síntesis química de oligonucleótidos fotosensible). 300.000
sondas en 1,28 x 1,28 cm2
Basado en la especificidad de hibridación del ADN.
Las sondas en el array están diseñadas para complementar una
secuencia de referencia con un set de cuatro sondas, difiriendo cada
una sólo en la posición central, extendiéndose a lo largo de la
secuencia de referencia de a una base por vez. Resecuenciación.
High-density oligonucleotide arrays
Detección de SNP:
tecnología KASP: Kompetitive Allele Specific PCR
(PCR alelo específica)
Fin del primer ciclo de PCR
2do ciclo y subsiguientes:
-Reducción de costos
-Análisis de un gran número de muestras
-En mínimo tiempo: 24 hs vs. días para otros métodos
-Bajo error en la genotipificación
-Flexible
LGC
Genomics
www.lcggenomics.com
LGC genomics
64 placas
En la últimas décadas:
RDMs: Random DNA Markers
derivados de cualquier parte del genoma,
fenotípicamente neutros
FMs: Functional Markers
derivan de sitios polimórficos dentro de genes afectando
causalmente la variación del carácter fenotípico.
Surgen marcadores moleculares de las regiones
transcriptas /expresadas del genoma
1) ADNc o ARNm como fuente de marcadores
moleculares:
cDNA-RFLPs,
cDNA-AFLPs,
etc
2) Bases de datos de ESTs como fuente de marcadores
moleculares basados en PCR
ESTs: Expressed Sequence Tags
ESTs: Expressed Sequence Tags
<1000pb
Identificación de genes candidatos
Colecciones de ADNc diferenciales órgano – específicas de girasol (SSH)
ESTs RELACIONADOS CON ESTRÉS BIÓTICO Y
ABIÓTICO (40 secuencias únicas,
20 secuencias nuevas para girasol )
Clasificación funcional de ESTs aislados a partir de la
clonoteca diferencial de flor en estadio R1
Clasificación funcional de ESTs aislados a partir de la
clonoteca diferencial de flor en estadio R4
Germin – like protein
Oxygen-evolving enhancing protein
Putative beta-1,3-glucanase protein
Polygalacturonase inhibitor protein
Lipid transfer protein
Thaumatin-like protein
Cationic peroxidase protein
Fructosyltransferase protein
Heat shock protein
Dehydrin related protein
Cysteine protease
Fernandez et al. 2003. BMC Genomics. Sep 30;4(1):40.
Identifición y caracterización de nuevas fuentes de
Resistencia a PHC mediante herramientas genómicas
• Agente
•La Podredumbre húmeda del capítulo (PHC) es una
de las enfermedades mas devastadoras en la
Argentina.
•En casos extremos puede causar perdidas totales
•La incidencia anual promedio sobre la producción
de la pampa húmeda es del 10-20%
•La base genética de la resistencia es compleja con
varios QTLs involucrados en el carácter
2008
http://www.ncbi.nlm.nih.gov/genbank/dbest/dbest_summary/
dbEST release 130101
Summary by Organism - 01 January 2013
Number of public entries: 74,186,692
Homo sapiens (human) 8,704,790
Mus musculus + domesticus (mouse) 4,853,570
Zea mays (maize) 2,019,137
Sus scrofa (pig) 1,669,337
Bos taurus (cattle) 1,559,495
Arabidopsis thaliana (thale cress) 1,529,700
Danio rerio (zebrafish) 1,488,275
Glycine max (soybean) 1,461,722
Triticum aestivum (wheat) 1,286,372
Xenopus (Silurana) tropicalis (western clawed frog) 1,271,480
Oryza sativa (rice) 1,253,557
ESTPs: Expressed Sequence Tag Polymorphism
3) ESTs-SSR
Saturación de un mapa de referencia para girasol cultivado,
incluyendo marcadores neutros y funcionales
4) ESTs-SNPs y búsqueda de InDels
1. Extracción
de ADN de
diferentes
líneas de
girasol
3. Elección de amplicones únicos
2. Amplificación
por PCR
Genes
candidatos/ESTs
Gentileza, C. Fusari
4. Secuenciación de las regiones candidatas
en las 19 líneas elite de girasol
Gentileza, C. Fusari
5. Identificación de SNPs e indels con SeqScape v2.5
Gentileza, C. Fusari
6: Obtención de parámetros de diversidad con
DNAsp
•
Las frecuencias de SNPs e indels encontradas (1SNP/61 pb y de 1 indel/279 pb) son relativamente altas comparadas con las
frecuencias de SNPs e indels encontradas para otras especies vegetales.
•
En concordancia con lo esperado para materiales cultivados, las estimas de diversidad (θW =0,0058 y πT=0,0064) resultaron inferiores
a las encontradas en girasol silvestre.
•
Evaluación del desequilibrio de ligamiento (LD): distancia máxima de 700bp entre 2 SNPs, la extrapolación de la línea de tendencia
que ajustó a los datos sugiere una extensión del LD de hasta 100 kbp (r2~0,1). Esto permitiría utilizar los SNPs para el mapeo fino de
genes de interés para el mejoramiento del cultivo con una densidad de marcadores relativamente baja, comparado con otros cultivos
de interés económico.
Gentileza, C. Fusari
5) Secuencias conocidas de genes como fuente de marcadores
moleculares (GTMs, Gene Targeted Markers y FMs):
Amplificación de marcadores genéticos consenso: genes
conocidos de Arabidopsis y arroz , por ejemplo, amplificación
en Brassica napus.
SSRs, SNPs, SCARS, CAPs y RFLPs de genes conocidos.
Resistance Gene Analogues (RGAs): Análogos a genes de
resistencia
Instituto de
Biotecnología
Genes de resistencia a enfermedades en plantas
Instituto de
Biotecnología
Amplificación de análogos a genes de resistencia
 Marcadores RGA: Resistance Gene Analogs
RGAs en población
de S. commersonii
Análisis de los productos de amplificación
obtenidos con las 16 combinaciones de primers
de RGAs s1+1/as1+1 (de A a P) comparando los
bulks B1R (R) y B1S (S).
Electroforesis
en
gel
de
poliacrilamida
desnaturalizante 6% visualizado mediante tinción
con plata.
Instituto de
Biotecnología
Perfiles de amplificación de RGAs de 45 individuos segregantes usando la
combinación s1+A/as1+T resueltos en gel de poliacrilamida
desnaturalizante 6% y visualizados mediante tinción con plata. Se indican
los individuos resistentes (RESISTANT INDIVIDUALS) y susceptibles
(SUSCEPTIBLE INDIVIDUALS). Los individuos recombinantes se indican
con un asterisco. El fragmento de RGA de interés se destaca mediante una
flecha.
Resistance gene analogs (RGAs): dos marcadores ligados.
Actualmente, se generan nuevos marcadores:
Genotipificación por secuenciación
(Genotyping by Sequencing)
y RAD Sequencing (Restriction
Associated site DNA Sequencing)
Teórica específica
RAD sequencing
36-108 bp
Reduced representation of the genome
2 secuencias de 36-108 bp/fragmento
Genotipificación por secuenciación
(Genotyping by Sequencing)
2011
1) Reducción
de la
complejidad
del genoma
por corte con
enzima de
restricción
(RE) (que
puede ser
sensible a
metilación)
Genotyping by Sequencing vs. Whole Genome Shotgun
y la formación de
dímeros de adaptadores
Secuenciación por Illumina
RAD vs. GBS
Temas:
• Conceptos: Gen, Genoma, Genómica
• Organización del genoma
• Herramientas para estudiar los genomas:
Marcadores Moleculares
Mapeo genético
Mapeo físico , FISH
Secuenciación
Gracias!!
Instituto de
Biotecnología
Documentos relacionados
Descargar