DETERMINACIÓN PRELIMINAR DE GRUPOS DE LIGAMIENTO GENÉTICO EN Lupinus luteus. TESIS DE MAGISTER PAULA ELIZABETH MORA ORTEGA VALDIVIA- CHILE 2011 DETERMINACIÓN PRELIMINAR DE GRUPOS DE LIGAMIENTO GENÉTICO EN Lupinus luteus. Tesis presentada a la Facultad de Ciencias Agrarias de la Universidad Austral de Chile en cumplimiento parcial de los requisitos para optar al Grado de Magíster en Ciencias Mención Mejoramiento Vegetal. Por PAULA E. MORA O. VALDIVIA, CHILE 2011 Universidad Austral de Chile Facultad de Ciencias Agrarias INFORME DE APROBACIÓN TESIS DE MAGÍSTER La comisión Evaluadora de Tesis comunica al Director de la Escuela de Graduados de la Facultad de Ciencias Agrarias que la Tesis de magister presentada por la candidata PAULA ELIZABETH MORA ORTEGA Ha sido aprobada en el examen de defensa de Tesis rendido el día 8 de septiembre de 2011, como requisito para optar al grado de Magister en Ciencias y, para que así conste para todos los efectos firman: Profesor Patrocinante Haroldo Salvo Garrido Ingeniero Agrónomo, Ph.D Comisión Evaluadora de tesis Profesor Ricardo Riegel S. Ingeniero Agrónomo, Ph.D Iván Maureira Butler Ingeniero Agrónomo, Ph.D ÍNDICE Contenido Página RESUMEN SUMMARY 1 INTRODUCCIÓN 1 1.1 Características del genoma del género Lupinus. 3 1.2 Mapas de ligamiento genético 4 Mapas de ligamiento genético desarrollados en L. 6 1.2.1 angustifolius. 1.2.2 1.3 Mapas de ligamiento genético desarrollados en L. albus 8 Requerimientos para el desarrollo de un mapa de 11 ligamiento. 1.3.1 Desarrollo de una población de mapeo 12 1.3.2 Elección de marcadores moleculares 14 2. MATERIALES Y MÉTODOS 16 2.1 Desarrollo de la población de mapeo 16 I 2.2 Marcadores Moleculares 17 2.3 Análisis de Datos 19 2.4 Análisis de ligamiento y construcción del mapa 20 2.4.1 Análisis de la segregación 20 2.4.2 Establecimiento de los grupos de ligamiento 20 2.4.3 Análisis de ligamiento y recombinación genética 21 3. RESULTADOS Y DISCUSIÓN 22 3.1 Polimorfismo genético 22 3.2 Segregación genética de los loci 27 3.3 Identificación de grupos de ligamiento genético 29 4 CONCLUSIONES 39 5 BIBLIOGRAFÍA 40 II ÍNDICE DE FIGURAS Figura 1 Página Representación esquemática de la metodología utilizada 17 para la generación de la población RIL. 2 Patrón de segregación del marcador EST-SSR Contig 22 02274 en la población RILF7. Flechas rojas señalan parental paterno (A15), flechas negras parental materno (A26) y flechas azules F1. 3 Patrón de segregación del marcador SNP 12870F en la 25 población RILF7. Flecha roja señala parental paterno (A15), flecha negra parental materno (A26) y flecha azul el F1. 4 “Graphical genotype” del grupo de ligamiento genético 6 26 del mapa de ligamiento de L. luteus. Color rojo representa genoma materno A26 y en azul genoma paterno A15. 5 Histograma de frecuencia del carácter precocidad en la 28 población RIL F7 de L. luteus. 6 Mapa preliminar de L. luteus utilizando un valor LOD 5. Niveles de significancias de la segregación distorsionada: *:0.05 **:0.01 ***:0.005. III 31 7 Mapa de ligamiento genético obtenido utilizando un valor 32 LOD6. Niveles de significancias de la segregación distorsionada: *:0.05 **:0.01 ***:0.005. 8 Mapa preliminar de ligamiento genético en Lupinus 33 luteus. Se indican niveles de significancias de la segregación distorsionada: *:0.05 **:0.01 ***:0.005. En rojo se señalan asociaciones estadísticas encontradas entre genes y loci mapeados a través de mapeo asociativo y secuenciación del genoma. 9 Reordenamiento del primer grupo de ligamiento genético, 35 para los tres niveles LOD. 10 Reordenamiento del segundo grupo de ligamiento 36 genético, en los diferentes niveles LOD utilizados. 11 Reordenamiento del grupo de ligamiento cinco, utilizando LOD6 y LOD7 como parámetro de agrupamiento. IV 37 ÍNDICE DE ABREVIATURAS RILs Recombinant Inbred Lines EST-SSR Expressed Sequence Tags-Simple Sequence Repeat SNP Single Nucleotide Polymorphism INDEL Inserción o deleción de nucleótidos SSR Simple Sequence Repeat cM CentiMorgan LOD logarithm (base 10) of odds LG Grupo de Ligamiento AFLP Amplified Fragment Length Polymorphism SSD Single Seed Descent MFLP Microsatellite-anchored Fragment Length Polymorphic DNA V STS Sequence Tagged Site Dart Diversity Array Technology ITAP Intron Target Amplified Polymorphism Sequence QTL Quantitative Trait Loci Blast Basic Local Alignment Search Tool cDNA Hebra de ADN complementario MISA MIcroSAtellites Identification Tool NILs Near Isogenics Lines F2 Segunda filial BC Back-Cross DH Double Haploid 1C Un complemento, cantidad de ADN nuclear en estado haploide 2C Dos complementos, cantidad de ADN nuclear en estado diploide. VI pg Picogramos PCR Polimerase Chain Reaction DMSO Dimetilsulfoxido dNTPs Deoxyribonucleoside triphosphates K Kilobases Pmoles picomoles uL microlitro Pb pares de bases MAS Marker Assisted Selection VII RESUMEN EL alto costo de los ingredientes, una menor disponibilidad y un aumento de la demanda de harinas de pescado han obligado a la industria de los alimentos a aumentar el uso de fuentes alternativas de proteína vegetal. Lupinus luteus (2n = 2x = 52) es la especie de lupino con mayor contenido de proteína, sin embargo, su condición de semi-domestica hace necesario la mejora de varias características agronómicas y nutricionales para transformarlo en una opción competitiva y sustentable. Este estudio muestra la generación de los primeros grupos de ligamiento genético de L. luteus, lo cual es el primer paso para la construcción del primer mapa de ligamiento genético de la especie. Este mapa permitirá el descubrimiento de genes y / o QTLs (Quantitative Trait Loci) relacionados con calidad nutricional y características agronómicas. El bosquejo inicial del mapa fue desarrollado basado en una población de mapeo biparental obtenida a través del cruzamiento de dos accesiones (A15 x A26), pertenecientes a una colección de germoplasma introducida desde Polonia por el Centro de Genómica Nutricional Agroacuícola (CGNA). La población de mapeo RILs (Recombinant Inbred Lines), de 215 individuos, fue genotipificada utilizando 91 marcadores moleculares desarrollados específicamente para esta especie. La construcción del mapa de ligamiento se realizó utilizando crecientes valores de LOD, como parámetro de agrupamiento. Tres de estas representaciones son presentadas y analizadas en este estudio. Se obtuvo un total de 17 grupos de ligamiento de los 26 esperados dado el número cromosómico de la especie. Se mapearon con 64 loci con un promedio de distancia entre cada marcador de 7.1cM y una extensión total de mapa de 454.6 cM. El número de grupos VIII de ligamiento identificados y marcadores agrupados en estos, no sufrieron modificaciones al utilizar valores LOD mayores a 7, lo que señala una estabilización en las relaciones de ligamiento con los marcadores utilizados en este estudio. Sin embargo, los resultados obtenidos deberán ser confirmados con un mayor grado de saturación de marcadores moleculares. Actualmente estamos desarrollando y amplificando nuevos marcadores moleculares para permitir la recuperación completa de todos los grupos de ligamiento de la especie. Es importante señalar que seis marcadores utilizados en esta investigación ya han sido asociados a características nutricionales a través de un estudio de mapeo asociativo realizado en forma paralela en el centro de Investigación. Palabras Clave: L. luteus, mapa de ligamiento genético, marcadores moleculares, población RIL. IX SUMMARY High cost of feed ingredients, lower availability, and an increasing demand of fish meals have forced the food industry to increase the use of alternative protein sources, such as plant proteins. Lupinus luteus (2n=2x=52) in one of the lupine species with the highest grain protein content; however, its semi-domesticated condition requires the improvement of agronomic and yield traits before becoming a valid protein source. This study shows the generation of the first genetic map draft of L. luteus. The draft was developed using a biparental mapping population obtained from crossing two accessions (A15 x A26) belonging to a germplasm collection introduced from Poland by the Agriaquaculture Nutritional Genomic Center (CGNA). Two hundred and fifteen RILs (Recombinant Inbred Lines) were genotyped using 91 molecular markers developed specifically for L. luteus. The linkage groups were constructed using increasing LOD values as clustering parameters. A total of 17, out of the 26 expected linkage groups, were recovered with 64 loci mapped. The draft expanded 454.6 cM with an average marker density of 7.1 cM. The number of linkage groups and marker positions did not change when LOD values of 7 or higher were used, indicating stabilization of marker linkage relationships. . However, these results must be confirmed using a higher saturation of molecular markers. We are currently developing and amplifying new molecular markers to allow full recovery of the 26 linkage groups expected for L. luteus. X It is important to point out that six markers used in this research have being already associated to nutritional traits in a parallel association mapping study at CGNA. Key words: L. luteus, genetic linkage map, molecular markers, RIL population. XI 1 1.- INTRODUCCIÓN Dado el alto costo de las fuentes proteicas de origen animal, principalmente la harina de pescado, ocasionado por la disminución en la producción de esta materia prima, la industria de alimentos ha debido incrementar los niveles de inclusión de proteína y aceite de origen vegetal en sus dietas. Por ejemplo, las dietas de salmones han disminuido la incorporación de harina de pescado desde un 50% a un 35% y se proyecta llegar a sólo un 10% de incorporación en la dieta (González, 2008). Esto evidencia que la demanda proteína vegetal será significativamente mayor. En Chile esta demanda es cubierta principalmente por afrecho o torta de soya (Glycine max) importada, cuyo contenido proteico promedio es de 45% base materia seca. Una pequeña proporción es suplementada por la producción nacional de Lupinus albus (Lupino blanco) y Lupinus angustifolius (Lupino australiano), en los cuales el contenido de proteína en el grano fluctúan entre 34% y 37% y 27% y 31% base materia seca, respectivamente (Salvo-G, 2009). Al descascarar el grano pueden alcanzar concentraciones de 44% para lupino blanco y 39% para lupino australiano, siendo inferior a la torta de harina de soya. La proporción que suplementan es dependiente de la disponibilidad y precio internacional de la torta de soya. Esta situación indica que la inclusión de proteína nacional en la industria de alimentos no es una primera opción y si pudiera ser incorporada tendría que ser más competitiva que la proteína importada. Es por ello que para que la proteína vegetal de origen nacional presente una mayor participación en la industria de alimentos, se requiere generar una opción de mejor calidad y de menor costo. Dentro de las especies de lupinos, Lupinus luteus también conocido como (Lupino amarillo), posee contenidos de proteína para granos descascarados en base materia seca que fluctúan entre el 46% a 60% (Salvo-G, 2009). Según Glencross (2004) el lupino amarillo además de tener un mayor contenido proteico, presenta dentro de las especies de lupinos 2 mayor concentración de aminoácidos azufrados, característica fundamental para la utilización de la proteína vegetal como materia prima en la industria de los alimentos. Es por ello que desarrollar una opción agronómica de esta especie para el centro sur y sur de Chile resulta fundamental, si se pretende generar una mejor sustentabilidad del cultivo del lupino. Estudios realizados en una colección de germoplasma de L. luteus, introducido desde Polonia por el Centro de Genómica Nutricional Agroacuícola (CGNA), reportaron resultados preliminares para características agronómicas importantes tales como, precocidad del cultivo, altura de planta, necesidad de vernalización, entre otras. El rendimiento fluctuó desde 900kg/há a 4200Kg/há y la proporción cáscara grano, importante para el rendimiento industrial, fluctuó entre 21.7% a 29.3% (Mora y col., 2008). Otros caracteres de interés evaluados en esta colección fueron los factores antinutricionales en los cuales se ha encontrado variabilidad para el contenido de alfagalactósidos (Aravena, 2009), ácido fítico (Aravena, 2009) y alcaloides encontrándose este último en una proporción de 0.01% a 0.86% en granos base materia seca, los cuales se encuentran bajo la categoría de dulce permitiendo el uso para alimentación (Amiard, 2010 Comunicación personal). La variabilidad fenotípica y genética es un requerimiento fundamental si se requiere mejorar una especie, especialmente al aplicar mejoramiento genético moderno, como genómica, mapas de ligamiento genético y análisis de QTL o Quantitative Trait Loci (Semagn y col., 2006). Los mapas de ligamiento genético se han utilizado en diversos cultivos de importancia para detectar QTL asociados a distintos parámetros, tales como rendimiento, resistencia a insectos en soya (Boerma y Walker, 2006), aumento de la tolerancia a la sequía en maíz (Agrama y col., 1996), aumento del largo del grano de arroz (Wang y col., 2006), etc. Los mapas de ligamientos permiten acceder directamente a la región de genes que controlan dichas características a través de la selección asistida con marcadores moleculares (Ribaut y Hoising, 1998). 3 1.1.- Características del genoma del género Lupinus El contenido nuclear de ADN en especies de Lupinus ha sido reportado por pocos autores. Sin embargo, Bennett y Smith, (1976) reportaron un valor en estado haploide (1C) para L. albus de (0.60 pg) y para L. luteus (1.00pg). Barlow (1981) publicó para L. angustifolius un valor 1C de 0.93pg. Obernayer (1999), reporto un valor 1C para L. luteus de 1.17pg. La variación en los valores reportados por los diferentes autores puede deberse al origen del material evaluado y a los estándares internos utilizados para el análisis del flujo citométrico (Wolko y col., 2011). El primer estudio nuclear del contenido de ADN en este género, con el objetivo de estimar el rango de variación del tamaño del genoma del género Lupinus, basado en una gran cantidad de datos de un gran número de taxones, fue publicado por Naganowska (2006). El valor 2C fue estimado por análisis del flujo citométrico, utilizando 18 especies y algunas formas botánicas provenientes del Nuevo Mundo. El resultado de los análisis determinaron una variación significativa entre especies, estimando un valor 2C en un rango desde 0.97pg en L. princei a 2.44 pg en L. luteus, en donde el valor para L. angustifolius y L. albus fue de 1,89pg y 1.16pg respectivamente. Por otro lado, las especies de este género son consideradas por ser de origen paleopoliploides (Athinks y col., 1998; Gladstones, 1998), de esta manera en su temprana evolución probablemente ocurrieron eventos de auto y/o haloploidización, seguido por el proceso de divergencia del genoma “diploidización” (Wendel, 2000). En la actualidad, las formas de lupino son funcionalmente diploides, sin embargo, los niveles de ploidía no están claros y la gran diversidad en el número de cromosomas es difícil de explicar, los cuales fluctúan entre 2n:32 a 2n:52 (Naganowska y col., 2003). 4 Las especies originarias del Viejo Mundo, las cuales son además las de mayor importancia económica, son las que poseen el mayor número de cromosomas, L. angustifolius 2n=2x=40, L. albus 2n=2x=50 y 2n=2x=52 en L. luteus (Wolko y col., 2011). 1.2.- Mapas de ligamiento genético El mapeo genético es posible debido a que la información genética de la mayoría de los organismos está organizada y transmitida como unidades lineares de ADN, dispuesta en cromosomas, los cuales contienen aproximadamente entre 20 – 30 k genes, esta información se obtiene a partir de estudios en plantas modelo (Paterson, 1996). Existen esencialmente dos etapas durante el mapeo genético, la localización de genes (marcadores) en cada cromosoma y luego la identificación de su posición a lo largo de éste. Un mapa genético define el orden de estos genes a lo largo de los cromosomas en términos de frecuencia de recombinación. Genes localizados en posiciones específicas sobre un cromosoma se dice que están ligados o que tienen ligamiento genético (Kearsey y Pooni, 1996). Mediante esta definición se puede deducir que el desarrollo de un mapa genético involucra la detección de un número significativo de marcadores (loci), los cuales determinen confianza estadística de que todas las regiones de los cromosomas están representadas en el mapa. La información estadística obtenida del análisis de los marcadores determina el orden de estos en relación al orden de las estructuras de los cromosomas, tales como telómero y centrómero. Por lo que el número de marcadores moleculares necesarios para desarrollar un mapa génico varía con el número y largo de cada cromosoma en cada organismo (Kearsey y Pooni, 1996). El mapeo genético está basado sobre el principio de que los genes (marcadores o loci) segregan vía recombinación en los cromosomas durante la meiosis (reproducción sexual) y esto permite el análisis de la progenie (Paterson, 1996). Durante la meiosis los cromosomas segregan aleatoriamente dentro de gametos, de tal forma que la segregación de los alelos de 5 un gen es independiente de la segregación de otro gen, esto se conoce como la segunda ley de Mendel también conocida como ley de la segregación independiente. Pero la ley de la segregación independiente es verdadera para genes que están localizados en diferentes cromosomas y no es siempre verdadera para genes localizados en el mismo cromosoma. Cuando dos genes están localizados en el mismo cromosoma, ellos no segregan independientemente y se dice que están ligados. De esta forma estos genes ligados serán transmitidos juntos desde el parental a la progenie más frecuentemente que genes localizados separados (Semag y col., 2006). Al inicio de la meiosis en la profase I, los cromosomas homólogos se aparean intercambiando segmentos de cromosomas (ADN), este proceso se denomina crossing-over y el punto en el que ocurre se denomina “quiasma”, este proceso da lugar a la recombinación, en la cual dos moléculas de ADN interactúan para llevar un rearreglo de información genética en un organismo, el que luego formará gametos con nuevas combinaciones de genes diferentes a las de sus progenitores. La fracción de recombinación de dos loci se estima como la mitad del número de eventos de crossover que ocurra entre los loci, esto porque el crossover ocurre en el estado de cuatro cromátidas y un evento ocurre sólo entre las dos cromátidas no hermanas, esto da origen a dos tipos de gametos: gametos parentales (50%) y gametos recombinantes (50%). La composición alélica de los gametos parentales y recombinantes depende sobre todo si el cruzamiento original involucra genes en estado de acoplamiento o en fase de repulsión. En especies diploides la mayoría de los gametos prevalece en fase de acoplamiento conteniendo dos alelos dominantes o dos recesivos. En la fase de repulsión, los gametos contienen que contienen un alelo dominante y uno recesivo serán los más abundantes. Para decir cuán cerca se encuentran dos genes sobre un cromosoma, se asume que los genes localizados en diferentes cromosomas segregan independientemente (no ligados) tienen una frecuencia de recombinación de 50% y genes ligados tienen una frecuencia menor a 50%. 6 La posibilidad de que ocurra recombinación a través de un crossover entre dos genes está directamente relacionada con la distancia entre estos genes, a menor frecuencia de recombinación más cerca se encuentra los genes sobre el mismo cromosoma y por el contrario a mayor frecuencia de recombinación estos genes se encuentran en diferentes cromosomas (semagn y col., 2006). Los primeros mapas de ligamiento genético en especies vegetales, fueron realizados en maíz y tomate (MacArthur, 1934; Emerson y col., 1935) y estuvieron basados en características morfológicas controladas por sólo un gen. Estos mapas requirieron la síntesis de muchos estudios de ligamiento por separado, sin alcanzar una cobertura total del genoma. Este nivel de cobertura fue alcanzada sólo con el desarrollo de los marcadores moleculares. 1.2.1.- Mapas de ligamiento genético desarrollados en L. angustifolius El primer mapa de ligamiento en esta especie fue desarrollado en el Departamento de Agricultura y Alimentación del Este de Australia (DAFWA; Perth, Australia), mediante el cruzamiento de una línea domesticada y una accesión silvestre proveniente de Marruecos. Estos dos parentales difieren en al menos seis características existentes en los cultivares australianos: ku (floración temprana), iuc (bajo contenido de alcaloides), ta y le (resistencia a la dehiscencia), moll (permebilidad semilla al agua) y leuc (color de las flores, semillas y cotiledones). El primer mapa parcial fue construido en una población F2 utilizando solo marcadores AFLP (Amplified Fragment Length Polymorphism) (Brien y col., 1999). Esta población de mapeo fue llevada a una población RILs F8/F9, a través de una estrategia de SSD (Single Seed Descent), la cual hoy es la base de los mapas actuales desarrollados por Boerma y col., (2005) y por Nelson y col., (2006 y 2010) en esta especie. El mapa desarrollado por Boerma (2005), en 89 RILs F8, comprendió 522 marcadores MFLP (Microsatellite-anchored Fragment Length Polymorphic DNA), mediante los cuales 7 se identificaron 21 grupos de ligamiento, cada uno con al menos siete marcadores moleculares. Sin embargo, el número de grupos de ligamiento identificado fue mayor al número de cromosomas de la especie en estado haploide n:20 (Naganowska y col., 2003). Luego Nelson (2006), en 93 RILs F8, incluyó 382 nuevos marcadores STS (Sequence Tagged Site), logrando la identificación de 20 grupos de ligamiento, lo cual es consistente con el número de cromosomas haploide de la especie, además el largo del mapa aumentó de 1543cM a 1846cM. De los marcadores utilizados, los marcadores MFLP son generados rápidamente, sin embargo, son específicos y su valor es limitado fuera de la utilización en la población de mapeo, a menos que sean posteriormente transformados en marcadores locus específicos STS. Los marcadores utilizados por Nelson (2006), son menos en número pero tienen la ventaja que pueden ser utilizados en otras especies de la familia de las leguminosas. Mediante la aplicación de los mapas de ligamiento genético en L. angustifolius ha sido posible mapear genes responsables para características de domesticación como: bajo contenido de alcaloides (gen iucundis), permeabilidad de la cubierta de la semilla (gen mollis), color blanco de la flor (gen leucospermum), requerimiento de vernalización (gen Ku) y dos genes para la característica de dehiscencia o “pod-shaterring” (genes tardus y lentus), además se han encontrado marcadores ligados a la resistencia a la antracnosis llamado gen Lanr1. La complementariedad de estos dos mapas publicados de L. angustifolius fueron combinados en un nuevo mapa recientemente publicado por Nelson (2010), donde se incorporaron 200 nuevos marcadores analizados en 106 RIls. Este mapa comprometió 1080 loci en 20 grupos de ligamiento. El largo de los grupos fluctúo desde 69.7cM a 168.1 cM, con un largo de mapa total de 2361.8 cM, lo cual es mayor a lo reportado en los mapas anteriores. Este mapa fue recientemente mejorado con la adición de 300 nuevo marcadores Dart (Diversity Array Technology), información que aún no ha sido publicada (Wolko y col., 2011). 8 Este mapa más saturado fue utilizado para localizar las características de domesticación mapeadas, un ejemplo de ello es el gen “ta”, el cual es uno de los genes que controlan dehiscencia, según el mapa de Boerma (2009) y Nelson (2010) fue mapeado en el grupo de ligamiento 1, lo cual es equivalente al grupo de ligamiento 18 del mapa de Nelson (2006). Tres marcadores cercanamente ligados a ta fueron desarrollados y al menos un marcador es informativo en 70% de cruzamientos entre especies silvestres y líneas domesticadas. Sólo un QTL ha sido reportado para L. angustifolius por Boersma (2008), el que fue identificado para características de la semilla como; vigor temprano, altura de la planta, floración temprana y tamaño de la semilla. Interesantemente la región que alberga ku (gen relativo a la vernalización), tiene un rol en las mismas cuatro características medidas. Una nueva población de mapeo RIL fue desarrollada por el Departamento de Agricultura y Alimentación del Este de Australia (DAFWA), la cual comprende 260 RILs, originada a partir del cruzamiento de dos variedades domesticadas de L. angustifolius, Unicrop y Tanjil, en esta población hay segregación para resistencia a antracnosis, resistencia a virus del mosaico del pepino (CMV) y para transmisión vía semilla de áfidos y fomosis del tallo. Esta población fue usada para identificar un gen mayor para resistencia a antracnosis (Lanr1) y desarrollar marcadores para selección asistida por marcadores (Yang y col., 2004). 1.2.2- Mapas de ligamiento genético desarrollados en L. albus Dos mapas de ligamiento han sido independientemente desarrollados para L. albus en Australia e Inglaterra. En el primero, se utilizaron 105 marcadores ITAP (Intron Target Amplified Polymorphism Sequence ) y 220 marcadores AFLP (Amplified Fragmenth Length Polymorphism), para genotipificar 94 RILs seleccionados aleatoriamente de una población de 195 RILs F8, provenientes del cruzamiento del cultivar Kiev Mutant y una “landracea” proveniente de Etiopía. De esta manera fueron identificados 28 grupos de 9 ligamiento lo cual excede el número de cromosomas haploide de la especie n:25 (Naganowska y col., 2003). Lo cual indica que este mapa cubre inadecuadamente al menos tres cromosomas de la especie. El largo de los grupos de ligamiento fluctuó entre 22.5cM y 246.5 cM, obteniendo un largo total de mapa de 2951 cM. Además fueron identificados QTLs (Quantitative Trait Loci) para resistencia a antracnosis y precocidad del cultivo (tiempo de floración) y fue mapeado un gen mayor para contenido de alcaloides (Phan y col., 2007). El segundo mapa fue desarrollado mediante 102 RILs F5, obtenidas a través del cruzamiento de Lublanc (cultivar primaveral) y LD37 (L. albus sub. graecus). Utilizando 77 marcadores STS (Sequence tagged Site) y 230 marcadores AFLP. Se identificaron 25 grupos de ligamientos, con lo cual el autor estima representar solo un 84.2% del genoma de la especie (Croxford y col., 2008). Además fueron identificados QTLs para precocidad del cultivo, contenido de alcaloides en la semilla y altura del tallo. Solo unos pocos marcadores fueron compartidos entre los dos estudios. Mapas de ligamiento genético en otras especies aún no han sido publicados. Sin embargo en Australia, se han desarrollado dos poblaciones en L. luteus cada una con 200 individuos RILs F8. Una población desarrollada a través del cruzamiento de dos parentales domesticados, la cual posee segregación de un gen mayor para resistencia a virus del mosaico del pepino (Wolko y col., 2011). La segunda población, obtenida del cruzamiento de un parental silvestre y uno domesticado, posee segregación para permeabilidad de la testa, precocidad, contenido de alcaloides, color de semilla, dehiscencia de las vainas y color de la flor. Sin embargo, aún no hay desarrollo de mapas de ligamiento genéticos utilizando estas poblaciones (Wolko y col., 2011). En consecuencia, si se requiere desarrollar agronómicamente la especie de L. luteus en Chile, es de importancia desarrollar su mapa de ligamiento genético, dado que no existe un mapa para esta especie. Con el mapa, será posible aplicar mejoramiento genético moderno, 10 que permita explorar y acceder eficientemente a nivel molecular la variabilidad genética de la especie, facilitando la identificación de regiones genómicas (QTLs) y/o genes asociadas a caracteres de importancia de calidad nutricional y productiva. El uso del mapa permitirá además la aplicación de la selección asistida por marcadores moleculares (Yang y col., 2004), permitiendo con ello acelerar los ciclos de mejoramiento y responder de manera más efectiva a las exigencias del mercado. Es por ello, que se han desarrollado los primeros marcadores moleculares para la especie Lupinus luteus, (Parra y col., 2010). Estos marcadores específicos para la especie son un requisito fundamental para el desarrollo de un mapa de ligamiento genético, ya que aun cuando se pueden utilizar marcadores moleculares de otras especies su eficiencia es menor. Los marcadores fueron desarrollados de manera paralela a esta investigación, a través de distintas metodologías. A partir de ADN genómico de ambos parentales se construyó una librería de secuenciación 454. Mediante una técnica de reducción de la librería se obtuvieron secuencias enriquecidas en SNP (Simple Nucleotide Polimorfism). Utilizando esta librería además se obtuvieron algunos marcadores microsatélites e INDEL. Por otro lado, se generó una librería de enriquecimiento de microsatélites a partir de ADN genómico, las secuencias obtenidas fueron clonadas bacterias y secuenciadas (Parra y col., 2010). Sin embargo, el mayor número de marcadores fue obtenido mediante la secuenciación masiva 454 utilizando cDNA (secuencia complementaria de la hebra de ADN), proveniente de hoja, flor, semilla y raíz de uno de los parentales (A26) y posterior búsqueda de secuencias microsatélites utilizando herramientas bioinformáticas MISA (MIcroSAtellites Identification Tool). Las secuencias seleccionadas fueron comparadas con la especie modelo Medicago truncatula, mediante BLAST (Basic Local Alignment Search Tool) para identificar similaridad con genes ya descritos. 11 En consecuencia y dado la importancia de poseer una especie agronómicamente sustentable para la producción de proteína vegetal en Chile, que sea competitiva a las fuentes importadas de proteína vegetal, es que este estudio aborda la construcción preliminar del primer mapa de ligamiento genético en la especie L. luteus. Esta investigación se basa en la hipótesis, que los parentales seleccionados presentarán suficiente diferencias genéticas para permitir estimar la recombinación genética y construir los grupos de ligamiento en L. luteus. Por lo tanto, el objetivo principal de este estudio es la identificación preliminar de grupos de ligamiento genético en la especie Lupinus luteus. Para ello será necesario caracterizar la población de mapeo con al menos 100 marcadores moleculares, construir una matriz de datos y mediante un programa estadístico lograr representar los grupos de ligamiento genético identificados. 1.3.- Requerimientos para el desarrollo de un mapa de ligamiento genético El desarrollo de un mapa de ligamiento genético posee al menos tres requerimientos, en primer lugar desarrollar una adecuada población de mapeo y decidir el tamaño de la muestra logrando que sea representativa. Luego se debe elegir el tipo de marcador molecular a utilizar para genotipificar la población de mapeo y seleccionar los marcadores polimórficos en los parentales, a través de pruebas de polimorfismos, los cuales serán utilizados para genotipificar los individuos recombinantes y finalmente representar el análisis de ligamiento genético, calculando las frecuencias de recombinación entre los marcadores, estableciendo los grupos de ligamiento y luego determinar las distancias y el orden de los marcadores utilizando un programa estadístico (Semagn y col., 2006). 12 1.3.1- Desarrollo de una población de mapeo Para desarrollar una población de mapeo, es necesario seleccionar dos parentales genéticamente contrastantes, los cuales deben en lo posible, presentar diferencias claras en una o más características de interés como: rendimiento, color de las flores, precocidad, entre otras. Los parentales deben ser genéticamente diferentes, lo suficiente como para exhibir polimorfismos. Sin embargo, es importante cuidar que los genotipos seleccionados no sean genéticamente tan distantes como para causar esterilidad de la progenie o causar altos niveles de segregación distorsionada (Semagn y col., 2006). La selección de la población de mapeo es crítico para el éxito del mapa de ligamiento genético. Existen varios tipos de poblaciones. Una población F2, es desarrollada por la autopolinización de un híbrido F1 derivado del cruzamiento de dos parentales, mientras que una población BC (Back-Cross), es producida por el cruzamiento de la F1 con uno de sus parentales llamado parental recurrente, si este retrocruzamiento se repite de seis a siete generaciones, se obtiene una BC6 el cual tendrá más de 99% del genoma del padre recurrente (Babu y col., 2004), si esta BC6 es autopolinizada se obtiene una BC6S1 en las cuales las líneas están en estado de homocigosis, estas líneas se denominan líneas isogénicas o (NILs). Otro tipo de población son las RILs (Recombinant Inbreed Lines) las cuales se desarrollan a través de una estrategia SSD (Single Seed Descent), en la cual sólo una semilla de cada línea avanza a la siguiente generación desde F2-n. La base del desarrollo de una población RILs es, seleccionar dos parentales bajo las características antes mencionadas, obtener una F1 mediante el cruzamiento de los parentales, luego el híbrido es autopolinizado obteniendo una F2, de cada uno de los individuos F2 se toma una semilla la cual pasa a la siguiente generación, esto se repite de seis a ocho generaciones. 13 Un tipo de población muy utilizada es la población DH (Double Haploid), la cual es producida por el doblamiento de gametos de una población F1 o F2. Las plantas son generadas utilizando técnicas de cultivo de tejidos después de la inducción del doblamiento de cromosomas de granos de polen o embriones haploides los cuales resultan de cruzas entre especies (Semagn y col., 2006). En el presente estudio, se desarrolló una población de mapeo RIL, la cual fue avanzada hasta la generación F7, lo que aseguraría altos niveles de homocigosis y permitiría realizar diversos análisis genéticos y evaluaciones fenotípicas dado que las combinaciones genéticas dentro del genoma estarían fijadas o “inmortalizadas”. Sin embargo, una de las desventajas es que pueden aún permanecer algunos loci en estado heterocigoto. Otro factor importante a decidir, es el tamaño de la población. Estudios de simulaciones utilizando diferente número de individuos, desde 50 a 1000 en poblaciones F2, BC, RILs y DHs, han mostrado que el tipo y el tamaño de la población puede ejercer influencia sobre la exactitud del mapa genético (Ferreira y col., 2006). En cuyo caso, poblaciones con número muy bajo de individuos provee varios grupos de ligamiento fragmentados e inexactitud en el orden de los loci. La mayor exactitud en los mapas ha sido obtenida por poblaciones F2, DH y RIL, utilizando marcadores codominantes y mapas menos exactos han sido obtenidos de poblaciones F2 utilizando marcadores dominantes. Por otro lado, a mayor número de individuos se ha obtenido mayor precisión en los mapas de ligamiento, sin embargo, en todos los tipos de poblaciones 200 individuos son requeridos para construir un mapa con una exactitud razonable (Ferreira y col., 2006). Según Mohan (1997), los estudios de mapas genéticos preliminarmente requieren de 50 a 250 individuos para lograr un mapa de alta resolución. 14 1.3.2.- Elección de marcadores moleculares Para la elección del tipo de marcadores moleculares a utilizar, es necesario tener en cuenta el tipo de herencia del marcador y si la secuencia es conocida, estas características permitirán obtener la mayor cantidad de información del análisis. En los casos, en los cuales las poblaciones obtienen individuos altamente homocigotos (DH, RIL, NIL), los marcadores dominantes suministran tanta información como los codominantes. Existe gran cantidad de sistemas de marcadores, sin embargo en este estudio se utilizaron marcadores microsatélites SSR (Simple Sequence Repeat), EST-SSR (Expressed Sequence Tag- Simple Sequence Repeat) y SNP (Single Nucleotide Polymorphism). Estos marcadores fueron desarrollados y caracterizados como trabajo paralelo al desarrollo de esta tesis, por el centro Genómica Nutricional Agroacuícola (Parra y col., 2010). Los microsatélites (SSR) son regiones de secuencias pequeñas (de 2 a 10 pares de bases) repetidas, las cuales se asume que están distribuidas por todo el genoma. Son secuencias de ADN altamente variables dispersas a través de los genomas de la planta los cuales pueden o no estar asociadas con genes. Dado que la repetición por sí misma no codifica para formar ninguna proteína y debido a que las secuencias de ADN repetitivo pueden recombinarse y expandirse más frecuentemente que otros tipos de secuencias, estas regiones son a menudo altamente variables y consecuentemente útiles para medir el polimorfismo entre especies o variedades muy relacionadas (Phillips y col., 1995). El desarrollo de marcadores SSR es muy laborioso debido a que deben identificarse y secuenciarse regiones genómicas concretas (bordes del microsatélite), aunque una vez conseguido presenta un sistema muy informativo. Aún cuando los microsatélites permiten analizar sólo un locus por experimento, son bastante informativos ya que dejan diferenciar 15 las variantes alélicas de los loci analizados y por lo tanto identificar grupos de ligamiento en la construcción de mapas genéticos. Sin embargo, para su desarrollo se precisa conocer la secuencia y por lo tanto, son menos numerosos que otros marcadores dominantes. Estos marcadores son ideales para el estudio de ligamiento genético en plantas y mapeo físico, estudios poblacionales e identificación de variedades (Grattapaglia y Ferreira, 1996). Por otro lado, los microsatélites que se encuentran en las secuencias expresada tags (ESTSSR) son una importante fuente de descubrimiento de genes y de desarrollo de marcadores moleculares. Diferentes proyectos han generado una gran cantidad de información de secuencias públicas disponibles las cuales han sido la base para varios marcadores ESTSSR (Eujayl y col., 2004; Varshney y col., 2005a; Poncet y col., 2006). Debido a que los EST son derivados de secuencias expresadas, son útiles para análisis funcionales de la diversidad en poblaciones naturales o artificiales de mapeo (Varshney y col., 2005b). Estos marcadores se caracterizan por poseer un alto nivel de transferibilidad en especies relacionadas (Varshney y col., 2005a; Varshney y col., 2005b) lo cual hace que estos marcadores candidatos seguros en mapeo comparativo y estudios de evolución (Varshney y col., 2005b, Mian y col., 2005). Los marcadores SNP (Single Nucleotide Polimorphism) fueron generados utilizando librerías de reducción genómica de ambos padres. Estos marcadores se han desarrollado rápidamente en los últimos años, siendo altamente sensibles, reproducibles y poseen alta capacidad de análisis múltiples (Semagn y col., 2006). 16 2.- MATERIALES Y MÉTODOS 2.1.- Desarrollo de la población de mapeo Se desarrolló una población de mapeo RILs (Recombinat Inbreed Lines), a través del cruzamiento entre dos líneas de L. luteus pertenecientes a una colección de germoplasma introducido desde Polonia por el Centro de Genómica Nutricional Agroacuícola, CGNA. La línea A15 utilizada como línea paterna y la A26 como línea materna. Los parentales utilizados son contrastantes para las características de: precocidad, contenido de alcaloides y contenido de proteína en el grano (base materia seca), rendimiento, altura de planta y necesidad de vernalización. A partir del híbrido F1 se desarrolló vía autopolinización una población F2, de esta se tomaron semillas individuales para generar una población F3 y así sucesivamente hasta lograr una población RIL F7 de 215 líneas recombinantes, tal como se muestra en Figura 1. Esta metodología de desarrollo de la población RIL corresponde a una estrategia de Single Seed Descent (SSD), la cual permite sólo el avance de una semilla por línea a cada generación de cada uno de los genotipos F2-n generados. 17 Figura 1. Representación esquemática de la metodología utilizada para la generación de la población RIL. Esta metodología requiere gran esfuerzo para ser implementada, sin embargo, se puede obtener una buena representación de las recombinaciones posibles para los caracteres de interés en los parentales. Además es posible obtener segregaciones complementarias y transgresivas, lo cual permitiría desarrollar un genotipo superior a los parentales (Kearsey y Pooni, 1996). Cada una de las generaciones fue incrementada en condiciones controladas de invernadero. En la generación F7 se extrajo ADN genómico total de tejido foliar joven, a través del método de extracción CTAB o “Hexadecyltrimethylammoniumbromide” (Doyle y Doyle, 1987). El ADN extraído fue cuantificado y diluido a 100 ng/uL en buffer TE (10 mM TRIS, 1 mM EDTA Ph 7,5). 2.2.- Marcadores Moleculares En este estudio, amplificamos un total de 105 marcadores para genotipificar la población de mapeo, de los cuales 66 corresponden a marcadores derivados de secuencias expresadas EST-SSR (Expressed Sequence Tags-Simple Sequence Repeat), 10 a marcadores 18 genómicos microsatélites SSR (Simple Sequence Repeat), tres marcadores genómicos INDEL (Inserción o deleción de nucleótidos) y 26 marcadores SNP (Single Nucleotide Polymorphism), desarrollados en el Centro de Genómica Nutricional Agroacuícola. La reacción de amplificación de las regiones microsatélites tanto de origen genómico como los provenientes de secuencias expresadas, se realizó en 20uL de reacción PCR (Polimerase Chain Reaction), la cual contenía 200 ng de ADN, 0.2 mM dNTPs, 2 mM MgCl2, 1x buffer PCR, 2,5% DMSO (Dimetilsulfoxido), 1UTaq polimerasa (Agilent Technologies (Stratagene)) y 5 pmoles de partidor reverse y forward. La reacción fue incubada en un termociclador (MJ Researcher 2000), utilizando el siguiente programa con touchdown; 94ºC por 5 min, 5 ciclos de 1 minuto a 94ºC, 1 min entre 55ºC y 65ºC disminuyendo 1ºC por cada ciclo, 2 min a 72ºC, luego 35 ciclos de 1min a 94ºC, 1 min entre 50ºC y 60ºC y 2 min a 72ºC. La extensión final se realizó a 72ºC durante 10 min. El producto PCR fue separado en un gel de poliacrilamida denaturante al 6%, corrido mediante electroforesis a 60 w durante 4 horas, el gel fue visualizado mediante procedimiento de tinción con nitrato de plata, según lo descrito por Tixier y col., (1997). Los marcadores SNP polimórficos previamente caracterizados fueron amplificados mediante una doble reacción PCR (Polimerase Chain Reaction). La primera reacción se realizó en un volumen final de 15 uL y contenía 200 ng de ADN genómico, 1x buffer PCR, 0.2 mM dNTPs (deoxynucleosides), 5 pmoles de partidor reverse y forward, 1U Taq polimerasa (Agilent Technologies (Stratagene)) y agua desionizada. La reacción fue incubada en un termociclador utilizando un programa con touch down: comenzando a 95ºC por 5 min, durante 5 ciclos disminuyendo 1ºC por cada ciclo, luego 30 seg a 94ºC, 1 min 63ºC, 2 min a 72ºC, luego 37 ciclos de 30 seg a 94ºC, 1 min a 58ºC y 2 min a 72ºC. La extensión final se realizó a 72ºC durante 10 min. Luego el producto fue chequeado en un gel de agarosa al 2%. La segunda reacción fue un PCR asimétrica, la reacción se realizó en un volumen final de 20 uL la cual a diferencia del anterior, sólo utilizó uno de los partidores utilizados en la primera reacción y 2ul de producto de la primera reacción en vez 19 de ADN, con ellos se consigue que la hebra de ADN final obtenida sea de hebra simple, resultando en una banda nítida en la amplificación, los otros reactivos se utilizan en las mismas concentraciones y volúmenes mencionados en la reacción anterior. El producto PCR fue separado en un gel de poliacrilamida denaturante 37.5:1(acrilamida: bisacrilamida) al 8%, el cual fue corrido mediante electroforesis a 3 w durante 16 horas, el gel fue visualizado mediante tinción con nitrato de plata (Tixier y col., 1997). 2.3.- Análisis de Datos Los patrones de segregación de los distintos tipos de marcadores en la población RILs fueron genotipificados. Dos tipos de alelos por cada marcador-locus fueron anotados como “a” y “b”, identificando el genotipo de cada línea recombinante. Siendo “a” el genotipo de origen paterno y “b” el genotipo de origen materno. En el caso de la presencia de ambos alelos parentales, el genotipo se anotó como “h”. Los genotipos ambiguos o no determinados se clasificaron como “u”, según lo descrito por Salvo-Garrido y col., (2002). La constitución alélica de toda la población RIL para cada marcador se organizó en forma de una matriz, donde cada columna representó las líneas recombinantes y las filas correspondieron a los marcadores. La matriz alélica obtenida fue usada para análisis de ligamiento y recombinación genética, a través del software JoinMap versión 4 (Van Ooijwn, 2006). Una vez formados los grupos de ligamiento genético, dentro de cada grupo de ligamiento genético se analizó el grado de ligamiento y recombinación genética para cada par de marcadores. Para ello se utilizó en el módulo de JoinMap los siguientes parámetros: considerar ligamientos débiles con una frecuencia de recombinación mayor que 0.499 o un LOD menor que 0.05 y considerar ligamientos fuertes con una frecuencia de recombinación menor que 0.01 o LOD mayor a 10. Para transformar el porcentaje de recombinación genética a unidades de mapa (cM, centimorgan) y determinar el orden de marcadores en el 20 grupo de ligamiento genético se utilizó la función de mapeo según Kosambi (Kosambi, 1944). 2.4.- Análisis de ligamiento y construcción del mapa 2.4.1.-Análisis de la segregación En primera instancia, se analizó la segregación de cada locus a través de una prueba de x2. Esto para analizar el tipo de segregación. Siendo una población RILs, se espera una proporción de 1:1 entre ambas clases (alelos a y b). Es decir, el 50% de los individuos deben tener el alelo paternal y el otro 50% el alelo maternal. Una desviación de esta frecuencia esperada, que resulta en una mayor proporción de alelos hacia uno de los parentales, se denomina segregación distorsionada (Plomion y col., 1995). 2.4.2.- Establecimiento de los grupos de ligamiento Para asignar los marcadores a un grupo de ligamiento se utilizó LOD score, el cual se refiere a proporción de la probabilidad que dos marcadores estén ligados, asignándole un valor de recombinación sobre la probabilidad que estos marcadores no estén ligados (Segman y col., 2006). Esta proporción es llamada logaritmo de odds (LOD) o LOD score (Rish, 1992). Un LOD score de 3 entre dos marcadores indica que el ligamiento es 1000 veces más probable a que no estén ligados (Stam, 1993ª; Cheema y Dicks, 2009). La totalidad de los alelos fueron analizados con el software JoinMap versión 4, usando el tipo de población RILs. En el agrupamiento de los marcadores, los marcadores fueron asignados a grupos de ligamiento con valores LOD desde 2 a 10, con incrementos de uno en uno. Esto para detectar la estabilidad de los grupos, grado de unión de cada grupo y a su vez determinar si algún grupo es falso o flotante que en cierto modo confunde la real conformación de un grupo de ligamiento genético. 21 2.4.3.- Análisis de ligamiento y recombinación genética Para el análisis de ligamiento genético se utilizó una prueba estadística con objeto de aceptar o rechazar la hipótesis de ligamiento genético entre dos marcadores o loci. El criterio genético para ligamiento es la ausencia de segregación independiente. Como no es posible verificar presencia de ligamiento directamente porque no hay a priori una distancia de ligamiento precisa para usar en la hipótesis, por tanto, se prueba la hipótesis de ausencia de ligamiento. Si los resultados observados muestran rechazo de la hipótesis de no ligamiento entonces se infiere ligamiento entre los loci. Para este análisis se utilizó un valor P< 0,05 (Griffiths y col., 1996). La frecuencia de recombinación genética (r) se estimó de acuerdo a re-arreglos de los alelos observados por cromosomas y de los productos del crossover. Si los alelos parentales muestran segregación independiente, esto indica loci no ligados (r mayor o igual a 50%). Un valor r menor de 50% indica ligamiento genético. Debido a que no es posible medir la formación de quiasma observada entre genes individuales, la frecuencia de recombinación genética es una representación de la probabilidad de la ocurrencia de quiasma en un intervalo particular. La frecuencia de recombinación y la frecuencia de quiasma no se relacionan en forma linear, debido a interferencia o doble crossover. Para distancias menores a 15% de recombinación genética hay una probabilidad muy baja de doble crossover. Sin embargo, sobre este valor hay alta probabilidad que ocurra. Es por ello, que una función de mapeo es necesaria para linearizar la frecuencia de recombinación. Existen dos funciones de mapeo: Haldane (Haldane, 1919), la cual no asume crossover interferencia y la de Kosambi, desarrollada por D.D. Kosambi (1944), la cual asume crossover interferencia. 22 3.- RESULTADOS Y DISCUSIÓN 3.1.- Polimorfismo genético De un total de 105 marcadores polimórficos analizados en los parentales de la población de mapeo 86.7% amplificaron loci con patrones de segregación claros en la población RILs. De éstos, 70% corresponden a marcadores derivados de secuencias expresadas EST-SSR (Expressed Sequence Tags-Simple Sequence Repeat), 7% a marcadores genómicos SSR (Simple Sequence Repeat), 3% marcadores genómicos INDEL (Inserción o deleción de nucleótidos) y 20% marcadores SNP (Single Nucleotide Polymorphism). El tamaño de los fragmentos fluctuó en el rango de 120bp a 374bp, para una clara genotipificación con los marcadores polimórficos, cada locus incluyó los parentales e híbrido F1, seguido por los 215 individuos recombinantes F7, tal como se muestra en el ejemplo de la Fig. 2. Figura 2. Patrón de segregación del marcador EST-SSR Contig 02274 en la población RIL-F7. Flechas rojas señalan parental paterno (A15), flechas negras parental materno (A26) y flechas azules F1. 23 En la figura 2, se puede observar la presencia de una doble banda en los individuos homocigotos las cuales cosegregan, este fenómeno es frecuente en los marcadores microsatélites y recibe el nombre de bandas sombras o alelo tartamudo (Hite y col., 2003). Uno de los factores que contribuyen en la formación de estas bandas es la inestabilidad en la repetición de los nucleótidos durante la replicación del ADN, lo que conlleva a un cambio en el número de unidades que se repiten (microsatélites), obteniendo, un menor número de nucleótidos. Al amplificar mediante electroforesis estas secuencias en lugar de una banda aparecerán dos, una siempre de menor tamaño que la otra (Hite y col., 2003). La diversidad de marcadores moleculares utilizados para detectar polimorfismos genéticos, se debe a la necesidad de encontrar variabilidad molecular y aumentar la densidad de marcadores en los mapas de ligamiento genético. Esto debido a que los mapas son utilizados para identificar loci o genes que controlan características de importancia industrial y/o agronómica. A mayor densidad de mapa, mayor es la probabilidad de encontrar marcadores ligados a características de interés (Schneider, 2005). En esta investigación se ha detectado bajo grado de polimorfismo genético en Lupinus luteus, lo que coincide con Parra y col. (2010) y lo informado en la especie L. angustifolius (Annicchiarico y Carroni, 2009). En consecuencia se requerirá de mayor número de marcadores para detectar un mayor número de grupos de ligamiento genético y densidad de mapa para lograr detectar marcadores ligados a características de interés. La oportunidad de utilizar información de otros mapas de ligamientos en especies relacionadas depende del tipo de marcador. Los marcadores genómicos como los microsatélites son muy abundantes en el genoma, pero su transferibilidad a especies relacionadas es baja, debido a que los microsatélites o “repeticiones en tándem”, ocurren comúnmente en regiones no codificantes, donde hay bajo nivel de conservación de secuencias (Kim y col., 2008). Por el contrario, los marcadores EST-SSR al ser un producto de la transcripción de secuencias altamente conservadas, exhiben una alta tasa de transferibilidad a otras especies (Cato y col., 2001; Hisano y col., 2007, Iñiguez-Luy y col., 24 2008). Es por ello que este tipo de marcadores son útiles para mapeo comparativo y genómica comparativa entre especies (Segman y col., 2006). En esta investigación se ha desarrollado este tipo de marcadores para comparar el mapa de L. lutues con otras especies de lupino, donde existan mapas de ligamiento y poseen marcadores en común de alta tasa de transferibilidad. Idealmente, si un marcador está situado dentro de un gen responsable de una característica fenotípica, el marcador es muy útil para la selección asistida (Varshney y col., 2005b). Los marcadores moleculares SNP presentan la ventaja de encontrar polimorfismos por cambios en un sólo nucleótido dentro de la secuencia, a diferencia de un marcador microsatélite, el cual no permite identificar bandas del mismo tamaño en la descendencia (Thiel y col., 2003), por lo cual los marcadores SNP son más sensitivos y altamente reproducibles. Además, pueden ser transferidos entre genes ortólogos de secuencias conservadas (Fulton y col., 2002), lo que permitirá hacer mapeo comparativo con especies modelo, especies emparentadas. En estas últimas es de interés, pues permitiría la identificación de genes y/o QTL de importancia agronómica e industrial. Los marcadores SNP amplificados en este estudio presentaron un claro patrón de bandeo, permitiendo un buena genotipificación de la población, tal como se muestra en la Fig.3. 25 Figura 3. Patrón de segregación del marcador SNP 12870F en parte de la población RILF7. Flecha roja señala parental paterno (A15), flecha negra parental materno (A26) y flecha azul F1. El análisis de las frecuencias de los genotipos determinó la identificación de solo 2% de heterocigotos, mientras que un 53.6% correspondió al genotipo denominado “a” o genotipo paterno y un 44.3% al genotipo “b” o genotipo materno, siendo menor a un 1% el valor de los datos indeterminados “u”. Esto concuerda con las ventajas reportadas para el tipo de población utilizada, en la cual los individuos alcanzan altos niveles de homocigosis, debido al alto número de generaciones de autopolinización, lo cual le otorga la condición de inmortal (Semagn y col., 2006). Según Falconer y Mackay (2001), este tipo de población posee alta homocigosis y en la filial siete en la cual se basó este estudio, se esperaría un 98.44% de loci fijados y sólo un 1.56% de loci heterocigotos. Este tipo de población fue también utilizada en el desarrollo de mapas de ligamiento en otras especies de lupinos como L. albus y L. angustifolius, debido a que las sucesivas autopolinizaciones permiten un mayor nivel de recombinación, esto en combinación con poblaciones de gran tamaño, permiten estimar con mayor exactitud las distancias entre los marcadores y por tanto mayor exactitud en el largo del mapa (Semagn y col., 2006). En la Fig. 4, se representa en forma grafica el grado de recombinación genética del grupo de ligamiento 6. Las regiones genómicas provenientes de ambos padres en cada línea 26 recombinante para este grupo de ligamiento genético se muestra en los colores rojos 76.8% genoma materno y azul 83.7% genoma paterno, en los individuos con mayor porcentaje de genoma recuperado de toda la población. Figura 4. “Graphical genotype” del grupo de ligamiento genético 6 del mapa de ligamiento de L. luteus. Color rojo representa genoma materno A26, en azul genoma paterno A15 y en color verde los heterocigotos. Esta representación grafica evidencia segmentos de mapa de baja densidad de marcadores, al aumentar la densidad de marcadores mapeados, las proporciones de los genomas parentales presentarán variaciones. Un mapa con mayor saturación es necesario para la introgresión de genes y/o QTL a través de MAS (Marker Asissted Selection) para programas de mejoramiento genético, en los cuales se puede utilizar “graphical genotype”, como en este ejemplo, para asistir una introgresión desde un parental donante a un parental recurrente. 27 3.2.- Segregación genética de los loci El análisis de segregación de los loci a través de la prueba estadística X2, determinó que un 45% segregó en la proporción mendeliana esperada (1:1). Sin embargo, un 54.9% presentó segregación distorsionada para una p< 0.05, es decir, 50 loci presentaron una inclinación en la frecuencia de los genotipos hacia uno de los parentales. Los loci distorsionados fueron mapeados mayoritariamente en el primer grupo de ligamiento. El nivel de significancia para cada loci se identifica en el marcador correspondiente (Fig.8). La mayor presencia de estos loci en el mismo grupo de ligamiento genético, podría ser consecuencia de su grado de distorsión en la segregación de sus alelos, lo que dificulta la precisión de la estimación del ligamiento genético con otros loci. Esto se debería clarificar en la medida que se incorpore un mayor número de marcadores al mapa y sea factible remover posibles marcadores con alto grado de distorsión. También podría ser posible que este grupo de ligamiento presente una región genómica asociada a la distorsión en la segregación, debido a factores genéticos asociados a desequilibrio gamético o absorción no aleatoria de gametos femeninos o masculinos y/o por razones biológicas como rearreglos estructurales dentro de los cromosomas (Lefebvre y col., 1995; Segman y col., 2006; Hackett y Broadfoot, 2003). También podría deberse a errores en la clasificación alélica de los loci (Plomion y col., 1995) y selección en contra de un alelo en particular de uno de los parentales durante la propagación de la población de mapeo. En este caso, la clasificación alélica de los loci fue doblemente analizada, por lo que este factor fue descartado. La segregación distorsionada ha sido reportada en el desarrollo de mapas de ligamientos en lupino de hoja angosta, Lupinus angustifolius (9%) (Boersma y col., 2005), soya Glycine max (6.4%) (Yamanaka y col., 2001), raps Brassica oleracea (49%) (Iñiguez y col., 2009) y Cicer arietinum (20.4%) (Flandez-Galvez y col., 2003). Al analizar los 53 loci distorsionados, se encontró que 42 marcadores presentaron inclinación alélica hacia el parental A15, el cual se caracteriza por ser precoz y sólo 11 loci 28 presentaban mayor frecuencia alélica del parental materno A26, el cual es tardío. Debido a que la población RILs está siendo caracterizada en distintos parámetros agronómicos, nutricionales e industriales para realizar análisis de QTLs, se tomó la información de precocidad para corroborar preliminarmente si esta desviación alélica hacia el parental de mayor precocidad se relaciona con la información de campo. De un total de 200 individuos evaluados en campo, el 50% presentaron la característica de precoz, un 36% fueron clasificados como tardíos y un 14% presentaron la condición intermedia. Lo cual muestra una tendencia fenotípica hacia el parental precoz, tal como ocurre con la segregación alélica, aunque no en la misma proporción que presenta la inclinación de los marcadores distorsionados. En la fig. 5, se muestra un histograma de distribución de frecuencia para el carácter de precocidad. Claramente se aprecia que el carácter presentó una distribución binomial, observándose con una alta proporción de líneas recombinantes con una precocidad de 75-78 días desde siembra a floración. En consecuencia este podría ser uno de los caracteres asociados a la segregación distorsionada de algunos marcadores. 100 Fre cuencia 80 60 40 20 0 72 75 78 81 84 87 90 93 96 Número de días Figura 5. Histograma de frecuencia y línea de tendencia para la variación del carácter de precocidad en la población RIL F7 de L. luteus. 29 Esto se explicaría debido a presión de selección durante el desarrollo de la población, hacia las semillas de líneas de floración temprana, las cuales presentaban mayor fertilidad que las provenientes del parental tardío. Sin embargo, para corroborarlo es necesario aumentar el número de loci mapeados y a la vez identificar factores genéticos asociados al tiempo de floración en aquellas regiones genómicas en donde se localiza la distorsión. Sin embargo, las primeras medidas incorporadas por efecto del grado de distorsión han sido: utilizar altos valores LOD como parámetro de agrupamiento, con lo cual se aumenta la exigencia estadística que permite a un loci permanecer en un grupo de ligamiento determinado y como trabajo paralelo se realiza la comparación de las secuencias de los marcadores expresados con especies modelo como Medicago truncatula, en el caso de ser similares transferir marcadores o diseñar nuevos partidores, de tal forma de observar el orden y la localización de estos. Estudios realizados en la especie L. albus han reportado que la distribución fenotípica para el carácter de precocidad fue continua lo que sugiere una herencia cuantitativa (Phan y col., 2007), lo que no concuerda con nuestro resultados que sugieren una distribución discreta y por tanto herencia simple. Sin embargo, este resultado podría estar afectado por la segregación distorsionada, por la mayor proporción de individuos de mayor precocidad al momento de la formación de la población RIL. 3.3.- Identificación de grupos de ligamiento genético La construcción de los grupos de ligamiento se realizó de manera secuencial, utilizando crecientes valores de LOD de manera de eliminar resultados de ligamientos del tipo falso-positivo, que pudieran ser causados por efecto de la segregación distorsionada. Para evitar esto, se comenzó el análisis con un valor mínimo LOD de 3 para terminar en LOD score 10. 30 Con LOD 3 se obtuvo un grupo de ligamiento genético y seis loci no ligados. Cuando se ejecutó el análisis con LOD 4, se identificó el mismo grupo de ligamiento, pero un mayor número de loci no fue agrupado en ningún grupo de ligamiento. Esta representación no real podría deberse principalmente a dos factores: en primer lugar como un efecto del alto grado de segregación distorsionada y en segundo lugar a que con el número de marcadores utilizados no es posible identificar un suficiente número de loci ligados a lo largo del genoma de L. luteus, que posiblemente presenten una posición genética muy distante de los loci actualmente mapeados. Es por ello, que el análisis de ligamiento tiende a detectar ligamiento haciendo los mejores ajustes probabilísticos, resultando distancias genéticas entre loci poco coherentes. Es esperable que al utilizar un mayor número de marcadores se logre ligar los loci actualmente mapeados a aquellos más distantes lo cual generará una mejor identificación y saturación de los grupos de ligamiento genético. Según Semagn y col., (2006), al utilizar bajos valores de LOD se tienden a crear pocos grupos de ligamiento con un gran número de marcadores por grupo. Al aumentar en un punto el parámetro de agrupamiento, algunos de los grupos de ligamiento generados alcanzaban distancias genéticas superiores a 1000 cM, lo cual es biológicamente inconsistente. Por tanto, fue necesario identificar los loci que causaban esta inestabilidad y excluirlos del análisis, por lo que ocho loci fueron excluidos. Al remover estos loci y evaluar la matriz de datos con un valor LOD 5, se identificaron 12 grupos de ligamiento, los cuales incluyeron 69 loci mapeados y 14 loci no agrupados, observándose una distancia promedio entre cada marcador de 16.7cM. Los dos primeros grupos poseen el mayor número de marcadores LG1 (18) y LG (23) con un largo de 588.3 cM y 362.5 cM, respectivamente. Los otros diez grupos de ligamiento genético son pequeños, formados por dos a cuatro marcadores. Estos grupos de ligamiento presentaron un largo que fluctuó desde 0.7 cM (LG11) a 37,9 cM (LG6). El total de grupos de ligamientos extendió un largo de mapa de 1152.3 cM (Figura 6). 31 Figura 6. Mapa preliminar de L. luteus utilizando un valor LOD 5. Niveles de significancias de la segregación distorsionada: *:0.05 **:0.01 ***:0.005. Al aumentar el valor LOD a 6, con la idea de confirmar la consistencia de los grupos de ligamiento genético y detectar loci con débil ligamiento genético, se identificaron 14 grupos de ligamiento (Figura 7). El mapa incluyó 64 loci mapeados y 19 loci no agrupados. El promedio de distancia entre los marcadores fue de 10.8cM, los grupos que presentaron el mayor largo fueron LG1 con 216 cM y el LG5 con 221.7 cM, los otros 11 grupos de ligamiento fluctuaron entre 0.7 cM (LG13) y 37.9 cM (LG8), exceptuando el LG4 el cual presentó un largo de 82.2 cM. En el primer grupo de ligamiento fueron mapeados 19 loci y en los otros 11 grupos de ligamiento fueron formados por dos a cuatro marcadores, exceptuando el LG4, el cual contiene ocho loci y LG5 con 7 loci mapeados. El largo del mapa alcanzado fue de 691.9 cM. 32 Figura 7. Mapa de ligamiento genético obtenido utilizando un valor LOD6. Niveles de significancias de la segregación distorsionada: *:0.05 **:0.01 ***:0.005. Utilizando un valor LOD 7, se identificaron 17 grupos de ligamiento con 64 loci mapeados (Figura 8). De estos grupos, el grupo con mayor número de loci fue el LG1 con 14 loci mapeados y un largo de 73.9 cM. Los demás grupos de ligamiento fluctuaron desde 0.7 cM (LG16) a 82.2 cM (LG6), siendo este último el más largo. El promedio de distancia entre cada marcador fue de 7.1cM. El número de marcadores en los grupos de ligamiento fluctuó desde 2 a 14, dejando sin agrupar 19 marcadores. La extensión de este mapa de ligamiento fue de 454.6 cM. 33 Figura 8. Mapa preliminar de ligamiento genético en Lupinus luteus, utilizando un LOD 7 como parámetro de agrupamiento. Se indican niveles de significancias de la segregación distorsionada: *:0.05 **:0.01 ***:0.005. En rojo se señalan asociaciones estadísticas 34 encontradas entre genes y loci mapeados a través de mapeo asociativo y secuenciación del genoma. El significado de las abreviaturas en color rojo son: Alc: Alcaloides (3), Suc: Sucrosa (2) y Hex: Hexosa (1). Se desprende que a mayor valor LOD se obtiene un mayor número de grupos de ligamiento y las asociaciones falso-positivas tienden a disminuir, dado que los loci con menor grado de ligamiento genético, por poseer mayor recombinación genética entre ellos son separados. Esto concuerda con lo reportado por (Semagn y col., 2006), donde altos valores de LOD resultaron en más grupos de ligamiento o grupos fragmentados, pero con menor número de marcadores en cada grupo. Se puede observar que el primer y segundo grupo de ligamiento genético obtenido al utilizar un LOD5, son los que producen la mayor cantidad de cambios al aumentar la astringencia estadística y que la separación de los grupos de ligamientos ocurre en los espacios donde no hay aún loci mapeados. Estos intervalos de mapa con mayor distancia puede deberse a la baja densidad de marcadores mapeados, lo que si bien liga a los marcadores presentes, pero con baja robustez, lo que facilita la separación con aumentando el valor LOD. Sin embargo, con mayor densidad de mapa, estos marcadores pudieran mantenerse en el mimo grupo de ligamiento o separase en otros. Al comparar los mapas obtenidos, se puede ver como al aumentar el nivel de exigencia de probabilidad de ligamiento genético, el grupo de ligamiento uno se mantiene con la mayoría de los marcadores, sólo separa los marcadores de posiciones extremas en dos pequeños grupos LG3 y LG2. Al aumentar de nivel a LOD 7, este vuelve a separarse en dos grupos nuevos LG2 y LG3 (Figura 9). Solo uno de los grupos de ligamiento LG5, identificado con LOD5, formado por dos marcadores no fue agrupado dentro de los grupos formados al aumentar la exigencia a LOD 6, quedando dentro de los marcadores no agrupados. 35 Figura 9. Reordenamiento del primer grupo de ligamiento genético, utilizando valores LOD de 5 a 7. El grupo de ligamiento 2 con un largo de 588 cM, se separó en dos grupos de ligamiento, LG4 y LG5 al aumentar la exigencia a LOD6 (Figura 10), de estos en el siguiente nivel de exigencia LOD7, LG4 se mantuvo, sin embargo LG5 se quebró en dos nuevos grupos LG7 y LG8. Se destaca al comparar estos dos mapas (LOD5 y LOD6) que los restantes nueve grupos de ligamiento, mantienen los mismos marcadores en cada grupo y sólo se aprecia inversión en el orden de los loci. Sin embargo, once de los grupos de ligamiento producidos con LOD6 fueron mantenidos al aumentar a LOD7. Solo uno de los grupos de ligamiento LG5 identificado con al utilizar LOD6, fue separado en dos al aumentar la exigencia a LOD7 (Figura 11). 36 Figura 10. Reordenamiento del segundo grupo de ligamiento genético, en los diferentes niveles LOD utilizados. Aún cuando el largo de los mapas de ligamiento fue disminuyendo a medida que aumentaba el nivel de exigencia para mantener el ligamiento entre los loci, el largo del mapa de ligamiento representado al utilizar un valor LOD7 (454.6cM), puede ser más correcto que el largo del mapa con LOD5 (1152.3 cM), ya que la posibilidad que todos los marcadores utilizados se ubiquen sobre los mismo grupos de ligamiento es baja, debido al alto número de cromosomas de la especie n:26 (Naganowska y col., 2003). Por tanto, es probable que los marcadores que no fueron agrupados en este análisis, al aumentar el número de marcadores tomen ubicación en nuevos grupos de ligamientos aún no identificados. 37 Figura 11. Reordenamiento del grupo de ligamiento cinco, utilizando LOD6 y LOD7 como parámetro de agrupamiento. El número de grupos de ligamiento identificados y marcadores agrupados en los mismos, no sufrieron modificaciones al utilizar LOD scores mayores a 7, lo que señala una estabilización en las relaciones de ligamiento con los marcadores utilizados en este estudio. Por este motivo, se infirió que en este primer análisis de ligamiento genético preliminar, este número de grupos de ligamiento podría ser el más probable. Por lo tanto, en respuesta al objetivo principal de la investigación se han identificado 17 grupos de ligamiento genético en la especie L. luteus, de un total de 26 que presenta la especie, cubriendo un largo de mapa de 454.65 cM. Este mapa preliminar continúa bajo análisis con mayor número de marcadores hasta cubrir su totalidad de grupos de ligamiento genético. Estudios reportados para especies relacionadas han alcanzado coberturas de mapa superiores a los 2361.8cM para L. angustifolius (Nelson y col., 2010) y en el caso de L. albus 2951cM (Phan y col., 2007), en estos mapas el número de grupos de ligamiento concuerda con el número de cromosomas como es lo esperado. En consecuencia, en L. 38 luteus se debiera cubrir un total de 26 grupos de ligamiento, por lo que nos faltan al menos 9 grupos de ligamiento, lo que en términos de cobertura de genoma aún es muy preliminar para cuantificar. Por otro lado, de forma similar en las especies L. luteus y en L. angustifolius se han reportado bajos niveles de polimorfismo genético un problema en el desarrollo de mapas de ligamiento genético (Parra y col., 2010; Annicchiarico y Carroni, 2009), lo que hace necesario un mayor número de marcadores moleculares para cubrir el genoma, de este modo en la especie L. angustifolius fueron necesarios 1080 loci mapeados para alcanzar alto grado de saturación de mapa (Nelson y col., 2010). Esto hace necesario el desarrollo y posterior mapeo de un gran número de marcadores para saturar el genoma de L. luteus. Resultados preliminares en estudios de mapeo asociativo, han encontrado seis de los marcadores moleculares mapeados, altamente asociados a genes de interés, los que se encuentran destacados en la Fig.8. Tres marcadores asociados al contenido de alcaloides (Alc.), dos de estos marcadores se encuentran ligados en LG2 y uno en LG6, otros tres marcadores asociados al contenido de alfagalactósidos, dos a sucrosa (Suc.), ubicados en LG6 y LG16 y uno para hexosa (Hex.), ubicado en LG8. Los caracteres nutricionales fueron medidos desde tejido de la tercera y cuarta hoja de plántulas de lupino para realizar la asociación (Ivan Maureíra, Comunicación personal). Será interesante ver si estos marcadores que presentan alta asociación a caracteres en esta población biparental, mantendrán esta asociación en una población de mapeo asociativo. Estos resultados preliminares son parte de un proyecto FONDECYT que se desarrolla en forma paralela a esta investigación. 39 4.- CONCLUSIONES Utilizando 91 marcadores moleculares se han identificado en forma preliminar 17 grupos de ligamiento genético en L. luteus, de un total teórico de 26 que posee la especie. Estos grupos de ligamiento serán confirmados con el uso de un mayor número de marcadores que están en proceso de desarrollo y mapeo. Los grupos de ligamiento determinados expandieron 454.6 cM, esta cobertura que puede presentar variaciones al utilizar un mayor número de marcadores. Las causas de la segregación distorsionada y el efecto que tienen en la construcción de este mapa, serán analizadas en la medida que se incorporen nuevos marcadores y estos puedan ser excluidos del mapa. 40 5.- BIBLIOGRAFÍA Agrama HA, Moussa ME (1996) Mapping QTLs in breeding for drought tolerance in maize (Zea mays L.). Euphytica 91(1):89-97 Annicchiarico P, Carroni AM (2009) Diversity of white and narrow leafed lupin genotype adaptive response across climatically contrasting Italian environments and implications for selection. Euphytica 166:71–81 Amiard V (2010) Comunicación personal. www.cgna.cl Aravena AG (2009) Caracterización molecular y fenotípica de Ipk2, un gen intermediario importante en la síntesis de ácido fítico, en Lupinus luteus. Tesis Bioingeniería. Facultad de Ciencias Biológicas, Universidad de Concepción, Concepción Aravena CJ (2009) Oligosacáridos de la familia de la rafinosa (RFOs) en el desarrollo y maduración de semillas de lupino. Tesis Bioingeniería. Facultad de Ciencias Biológicas, Universidad de Concepción, Concepción Atkins CA, Smith PMC, Gupta S, Jones MGK, Caligari PDS (1998) Genetics, cytology and biotechnology. In: Gladstones, J.S., Atkins, C.A. y Hamblin, J. (eds): Lupins as crop plants: biology, production and utilization. CAB International, London, pp 67–92 Babu R, Nair SK, Prasanna BM, Gupta HS (2004) Interpreting markers assisted selection in crop breeding. Prospect and challenges. Curr Sci 87:607-619 41 Barlow P (1981) RBG Kew angiosperm DNA C-values database. http://www.rbgkew.org.uk/cvalues/html/cvalOrigReference. html#346 Bennett MD, Leitch IJ (2005) Nuclear DNA amounts in angiosperms: progress, problems and prospects. Ann Bot 95:45–90 Bennett MD, Smith JB (1976) Nuclear DNA amounts in angiosperms. Philos Trans R Soc Lond B Biol Sci 274:227–274 Boerma H,Walker D (2006) Discovery and utilization of QTLs for insect resistance in soybean. Georgia Genetics review III 3:181-189 Boersman JG, Pallota M, Buirchell BJ, Sivasithanparam K, Yang H (2005) Construction of a genetic linkage map using MFLP and identification of molecular markers linked to domestication genes in narrow leafed lupin (Lupinus angustifolius L.). Cellular and Molecular Biology letters 10: 331-344 Boersma JG, Li C, Lesniewska K, Sivasithamparam K, Yang H (2008) Identification of quantitative trait loci (QTLs) influencing early vigour, height, flowering date, and seed size and their implications for breeding of narrow leafed lupin (Lupinus angustifolius L.). Aust J Agric Res 59:527–535 Boersma JG, Nelson M, Sivasithamparam K, Yang H (2009) Development of sequencespecific PCR markers linked to the Tardus gene that reduces pod shattering in narrow leafed lupin (Lupinus angustifolius L.). Mol Breed 23:259–267 Brien SJ, Cowling WA, Potter RH, Jones RA, Jones MG (1999) A molecular marker for early maturity (Ku) and marker-assisted breeding of Lupinus angustifolius. In: van Santen E, Wink M, Weissmann S, Romer P (eds). Lupin, an ancient crop for the 42 new millennium. Proceedings of the 9th international lupin conference, 20-24 june of 1999. Klink/Muritz, Germany, pp 115-117 Buirchel BJ, Personal communication. In: Wolko B, Clements J, Naganowska B, Nelson M, Yang H (2011) Lupinus. Cap,9. (ed.), Wild Crop Relatives: Genomic and Breeding Resources, Legume crops and Forages Cato S, Gardner R, Kent J, Richardson T (2001) A rapid PCR based method for genetically mapping ESTs. Theor Appl Genet 102: 296–306 Cheema J, Dicks J (2009) Computacional approaches and software tools for genetic linkage map estimation in plants. Briefings in bioinformatics 10(6):595-608 Croxford AE, Rogers T, Caligari PDS, Wilkinson MJ (2008) High-resolution melt analysis to identify and map sequence-tagged site anchor points onto linkage maps: a white lupin (Lupinus albus) map as an exemplar. New Phytol 180:594–607 Doyle JJ, Doyle JL (1987) A rapid isolation procedure for small quantities of fresh leaf tissue. Phytochemical Bulletin 19:11-15 Eujayl I, Sledge MK, Wang L, May GD, Chekhovskiy K, Zwonitzer JC, Mian MA (2004)Medicago truncatula EST-SSR reveal cross species genetic markers for Medicago spp. Theor Appl Genet 108:414-422 Falconer DS, Mackay TFC (2005) introducción a la Genética cuantitativa, 4ta edn. Ed, ACRIBIA, S.A. Zaragoza, España. Ferreira A, Da Silva MF, Da Costa e Silva L, Cruz CD (2006) Estimating the effects of population size and tipe on the accuracy of genetic maps. Genetic and Molecular Biology 29:182-192 43 Flandez-Galvez H, Ford R, Pang ECK, Taylor PWJ (2003) An intraspecific linkage map of the chickpea (Cicer arietinum L.) genome based on sequence tagged microsatellite site and resistance gene analog markers, Theor Appl Genet 106, 1447–1456. Fulton TM, Van der Hoeven R, Eannetta NT, Tanksley SD (2002) Identification, analysis, and utilization of conserved ortholog set markers for comparative genomics in higher plants. Plant Cell 14: 1457-467. Gladstones JS, (1998) Distribution, origin, taxonomy, history and importance. In: Gladstones JS, Atkins C, Hamblin J (eds): Lupins as crop plants. Biology: production and utilization. CABI, Oxon, pp 1–39 Glencross BD, Carter CG, Duijster N, Evans DR, Dods K, McCafferty P, Hawkins W (2004) A comparison of the digestibility of a range of lupin and soybean proteins products when fed to either Atlantic salmon (Salmo salar) or rainbow trout (Oncorhynchus mykiss). Aquaculture (Amsterdam, Netherlands) 237:333-346 González J (2008) Challenges of the salmon feed industry: Is it about the development of an omnivorous fish?. In “utilization of novel and sustainable plant products in aqua feeds”. Plants genomics, bioinformatics, fish nutrition and bioprocesses. 1st INTERNATIONAL CGNA Workshop. Centro de génomica Nutricional Agroacúicola. Temuco, Chile. 4-5-6 Agosto de 2008 Grattapaglia D, Ferreira M (1996) Introducción al uso de marcadores moleculares en análisis genético. 2ª edn. Embrapa, Brasilia D. F., Brasil. 219 p Griffints AJF, Wesler SR, Lewontin RC, Carroll SB (2008) Genética. Introduction to Genetic Analysis. MGraw-Hill Interamericana. 9th edition. Cap. Linkage Mapping in plants 44 Hackett CA, Broadfoot LB (2003) Effects of genotyping errors, missing values and segregation distortion in molecular marker data on the construction of linkage maps. Heredity 90:33-38 Hajdera I, Siwinska D, Hasterok R, Maluszynska J (2003) Molecular cytogenetic analysis of genome structure in Lupinus angustifolius and Lupinus cosentinii. Theor Appl Genet 107(6):988–996 Haldane JBS (1919) The combination of linkage values and the calculation of distances between the loci of linked factors. Genetic. 8:299-309 Hisano H, Sato S, Isobe S, Sasamoto S, Wada T, Matsuno A, Fujishiro T, Yamada M, Nakayama S, Nakamura Y, Watanabe S, Harada K, Tabata S (2007) Characterization of the soybean genome using EST-derived microsatellite markers. DNA Research, vol. 14, no. 6, p. 271-281 Hite JM, Eckert KA, Cheng KC (1996) Factors affecting ®delity of DNA synthesis during PCR ampli®cation of d(C-A)n d(G-T)n microsatellite repeats. Nucleic Acids Res 24, 2429±2434. Iñiguez FI, Lukens L, Farnham M, Amasino R, Osborn T (2009) Development of public inmortal mapping populations, molecular markers and linkage maps for rapid cycling Brassica rapa and Brassica oleracea. Theor Appl Genet 120:31-43 Iñiguez-Luy FL, Voort AV, Osborn TC (2008) Development of a set of public SSR markers derived from genomic sequence of a rapid cycling Brassica oleracea L. genotype. Theoretical and Applied Genetics, vol. 117, no. 6, p. 977-985 45 Kim KS, Ratcliffe ST, French BW, Liu L, Sappington TW (2008) Utility of EST-derived SSRs as population genetic markers in a beetle. Journal of Heredity, vol. 99, no. 2, p. 112-124 Kosambi DD (1944) The estimation of map distance from recombination values. Ann. Eugen 2:172-175 Kearsey MJ, Pooni HS (1996) The Genetical Analysis of Quantitative Traits. Chapman Hall. 381p. Lefebvre V, Palloix A, Caranta C, Pochard E (1995) Construction of an intraspecific integrated linkage map of pepper using molecular markers and doubled-haploid progenies. Genome 38:112-121 Mian M, Saha MC, Hopkins AA, Wang ZY (2005) Useful fescue EST-SSR markers in phylogenetic analysis of cool-season forage grasses. Genome 48:637-647 Mohan M, Nair S, Bhagwat A, Krishna TG, Yano M (1997) Genome mapping, molecular markers and marker assisted selection in crop plants. Molecular Breeding 3:87-103 Mora P, Parra L, Maureíra I, Salvo-G H (2008) Development of L. luteus genetic linkage map: Gene and QTL discovered for agronomic and nutritional traits related to feed and food quality. 1st INTERNATIONAL CGNA Workshop. Utilization of novel and sustainable plant products in aqua feeds¨. Plants genomics, bioinformatics, fish nutrition and bioprocesses. Centro de génomica Nutricional Agroacúicola. Temuco, Chile. 4-5-6 Agosto de 2008 Mora, P. 2008. Análisis de diversidad genética en Lupinus luteus. Tesis Ingeniero Agrónomo. Temuco. Universidad Católica de Temuco, Escuela de Agronomía. 14p. 46 Naganowska, B., Wolko, B., Sliwinska, E., y Laczmarek, Z. 2003. Nuclear DNA content variation and species relationships in the genus Lupinus (Fabaceae). Annals of Botany 92:349-355. Nelson M, Boerma J, Chudy M, Lesniewsk K, Ellwood S, Phan H, Moolhuijzen P, Bellgard M, Oliver R, Swiecicki W, Wolko B, Cowling W (2008)A dense reference map of the Lupinus angustifolius L. genome: a foundation for building lupin genome research. In: Palta JA, Berger JB (eds) 2008 Lupins for health and wealth. Proceeding of the 12th International Lupin Conferences, 14-18 Septiembre de 2008, Fremantle, Western Australia. International Lupin Association, Canterbury, New Zealand. Nelson MN, Phan HT, Ellwood SR, Moolhuijzen PN, Hane J, Wiliams A, O`lone CE, Nyarko JF, Scobie M, Cakir M, Jones M, Bellgard M, ksiazkiewcz M, Wolko B, Barker S, Oliver R, Cowling WA (2006)The first gene-based map of Lupinus angustifolius L. location of domestication genes and conserved synteny with Medicago truncatula. Theor Appl Genet 113:225-238 Obermayer R, Swiecicki WK, Greilhuber J (1999) Flow cytometric determination of genome size in some Old World Lupinus species (Fabaceae). Plant Biol 1:403–407 Parra L, Straub S, Doyle J, Mora-O P, Salvo-G H, Maureíra I (2010) Development of microsatellite markers in Lupinus luteus (Fabaceae) and cross-species amplification in other lupine species. American Journal of Botany: e72-e74. Phan HT, Ellwood SR, Adhikari K, Nelson M, Oliver R, (2007) The first genetic and comparative map of White Lupin (Lupinus albus L.): Identification of QTLs for Anthracnose resistance and flowering time and a locus for Alkaloid Content. DNA research 14:59-70 47 Paterson, A.H. 1996. Making genetic maps. In: Paterson A.H. (ed.) Genome mapping in plants, San Diego, California: Academics Press, Austin, Texas, pp: 23-29. Phillips W, Rodríguez H, Fritz P (1995) Marcadores de ADN: Teoría, aplicaciones y protocolos de trabajo con ejemplos de investigaciones en cacao (Theobroma cacao). Serie técnica. Informe técnico #252. CATIE. Turrialba, Costa Rica. 183 p. Poncet V, Rondeau M, Tranchant C, Cayrel A, Hamon S, De Kochko A, Hamon P (2006) SSR mining in coffee tree EST databases : Potential use of EST-SSRs as markers for the Coffea genus. Molecular genetics and genomics 276:436-449 Plomion C, O`Malley DM, Durel CE (1995) Genomic analysis in maritime pine (Pines pinaster): comparación of two RAPD maps using selfed and open-pollinated seeds of the same individual. Theor Appl Genet 90:1028-1034 Risch N (1992) Genetic linkage: interpreting LOD score. Science 255:803-804 Ribaut, J.M. y Hoisington. 1998. Marker assisted selection: New tools and strategies. Trens Plant Sci. 3:236-239. Salvo-G H, Laurie D, Jaffe B, Snape J (2001) An RFLP map of diploid Hordeum bulbosum L. and comparison with maps of barley (H. vulgare L.) and wheat (Triticum aestivum L.). Theor Appl Genet 103:869-880 Salvo-Garrido H (2009) Investigación en recursos genéticos para la generación de materias primas vegetales para la industria de alimentos. VII Simposio de Recursos Genéticos para América Latina y el Caribe. SIRGEALC, Chile. Proceeding, Tomo 1 Semagn K, Bjornstad A, Ndjiondjop MN (2006) Principles, requirements and prospects of genetic mapping in plants. African Journal of Biotechnology 5(25):2569-2587 48 Stam P (1993) Construction of integrated genetic linkage mass means of a new computer package: JoinMap. The plant journal 3(5):739-744 Schneider K (2005) The Handbook of Plant Genome Mapping. In: Meksem K, Kahl G (eds) Genetic and Physical Mapping. Copyright © 2005 WILEY-VCH Verlag GmbH & Co. KGaA, Weinheim ISBN 3-527-31116-5 Thiel T, Michalek W, Varshney RK, Graner A (2003) Exploiting EST databases for the development and characterization of gene-derived SSR-markers in barley (Hordeum vulgare L.).Theoretical and Applied Genetics vol. 106, no. 3, p. 411-422 Tixier MH, Sourdille P, Roder M, Leory P, Bernald M, (1997) Detection of wheat microsatellietes using a non radioactive silver-nitrate staining method. J. Genet. Breed 51:175-177 Toledo MI, Von Baer E, Olivarez G, Soto P, Manriquez A,Harrison G, Mex D, Garrido F (2004) Lupino dulce, leguminosa en la producción de alimentos para salmónidos. Fundación para la Innovación Agraria. Van Ooijen JW, (2006) JoinMap ® 4, software of the calculation of genetics linkage maps in experimental populations. Kyazma, B.V., Wageningen., Netherlands. Varshney RK, Sigmund R, Börner A, Korzun V, Stein N, Sorrells ME, Langridge P, Graner A (2005)a. Interspecific transferability and comparative mapping of barley EST-SSR markers in wheat, rye and rice. Plant Science 168:195-202 Varshney RK, Graner A, Sorrells ME (2005)b Genic microsatellite in plants: features and applications. Trends in Biotechnology 23:48-55 49 Wang J, Wan X, Crossa J, Crouch J, Weng J, Zhai H, Wan J (2006) QTL mapping of grain length in rice (Oryza sativa L.) using chromosome segment substitution lines. Genet Res Camb 88:93–104 Wendel JF (2000) Genome evolution in polyploids. Plant Molecular Biology 42:225–249. Wolko B, Clements J, Naganowska B, Nelson M, Yang H (2011) Lupinus. Cap,9. (ed.), Wild Crop Relatives: Genomic and Breeding Resources, Legume crops and Forages. Yamanaka N, Ninomiya S, Hoshi M, Tsubokura Y, Yano M, Nagamura Y, Sasaki T, Harada K (2001)An informative linkage map of soybean reveals QTLs for flowering time, leaflet morphology and regions of segration distortion. DNA Research 8:61-72 Yang H, Boersma JG, You M, Buirchell BJ, Sweetingham MW (2004) Development and implementation of a sequence-specific PCR marker linked to a gene conferring resistance to anthracnose disease in narrow-leafed lupin (Lupinus angustifolius L.). Mol Breed 14:145–151