La genómica y sus aplicaciones Orígenes de la Genética La Genética, que es una rama del conocimiento muy joven, sus comienzos empíricos datan de hace unos 7000 años cuando se inció la domesticación de las plantas, se podria decir que realmente empezo cuando Gregor Mendel (nacido el 22 de julio de 1822 en Heinzendford, Austria), un modesto fraile agustino, presenta en 1865 su trabajo de investigación a la Sociedad de Historia Natural de Brün, con el título de "Hibridos en plantas". Primera Ley de Mendel Las Unidades Hereditarias (genes) se dan por pares (alelos) en los individuos. Los alelos segregan (se separan) para formar gametos. Algunos alelos ocultan el efecto de otros (dominan) La Doble Hélice Rosalin Franklin en 1953, obtuvo datos precisos de difracción de Rayos X de ADN y sugirió que la estrucctura del ADN era algún tipo de hélice En 1953, Watson (izquierda) y Francis Crick (derecha) describieron la estructura en doble hélice de la molécula de ADN. En 1962 Watson y Crick recibieron el Premio Nobel de Medicina por su trabajo. “Deseamos sugerir una estructura para el ácido desoxirribonucleico (ADN). Esta estructura tiene características novedosas que son de considerable interés desde el punto de vista biológico”. Genoma Cromosomas Célula Los genes contienen las instrucciones para fabricar proteínas Proteínas Las proteínas llevan a cabo la mayoría de las funciones de un ser vivo ¿Qué es el genoma? • El genoma es el conjunto de información hereditaria que define y determina como funcionan cada organismos viviente. • Conjunto de todos los genes de un organismo. • El depósito de ésta información es el Ácido Desoxiribonucleico o ADN. • El genoma esta organizado en cromosomas. El genoma contiene toda la información de cómo funciona un organismo AGCTAGCTGATTTCGTACCTTCCGATCGGATCGATTTGATCAAAGTCTGGC CGCGCTAGCGCTTAATATAGGCTAGTCGTAGGATCGTTGCTAGCTAGCTGG AGCTAGCTGATTTCGTACCTTCCGATCGGATCGATTTGATCAAAGTCTGGC CGCGCTAGCGCTTAATATAGGCTAGTCGTAGGATCGTTGCTAGCTAGCTGG AGCTAGCTGATTTCGTACCTTCCGATCGGATCGATTTGATCAAAGTCTGGC CGCGCTAGCGCTTAATATAGGCTAGTCGTAGGATCGTTGCTAGCTAGCTGG AGCTAGCTGATTTCGTACCTTCCGATCGGATCGATTTGATCAAAGTCTGGC CGCGCTAGCGCTTAATATAGGCTAGTCGTAGGATCGTTGCTAGCTAGCTGG AGCTAGCTGATTTCGTACCTTCCGATCGGATCGATTTGATCAAAGTCTGGC CGCGCTAGCGCTTAATATAGGCTAGTCGTAGGATCGTTGCTAGCTAGCTGG GCTAGCTAGCTGGGCTAGCTAGCTGGTT La genómica se dedica a identificar los genes presentes en los cromosomas y determinar cual es su función El genoma es como una receta de cocina que contiene las instrucciones de cómo funciona un organismo TGGGTATTGATCGTCAGTCAGTCGTCATGAATGAGAGATCG GAGCCTACTTGIncubar los frijoles en agua durante al menos una nocheTTTGACTAGTCAATGG Tirar el agua AGCCCTGATGCTACocer los frijoles en olla express con ajo, cebolla, chile picado y sal hasta que se ablanden GCTAGCCATG Machacar mientras se fríen lentamente con aceiteGGCTAGTCGTAGGATCGTTGCTAGCTATAGCT GGGCTAGCTAGCTGGGTATTGATCGTCAGTCAGTCGTACC La genómica descifra esas instrucciones Organismo Tamaño del genoma Número de genes estimado Maíz 2000-2500 millones 50,000 Humano 3000 millones 30,000 Ratón 2600 millones 30,000 Fríjol 637 millones 40,000 Arabidopsis 120 millones 28,000 Mosca de la fruta 137 millones 13,000 Levadura 12 millones 6,000 Bacteria (E.coli) 4.6 millones 3200 En 1977 Federick Sanger Publica su Técnica de Secuenciación de ADN 3´ DNA Templado 5´ 3´ PRIMER 5´ 3´ ddNTP´s + dNTP´s + DNAPolimerasa 5´ 3´ SINTESIS DE LA CADENA COMPLEMENTARIA Sanger, capitalizó la habilidad de las polimerasas para incorporar desoxinucleótidos, así como didesoxinucleótidos a la cadena en crecimiento. Frederick Sanger recibió el Premio Nobel de Química en 1958 y en 1980 5´ LECTURA ó DETERMINACIÓN DE LAS BASES MANUAL •Gel de Poliacrilamida •Radioisotopo S35 o P32 •Film de Rayos X •Lectura Manual AUTOMATIZADA Tecnologia del Capilar LI-CO 4300 SEMI-AUTOMATICA •Gel de Poliacrilamida •Químicos Fluorescentes •CCD cámara •Uso de software El MegaBACE 4000 de la empresa Amerhsam Phermacia procesa 384 muestras simultaneamente y genera 2.8 million de bases por día El ABI 3730xl de la marca Applied Biosystems realiza 40 (96 capilares) corridad por día y detecta 1 920 000 bases por día El ABI 377 Apliedd Biosystems Laser Sequencing Analysis CCD camara Data Collection Capilares Data Collection PROYECTO DEL GENOMA HUMANO (HGP) •Inicia oficialmente en junio de 1991 por el Instituto Nacional de Salud de U.S. •Es un proyecto comparado al apolo XI (Primer hombre en la luna) •Participan 6 países (U.S. Inglaterra, Francia, Canada, Alemania y Japón) •La Meta: Secuenciar 3.2 x 109 bases durante los próximos 15 años Equivale a leer durante 9.5 años en voz alta James Watson •En 1996 se funda el National Human Genoma Research Institute (NHGRI) con la intención de secuenciar, utilizando metodología de gran escala, el Genoma Humano •Involucra a las Universidades y Centros de Investigación más reconocidos de los Estados Unidos, como: Institute for Genomic Research, Rockville,MD Baylor College of Medicine, Houston,TX Whiteheat Institute for Biomedical Research, Cambridge, MA Stanford Universty, Stanford, CA University of Washington, Seattle, WA Washington University, St Louis, MO •Colabora el Instituto Sanger •Se dividen el trabajo por cromosomas •Utiliza sistemas Robotizados y Bioinformáticos más adelantados •La meta se piensa cumplir para el 2005 con una probabilidad de error de 0.01% por base Francis S. Collins PROYECTO DEL GENOMA HUMANO (HGP) En 1992 J. C. Venter funda The Institute for Genomic Research (TIGR) Y en 1998 funda Celera asociado con ABI •Dice que va a secuenciar el genoma humano en 3 años. •ABI proporciona un poco más de 300 secuenciadores de 96 capilares para este proyecto.Costo 200 millones de dólares •Se interesa principalmente en zonas codificantes del DNA. •El tamaño del genoma es de 3 000 millones de bases. •Solamente el 3% del genoma es codificante. •Son apróximadamente 80 000 genes potenciales. •Su intención es patentar genes. •Celera significa velocidad. John Craig Venter La Clave del Exito: las estrategias “shot gun” Velocidad de secuenciadores ==> reducción de costos Poder computacional Una vez identificada la utilidad de un gen, se puede patentar La utilidad de los genes de la enorme cantidad de Microorganismos, animales y plantas nativos de México tiene un enorme valor $$$$$$$$$ Importancia de la genómica en México México tiene el 10% de la diversidad biológica del planeta Es número 1 en reptiles, 3 en plantas y anfibios, y 4 en animales La biodiversidad a nivel regional es excepcional México, Colombia y Costa Rica poseen más del 25% de la biodiversidad mundial. IMPORTANCIA DE LA GENOMICA EN MEXICO México además de tener una enorme riqueza en biodiversidad es el centro de origen, diversidad y domesticación de un gran número de las especies agrícola de mayor importancia económica. Maíz Chile Frijol Jitomate Tomate Cacahuate Girasol Calabaza Aguacate Agave Y muchas más Institute Director Yang Huanming “DNA sequencing is where a developing country can compete in big science that can yield powerful new technologies”. Laboratorio Nacional de Genómica para la Biodiversidad (LANGEBIO) QuickTime™ and a TIFF (LZW) decompressor are needed to see this picture. Langebio inició sus labores en mayo del 2005 Dos secuenciadores ABI3700 de 96 capilares totalmente automatizados Dos secuenciadores MegaBACE4000 de 384 capilares Dos secuenciadores basado en amplificación múltiple en paralelo (454) Un secuenciador de alta capacidad SOLID de ABI (20 Gb por corrida) Robot picador de colonias Genetix (4000 colonias por hora) Robot para impresión de microarreglos (Virtek) Lector confocal de microarreglos (Virtek) Robot para preparación de reacciones de secuenciación Capacidad y usos de los distintos secuenciadores 1) Secuenciadores tipo Sanger (ABI3700 y MegaBACE4000). Pueden procesar entre 96 y 384 muestras generando de 800 a 1000 pares de bases de alta calidad por muestra en 4 h. Se usan para secuenciar moléculas específicas y como base de proyectos genómicos. 2) Secuenciadores en paralelo en nanoesféras 454. Procesan Un millón de moléculas generando 400 bases por muestra dando un total de 400 Mb en 8 h. En una corrida se pueden secuenciar hasta 5 genomas bacterianos con una cobertura 20X. Tiene algunos errores cuando hay hileras de más de 7 bases idénticas (GTCTGGGGGGGGTTCTGCTT) 3) Secuenciadores tipo SOLID o Solexa. Tienen una capacidad de secuenciar hasta 100 millones de moléculas generando 35 bases por molécula. Muy útil para re-secuenciar genomas ya conocidos, por ejemplo humanos, arabidopsis, arroz y maíz entre otros. Ensamblado de novo de genomas aún muy complejo pero se está trabajando para resolverlo. Secuenciación del genoma codificante del maíz y uso del genoma para identificar genes de tolerancia a sequía El genoma del maíz palomero toluqueño es el más pequeño de los 350 genotipos analizados Genome (Mb) B73% Landrace Zapalote Chico Tepezintle B73 Tuxpeño 1 Tuxpeño 2 Chalqueño Bolita Palomero 1 3200 2900 2700 2500 2300 2300 2200 1950 100% 90% 84% 78% 71% 71% 68% 60% LABORATORIO NACIONAL DE GENOMICA PARA LA BIODIVERSIDAD Validación de genes funcionales por transcripción Cinvestav Se secuenció el equivalente a 4.7 veces el genoma completo del maíz palomero Se identificaron 54 203 genes en el maíz palomero• # Genes con evidencia transcripcional por 454: 42,664 (78%) • # Genes funcionales adicionales por ESTs: 4,436 Total: 47,100 Genes validados por transcripción (87%) •Adicionalmente tenemos 183,015 Contigs que aparentemente no tienen genes pero que son transcripcionalmente activos. “ANÁLISIS DE LA RESPUESTA A NIVEL FISIOLÓGICO Y DE EXPRESIÓN GÉNICA BAJO SEQUĺA EN TRES MATERIALES CRIOLLOS MEXICANOS DE MAĺZ” Cinvestav OBJETIVO Identificar las respuestas fisiológicas y génicas entre tres variedades de maíz bajo condiciones de sequía e identificar aquellos genes asociados a su respuesta por sequía. Se usaron dos razas tolerantes a la sequía (Cajete Criollo y Michoacán 21, y una susceptible (85-2) CONTROL Cy3 TEST Cy5 Cy3 + Cy5 17 días de estrés (Inducidos) 85-2 Cajete criollo 17 días de estrés (Reprimidos) 85-2 Cajete criollo 143 106 611 Michoacán 21 Michoacán 21 Cajete criollo Michoacan 21 85-2 FOTOSINTESIS 85-2 Cajete criollo Michoacan 21 FOTOSINTESIS 85-2 Cajete criollo Michoacan 21 Factores de transcripción inducidos por sequía en variedades tolerantes a la sequía 12 comunes a las variedades tolerantes y susceptibles a la sequía 5 comunes a las variedades tolerantes a la sequía 3 específicos para la Cajete Criollo y 5 para la Michoacán 21 Pozas Cuatro Ciénegas Pools Una de las zonas más ricas en biodiversidad del mundo, equiparable a las islas Galapagos. Datos geológicos sugieren que las pozas son remantes de un mar muy antiguo Cuatro Ciénegas: a living laboratory to understand bacterial evolution Cerca de 170 pozas con muchas especies endémicas incluyendo peces, caracoles y tortugas, además de una gran riqueza en microorganismos. Galapagos: islands isolated by water • 4C is a reversed Galapagos: Ponds isolated by sand and mountains • El agua es oligotrófica con concentraciones extremadamente bajas de fósforo. No soporta el crecimiento de algas, pero es rica en bacterias fotosintéticas. • Secuenciando el genoma de bacterias de las pozas podemos definir si efectivamente las bacterias de las pozas son de origen marino. Metagenomic analysis using 20 universally present genes in Bacillus sp. shows that Bacillus coahuilensis is indeed closest to marine Bacillus but basal to all Phylogenomics analysis Bacillus from the Gulf of Mexico Agradecimientos Maíz June Simpson Octavio Martínez Corina Hayano Alfredo Herrera JeanPphilippe Vielle Grupo de secuenciación y microarreglos Alkamidas José López Bucio UMSNH Jorge Molina Alfonso Hernández UMSNH Formas alternas de fósforo Damar López Financiamiento SAGARPA CONACyT SEP CONCyTEG HHMI