Bioprospección por screening de bibliotecas metagenómicas Leonardo Erijman Ingeniería Gené2ca -­‐ 2do cuatrimestre 2013 Metagenómica como respuesta a la demanda de nuevos genes y sus productos La diversidad natural es la fuente principal de nuevas moléculas La explicación está en la vasta riqueza de suelos, océanos y otros nichos microbianos La metagenómica es una tecnología clave para acceder al potencial presente en los genomas de los microorganismos Permite la inves2gación de los genes individuales, el análisis de operones completos codificantes para vías biosinté2cas o degrada2vas Obje9vos de estudios metagenómicos Integrar conocimientos biológicos fundamentales para crear una imagen integrada de como funciona un ecosistema Determinar que genes hay (metagenómica basada en secuencia) Extracción de ADN de la comunidad • Comparacíon entre comunidades • Identificar genes y pathways metabólicos • Determinar la expresión de dichos genes • y más… Determinar que hacen los genes (metagenómica basada en función) • Screening para identificar funciones de interés (producción de vitaminas, resistencia a antibióticos, etc) • y más… Primeros pasos: clonado y expresión Chemistry & Biology 5: R245–R249 (1998) Clonado para acceder a los genomas colec2vos (metagenoma) y a la maquinaria enzimá2ca de la microbiota del suelo La metagenómica es un nuevo campo de la biología Análisis gené2co directo de los genomas en una muestra ambiental http://dels-old.nas.edu/metagenomics/ Representatividad! Metagenómica y nuevos catalizadores Iqbal et al., Curr Op Chem Biol 2012, 16:109–116 Screening basado en función • Nuevas funciones • Selección por genes funcionales • Laborioso (screening) • Baja frecuencia • Depende de la expresión en el huésped Screening basado en secuencia • No depende de huésped • Estrategias similares para diferentes targets (PCR/hibrid) Funciones relacionadas a genes conocido Limitaciones en la predicción Errores en la anotación Construcción de bibliotecas metagenómicas Meyerdierks & Glöckner Metagenome analysis, en Introduc5on to Marine Genomics 2010, Springer Metagenómica como respuesta a la demanda de tecnologías más limpias 1. Detergentes 2. Alimentos 3. Agricultura 4. Procesamiento textil 5. Industria del papel 6. Industria química Qué genes, qué productos? 1. Detergentes 2. Alimentos Screening m 3.etagenómico Agriculturafuncional de ac2vidades hidrolí2cas dominan actualmente la literatura 4. Procesamiento textil 5. Industria del papel 6. Industria química Qué genes, qué productos? Enzimas usadas en la industria Enzimas presentes en metagenomas Búsqueda metagenómica de biocatalizadores Iqbal et al., Curr Op Chem Biol 2012, 16:109–116 Screening basado en función La probabilidad de identificar un cierto gen depende de: 1. La abundancia del gen en el metagenoma de origen 2. Tamaño del gen 3. El sistema vector-huésped 4. La eficiencia de expresión heteróloga Selección del ambiente Selección del ambiente • Ambientes naturalmente enriquecidos en el blanco (celulasas en rumen de vacas) No garantiza alta frecuencia de detección • Ambientes extremos Biocatalizadores estables en condiciones extremas • Ambientes altamente diversos (suelos) Mayor diversidad y mayor flexibilidad Selección del ambiente Elend et al. 2006 Appl. Environ. Microbiol. 72, 3637-3645 Selección del ambiente Suenaga et al., 2007 Environmental Microbiology 9, 2289–2297 Busqueda metagenómica de enzimas lipolí9cas agar tributirina Elend et al. 2006 Appl. Environ. Microbiol. 72, 3637-3645 Esterasas: estabilidad al pH y temperatura Elend et al. 2006 Appl. Environ. Microbiol. 72, 3637-3645 Esterasas: estabilidad frente a solventes 160 140 EstA3 % Actividad 120 100 80 60 40 20 0 ctrl 15% 30% 15% 30% 15% 30% 15% 30% 15% 30% metanol DMSO DMF isopropanol acetonitrilo Elend et al. 2006 Appl. Environ. Microbiol. 72, 3637-3645 Aislamiento de ADN 1. El DNA debe ser extraído de un amplio rango de microorganismos para que sea representa2vo de la comunidad original 2. Se requiere DNA de alto peso molecular 3. El DNA debe estar libre de sustancias contamnantesque interfieren con el procesamiento (restricción, ligación) • Métodos directos e indirectos • Pre-enriquecimiento Construcción de bibliotecas metagenómicas Fragmentos 2-8kb Necesidad de expresión en un sistema heterólogo Plásmido de expresión cósmidos, fósmidos BAC DNA metagenómico Pequeños insertos • Alto número de copias. • Mayor expresión (promotores) • DNA degradado o contaminado • Técnicamente simple • Requiere mucho análisis para hallar positivos • Improbable clonar vías completas Fragmentos >30kb Grandes insertos • taxones raros • Clones positivos con menos número de análisis • Vias metabólicas completas • Requiere DNA de alto PM y altamente purificado • Expresión limitada de genes • Técnicamente más complejo Vectores de expresión Cósmidos son plásmidos en los cuales se han clonado las secuencias cos necesarias para la encapsulación de par]culas de fago lambda El si2o cos y la longitud entre 2 si2os cos son los únicos requisitos para ser empaquetado en el fago. Tienen 5 kb, por lo tanto se pueden clonar fragmentos de 33 -­‐ 48 kb Fosmidos son similares a los cósmidos en que con2enen si2os cohesivos (COS) para el empaquetado de insertos de 35-­‐45 kb en fagos Derivan del factor de fer2lidad de E. coli (F), que les permite mantener insertos de DNA genómico con mucho mayor estabilidad que los cósmidos BAC también están basados en el plásmido F, manteniendo los genes que regulan su replicación y controlan el número de copias Puede introducir fragmentos de 100-­‐350 kb Screening basado en función La actividad enzimática se ensaya generalmente en agar suplementado con sustratos + simple - señales débiles Metaloproteasa en agar + leche (80000 clones) Medio conteniendo trioleilglicerol y rodamina Waschkowitz et al. Appl. Environ. Microbiol. 2009, 75: 2506-2516 Screening basado en función Genes de resistencia a antibióticos provenientes del metagenoma Genes de resistencia a antibióticos provenientes de aislamientos Functional Characterization of the Antibiotic Resistance Reservoir in the Human Microflora Morten O. A. Sommer, et al. Science 325, 1128 (2009); Screening basado en función Vectores autolí9cos para screening masivos cassette autolítico SRRz Inducible por UV insertado en pUC18 para transformar E. coli BL21 Eficiencia de lisis: 44.5% a 30 °C Li et al. 2007 J Biotech 127: 647–652 Como mejorar el número de reacciones, la especificidad y la sensibilidad • Múl2ples sustratos con diferentes modalidades de detección (fluorescencia y colorimétrica (detección simultánea de varias ac2vidades) • Pool de clones • Modificando gené2camente la expresión del huésped para reducir el background • Inducción del número de copias de fósmidos (ú2l para genes clonados sin promotores o de baja eficiencia de expresión) Nyyssönen et al. Front Microbiol 3, 1-14 (2013) High throughput screening of metagenomic libraries 12,160 clones 170,240 reacciones Nyyssönen et al. Front Microbiol 3, 1-14 (2013) Como mejorar el número de análisis, la especificidad y la sensibilidad Elimina las actividades WT de amilasa y fosfatasa Nyyssönen et al. Front Microbiol 3, 1-14 (2013) Inac9vación de genes cromosomales en E. coli FLP recognition target Sitios de priming FLP Regiones de homología Datsenko & Wanner Proc. Natl. Acad. Sci. U.S.A. 97, 6640–6645 (2000) Inducción de mayor número de copias CopyControlTM System (Epicentre Technologies) Se puede usar para cualquier tipo de vector— BAC, fosmido Permite mantener el stock de células con bajo número de copias de vector e inducir a alto número cuando es necesario Wild et al. Conditionally Amplifiable BACs: Switching From Single-Copy to High-Copy Vectors and Genomic Clones Genome Res. 2002; 12: 1434–1444 20 familias de glucosido hidrolasas Nyyssönen et al. Front Microbiol 3, 1-14 (2013) Complementación heteróloga Uso de cepas huéspedes mutantes que requieren el gen blanco para crecer en condiciones selec2vas. Ventajas: simple, rápida, no hay falsos posi2vos, altamente selec2va. 9 genes nuevos Ejemplo: gen codificante para DNA polimerasa por complementación de una mutante polA de E.coli. Simon et al., 2009 Appl. Environ. Microbiol. 75, 2964-2968 Vectores autolí9cos para liberación de enzimas intracelulares Indicador no permeable Degradación intracelular Acumulación intracelular de producto cassege autolí2co SRRz insertado en pUC18 para transformar E. coli BL21 Eficiencia de lisis: 44.5% a 30 °C Li et al. 2007 J Biotech 127: 647–652 Screening funcional: SIGEX DNA metagenómico es clonado upstream del gen de gfp Se basa en que los genes catabólicos están en operones cuya expresión en muchos casos es controlada por elementos regulatorios que están próximos (inducibles por sustrato) Uchiyama et al., 2005 Nat. Biotechnol. 23:88–93 Screening funcional: SIGEX 152000 clones con insertos de 7kb 1. Construcción de library 58 clones regulados por benzoato metagenómica 4 clones regulados por naftaleno 2. Eliminación de clones conteniendo plásmidos expresando gfp cons2tu2vamente 3. Selección de clones expresando gfp en presencia del inductor 4. Aislamiento en agar de colonias separadas Uchiyama et al., 2005 Nat. Biotechnol. 23:88–93 Screening funcional: SIGEX • El clon 2ene que contener suficiente porción del operón para ser ú2l en los subsiguientes estudios funcionales, pero no debe tener la porción terminal del operón que lleve una señal de terminación de la transcripción REDUNDANCIA EN LA LIBRARY • La maquinaria regulatoria que reconoce el promotor y el sustrato deben estar presentes y ser funcionales en el huésped USO DE OTROS HUESPEDES • Hay genes que se ac2van por efectores que no son sustratos • Los genes regulatorios y catabólicos pueden estar alejados • No siempre los genes catabólicos se inducen por sustratos Uchiyama et al., 2005 Nat. Biotechnol. 23:88–93 Screening funcional: PIGEX Los clones positivos para amidasa catalizan la conversión de benzamida a benzoato se induce la expresión del gen reportero El benzoato activa el regulador transcripcional BenR, que activa el promotor benA gfp Uchiyama & Miyazaki 2010 Appl. Environ. Mirobiol. 76, 7029–7035 Screening funcional: PIGEX 96,000 clones 11 amidasas, 3 nuevas 96 wells c/100 clones de una library de fósmidos (x100) 1. Capacidad de distinguir entre sustrato y producto 2. Ausencia de inductores endógenos 3. Los productos generados por la amidasa deben ser inertes in vivo para asegurar constante inducción del sensor sensor cells were in log phase Uchiyama & Miyazaki 2010 Appl. Environ. Mirobiol. 76, 7029–7035 Screening funcional: METREX El desarrollo de un ensayo intracelular para pequeñas moléculas se basó en un sistema que se encontrara en organismos y ambientes diversos y respondiera a una variedad de moléculas Moléculas que inducen quorum sensing Proceso de comunicación inter-­‐celular mediado por pequeñas molécula que le permite a las bacterias sensar su propia densidad celular Variaciones estructurales en inductores de QS sirven para regular específicamente muchas funciones ecológicamente relevantes, tales como formación de biofilms, luminescencia, virulencia y producción de an2bió2cos Screening funcional: METREX METabolite Regulated EXpression El biosensor que detecta los clones ac2vos está dentro de la misma célula que el DNA metagenómico Activador transcripcional Williamson et al. 2005 Appl. Environ. Microbiol 71, 6335-6344 Posibles causas de la falta de expresión • Diferencias en el uso de codones • Falta de reconocimiento del promotor • Falta de factores de iniciación • Folding inadecuado • Formación de cuerpos de inclusión • Ruptura enzimá2ca del producto • Toxicidad • Incapacidad de secreción del huésped Uso de vectores con amplio rango de huésped Feno2pos asociados con la producción de moléculas pequeñas (an2bió2cos, pigmentos, morfología alterada) • Agrobacterium tumefaciens • Burkholderia graminis • Caulobacter vibrioides • Escherichia coli • Pseudomonas pu5da • Ralstonia metallidurans antibact en R metallidurans antibact en E. coli antibact en R metallidurans Pigmento en P putida antibact en E. coli Pigmento en A tumefaciens Wrinkle en A tumefaciens Pigmento en R metallidurans Mínima superposición de clones Craig et al., 2010 Appl. Environ. Microbiol. 76, 1633-1641 Expresión de DNA metagenómico en otras Proteobacterias Craig et al. 2011 Curr. Op. Biotechnol, 22:465–472 Screening basado en homología La aplicación de estrategias basadas en homologías implica el diseño de sondas de DNA o primers derivados de regiones conservadas de genes • Hibridación • PCR • Síntesis Microbioma especializado en actividad hidrolítica Celulasa Hess et al., (2011) Science 331, 463-467 Screening basado en homología 268 gigabases 27,775 genes putativos, activos para carbohidratos 90 candidatos amplificados por PCR 12% de los 27,755 genes tienen 51 con actividad celulolítica 75% identidad con genes en NCBI-nr 43% de los genes menos 50% de identidad con proteínas conocidas Hess et al., (2011) Science 331, 463-467 Metagenómica sinté9ca http://www.cazypedia.org/index.php/Glycoside_Hydrolases Despolimerización de material celulósico Algaier et al. PLoS ONE 5: e8812 (2010) Enriquecimiento en bioreactor Incubación: 31 días termofílica Auto calentamiento maduración Cambio en el perfil taxonómico Análisis de correspondencia del microbioma Los genes involucrados o asociados al metabolismo lignocelulósico no contribuyen suficientemente a la señal funcional en este tipo de análisis global Hábitat lignocelulósico SIP/metagenómica Es una forma de caracterizar (y enriquecer) miembros ecológicamente relevantes de una comunidad, y sus funciones metabólicas, aunque no sean numéricamente dominantes SIP/metagenómica genes codificantes para la glicerol deshidratasa dependiente de coenzima B12 Frecuencia de detección: 2.1X - 3.8X mayor Schwartz et al. 2005 World J Microbiol Biotechnol 22, 363-368 SIP/metagenómica SIP/metagenómica Pocas enzimas descubiertas por metagenómica son usadas en procesos biotecnológicos Expresión de la proteína pura en can2dades suficientes a un costo razonable Baja frecuencia de clones que son posi2vos en las bibliotecas metagenómica Acceso a exper5se en bioinformá2ca Métodos complementarios Warnecke & Hugenholtz, Genome Biology 2007, 8:231 NGS: Secuenciación paralela masiva Next Genera2on Sequencing • Masiva por la capacidad de secuenciar tanto ADN • Es masiva porque se puede hacer en paralelo 60 Pirosecuenciación (454 / Roche) 61 Pirosecuenciación (454 / Roche) DNA Library Prepara2on 4.5 hours emPCR 8 hours Sequencing 7.5 hours • Well diameter: average 44μm • 400,000 reads obtained in parallel • A single cloned amplified sstDNA bead is deposited per well • 4 bases (TACG) cycled 100 2mes • Chemiluminescent signal genera2on • Signal processing to determine base sequence and quality score Source :454 Sequencing © Roche Diagnos2cs Pirosecuenciación (454 / Roche) Pirosecuenciación (454 / Roche) 1. ePCR produce ar2ficialmente secuencias replicadas Gomez-Alvarez et al., ISME J (2009) 3, 1314–1317 2. Problemas en correlacionar la intensidad de luz producida con el número de nucleó2dos en homopolímeros (corrimientos de marcos de lectura para CDs) Terminador reversible (Illumina) 65 Métodos de estudios metagenómicos Gilbert & Dupont Annu. Rev. Mar. Sci. 2011. 3: 347–371 Literatura Simon & Daniel. Metagenomic Analyses: Past and Future Trends. Applied and Environmental Microbiology 2011, 77: 1153-­‐1161 (lectura obligatoria) Taupp et al. The art and design of func2onal metagenomic screens. Current Opinion in Biotechnology 2011, 22: 465-­‐472 Ekkers et al. The great screen anomaly—a new fron2er in product discovery through func2onal metagenomics. Applied Microbiology and Biotechnology 2012 93:1005–1020 Iqbal et al. Biocatalysts and small molecule products from metagenomic studies. Current Opinion in Chemical Biology 2012, 16:109-­‐116