reconstrucciones filogenéticas de diferentes grupos usando

Anuncio
EFECTO DE LAS SECUENCIAS CODIFICANTES Y NO CODIFICANTES EN LAS
RECONSTRUCCIONES FILOGENÉTICAS DENTRO DE LA FAMILIA ARISTOLOCHIACEAE Y
ALGUNOS GRUPOS RELACIONADOS
Laura Melisa Ayala
Trabajo Final Sistemática-Universidad Industrial de Santander
INTRODUCCIÓN
Los genes codificantes se trabajan especialmente para estudios a bajo nivel taxonómico, y
con frecuencia las homologías entre los diferentes nucleótidos se pueden establecer de
forma inambigua, a diferencia de lo que ocurre con las secuencias no codificantes las
cuales no siguen un patrón de tripletes y por lo tanto la identificación de las homologías es
mas complicada (Pleguezuelos, et al., 2002). Adicionalmente éstas secuencias no
codificantes pueden haber sufrido eventos mutacionales de inserción y deleción
(fenómeno indel) entre las secuencias, lo cual en el momento del alineamiento debe ser
tenido en cuenta puesto que estos espacios son sustituidos por guiones (gaps) con el fin
de conservar la homología posicional.
El orden Piperales es uno de los mas grandes dentro de las angiospermas basales con una
amplia distribución (Wanke, et al., 2007). Datos moleculares han aportado la suficiente
evidencia como para encontrar relaciones entre Piperales y Canellales (Qiu et al., 1999, en
Wanke, et al., 2007). La relación entre los ordenes Piperales, Canellales, Magnoliales, y
Laureles, los cuales forman el clado magnolioideo está también bien soportado.
Dentro de los Piperales, el intrón trnK (que incluye el ORF de matK) tiene en promedio
2533 bp. La región codificante matK tiene una longitud de entre 1509-1557 bp (en
promedio 1534bp) en la mayoría de angiospermas y se encuentra localizado dentro de
el dominio V del grupo de los intrones tipo II del trnKUUU (Ems et al., 1995). Se piensa
que este ORF codifica para la maturasa, de hecho es la única maturasa de los plastidios
de las plantas superiores (Vogel et al., 1997 en Wanke et al, 2006). Mientras que el gen
matK se ha convertido en uno de los genes cloroplásticos mas usados como
marcadores en los análisis filogenéticos de Angiospermas, el intrón completo
últimamente ha empezado a usarse, de ésta manera la utilidad de esta región puede
ser extendida a niveles inter e intraespecíficos (Wanke et al., 2006). Particularmente el
gen matK posee
una tasa de sustitución en la primera y segunda posición similares a las de la tercera, lo
cual contribuye a su alta tasa evolutiva en contraste con otros genes cloroplásticos
((Wanke et al., 2007).
Éste trabajo busca construir las filogenias derivadas de regiones codificantes y no
codificantes de la región trnK/matK del ADN de trasferencia de la ------, que se encuentra
en el cloroplasto, con el fin de observar los efectos de la utilización de estos fragmentos
en las reconstrucciones filogenéticas, particularmente de la familia Aristolochiaceae.
MATERIALES Y MÉTODOS
Análisis filogenético
Las reconstrucciones filogenéticas se realizaron a partir de 19 especies de plantas,
pertenecientes a de los órdenes Chlorantales (Hedyosmus mexicanum) y Piperales. Dentro
del orden Piperales se trabajó con las familias Saururaceae (Saururus cernuus y
Gymnotheca chilensis) y Aristolochiaceae. En esta última se tuvieron representantes de los
cuatro géneros que la conforman. Género Saruma (Saruma henryi), Asarum (Asarum
nipponicum, Asarum caudatum), Thottea (Thottea corymbosa) y Aristolochia (Aristolochia
serpentaria, A. californica, A. triactinia, A. promissa, A. rojasiana, A. holostylis, A. rotunda,
A. clematitis, A. bracteolata, A. albida)
Se trabajó con las secuencias codificantes y no codificantes de la región trnk/matK
ubicada en el cloroplasto. Para el análisis de los datos moleculares se realizo un
alineamiento múltiple utilizando el programa MUSCLE 3.6 (Edgar 2005) y los resultados
generados del alineamiento se utilizaron para determinar los modelos de evolución de
cada gen con los programas R 2.0.8 (Venables & Smith 2008), ape 2.2-2 (Paradis et al.,
2007) y PhyML 3.0 (Guindon & Gascuel 2008).
Las reconstrucciones filogenéticas usando búsquedas heurísticas bajo máxima parsimonia
fue llevado a cabo el programa winclada. A los árboles obtenidos se les realizó un
consenso estricto y soporte (limite de confianza) de Bootstrap
Se realizo un análisis de sensibilidad con 5 costos (ts2tv1g2, ts2tv5g1, ts2tv4g5, ts2tv6g2,
y ts3tv5g2) en el programa POY 4.0 (Varón et al., 2007) y se escogió el menor costo con lo
cual se generaron la topologías para cada uno de los genes. A los árboles obtenidos se les
realizo consenso estricto y soporte (limite de confianza) de Bootstrap.
Se llevó a cabo un análisis de Máxima verosimilitud para las secuencias moleculares con el
programa PhyMl 3.0 (Guindon & Gascuel 2008) y por ultimo se realizo un análisis de
inferencia Bayesiana con el programa MrBayes 3.1.2 (Huelsenbeck & Ronquist 2001).
RESULTADOS Y DISCUSIÓN
Se observaron diferencias en cuanto a los modelos de evolución para cada una de las
secuencias, el modelo de sustitución que mejor se ajustó para las secuencias codificantes
fue GTR con una distribución gamma y HKY85 también con una distribución gamma de
las tasas evolutivas por sitio, fue el mejor modelo de sustitución para la secuencia no
codificante, lo cual fue usado para inferencia filogenética de máxima likelihood. Es decir,
que de manera general esta región se acomoda mejor a los modelos con muchos
parámetros.
A excepción de la topología arrojada por el análisis de máxima verosimilitud, la región no
codificante del trnK recupera el clado de la subfamilia Aristolochioidae, sin embargo las
relaciones dentro del género Aristolochia se destruyen casi en su totalidad,
permaneciendo únicamente la relación entre Aristolochia albida y A. bracteolata para
todos los casos (figura 1-6). Si bien, las relaciones de la subfamilia Asaroideae varían
mucho dentro de las topologías, al igual que el caso anterior, el clado y las relaciones de
sus géneros permanecen contantes a través de los diferentes análisis, lo cual es soportado
por altos valores de Bootstrap (figura 1 y 4); ésta subfamilia presenta relaciones
recurrentes con representantes del orden Canellales, cuando lo que se debería esperar es
una relación más próxima con la familia Saruraceae (figura 1 y 3). De manera particular, la
reconstrucción bajo el criterio de parsimonia, se puede evidenciar la conservación de las
relaciones subgenéricas, a pesar de ser un clado con muchas politomías (figura 1). La
topología bajo el análisis de sensibilidad guarda la mayor cantidad de relaciones, con
respecto a la configuración generada mediante la secuencia codificante de la región
trnK/matK a nivel de grandes grupos, ya que dentro de la subfamilia Aristolochioidae, las
relación genéricas e infragenéricas son casi inexistentes. El análisis bayesiano es el único
que reconstruye las relaciones dentro del género Aristolochia.
Las relaciones que se obtienen mediante el análisis de máxima verosimilitud son bastante
confusas y rompen completamente con las relaciones existentes dentro de las series que
conforman los subgéneros. Particularmente Asarum caudatum (Subfamilia Asaroideae) se
relaciona con A. serpentaria (Subfamilia Aristolochioideae) en un clado terminal, de la
misma manera, A. holostitis y A. promisa, se encuentran dentro de un mismo clado junto
con representantes de la subfamilia Asaroideae y Saruraceae (incluidas dentro del orden
Piperales), y del orden Canellales.
La poca resolución obtenida mediante las secuencias no codificantes pueden deberse a
que éstas no han acumulado la suficiente variabilidad como para distinguir las relaciones
entre las especies, lo cual si ocurre con la región codificante matK, cuyas tasas de
sustitución en la primera y segunda posición son similares a las de la tercera (Wanke et
al., 2007), y dado que esto contribuye a su alta tasa evolutiva, podría ser la razón de la
diferencia con respecto a las topologías generadas; pese a esto pudo haber ocurrido lo
contrario, las tasas de evolución se disminuyeron en la región intrónica trnK..
BIBLIOGRAFÍA
Edgar, R.C. 2005. MUSCLE: multiple sequence alignment with high accuracy and high
throughput, Nucleic Acids Research 32; 1792-97.
Ems, S.C., Morden, C.W., Dixon, K.W. 1995. Transcription, splicing, and editing of
plastid RNAs in the nonphotosynthetic plant Epifagus virginiana. Plant Mol. Biol.
29, 621-733.
Goloboff, P.A. (1993a). NONA, Version 2.0. Published by the Author, Instituto Miguel Lillo,
Miguel Lillo 205, 400 Sierra Madre de Tucuman, Argentina.
Goloboff, P.A., Farris, J.S., Nixon, K.C. 2007. T.N.T. Tree analysis using new technology.
Programa y documentación disponible en: http://www.zmuc.dk/public/phylogeny/TNT/.
Guindon, S & Gascuel, O. 2008. A simple, fast and accurate algorithm to estímate large
phylogenies by maximun likelihood. Systematic Biology 52; 696-704.
Huelsenbeck, J.P and Ronquist, F. 2001. MrBayes v3.1.2: Bayesian inference of phylogeny.
Bioinformatics 17; 754-755.
Nixon, K.C. (2002). WINCLADA (BETA), Versión 1.00.08. Published by the author, Cornell
University, Ithaca, New York. Nixon, K.C & Carpenter, J.M. (1993) On Outgroups. Cladistics
9; 413–426.
Paradis, E. 2008. The ape Package. Analyses of Phylogenetics and Evolution.
Pleguezuelos J. M., R. Márquez Y M. Lizana, (eds.) 2002. Atlas y Libro Rojo de los Anfibios y
Reptiles de España. Dirección General de Conservación de la Naturaleza-Asociación
Herpetologica Española (2ª impresión), Madrid, 587 pp. Pag 17.
Venables, W.N., Smith, D.M and the R Development Core Team. 2008. A programming
environment for data analysis and graphics.
Varón, A., Vinh, L.S., Bomash, I & Wheeler, W.C. 2007. POY 4.0 Beta 2398. American
Museum of Natural History. http://research.amnh.org/scicomp/projects/poy/php.
Wanke, S., González, F., Neinhuis, C. 2006. Systematics of pipevines –Combining
morphological and fast-evolving molecular characters to resolve therelationships within
Aristolochioideae (Aristolochiaceae). Int. J. Plant Sci. 167(6):1215–1227.
Wanke, S., Jaramillo, M.A., Borsch, T., Samain, M., Quandt, D., Neinhuis, C. 2007. Evolution
of Piperales—matK gene and trnK intron sequence data reveal lineage specific resolution
contrast. Molecular Phylogenetics and Evolution 42: 477–497
Wheeler, W.C. 1995. Sequence alignment, parameter sensitvity, and the phylogenetic
analysis of molecular data. Systematic biology 44; 321-331.
Figura 1. Reconstrucción a partir de las secuencias codificantes (A) y no codificantes (B). A. Longitud=1067, Ci=73 y Ri=77. B.
Longitud=1269, Ci=71, Ri=65
Figura 2.Análisis de Sensibilidad. Reconstrucción usando las secuencias codificantes bajo la matriz de menor costo. ts2tv6gap2 con
un valor de 1522.
Figura 3. Análisis de Sensibilidad. Reconstrucción usando las secuencias No codificantes bajo la matriz de menor costo. ts2tv5gap1 y
ts2tv6gap2 con un valor de 5061.
Figura 5. Topología obtenida a partir de la secuencia No codificante en Mr Bayes.
Figura 6. Topología obtenida a partir de la secuencia codificante en Mr Bayes.
Figura 7. Topología generada por las secuencias codificantes bajo máxima verosimilitud usando PhyML
Figura 8. Topología generada por las secuencias no codificantes bajo máxima verosimilitud usando PhyML
Descargar