EFECTO SOBRE LOS INDICES CI, RI, PI Y CFI AL COMBINAR CARACTERES MOLECULARES Y MORFOLOGICOS EN PARSIMONIA Leidy Viviana Gélvez Landazábal Cod. 2051281 Universidad Industrial de Santander, Facultad de Ciencias, Escuela de Biología. INTRODUCCIÓN El debate actual en torno datos morfológicos y moleculares en estudios filogenéticos, hay una necesidad de un amplio estudio para evaluar este desarrollo, y una particular para determinar el efecto de incluir datos morfológicos a datos de secuencias moleculares para un análisis combinado. Patterson (1988) sentó las bases para el debate sobre el papel de los caracteres morfológicos y moleculares en la sistemática, sin embargo, aún sigue siendo un método discutido donde se han aplicado herramientas que permite particularmente la comparación de estos datos. En la comparación inicial de las hipótesis filogenéticas usando tanto datos moleculares y morfológicos se vieron obligados a evaluar cada tipo de datos principalmente mediante el examen de las topologías y las medidas de homoplasia (por ejemplo, los índices de consistencia y retención) procedentes de distintos análisis (Patterson, 1993). Usando estas herramientas, podemos evaluar si la de la morfología influye significativamente sobre las hipótesis evaluadas a partir de moléculas y el resultado de realizar un análisis combinado. En este trabajo se evalúan los efectos de combinar datos moleculares y morfológicos en parsimonia, teniendo en cuenta los índices de consistencia (CI), retención (RI), consenso retenidos (CFI) y caracteres parsimoniosamente informativos (PI). MATERIALES Y METODOS El análisis se realizó utilizando 3 set de datos, cada uno con 10 especies, correspondientes las familias Amblystegiaceae, Enicopidae y Phyllodocidae, cada uno con 3 genes y una matriz morfológica. Se realizó un análisis de sensibilidad usando los datos morfológicos y moleculares combinados para cuatro costos diferentes, por medio del programa POY v4.1 (Varón et al. 2008) y se calculó el valor de ILD (Farris, 1995) para cada una de las corridas (Tabla 2). Las matrices para evidencia total y para cada partición fueron obtenidas y se le asignaron los respectivos costos utilizando el el programa TNT 1.1 (Goloboff et al., 2008). Posteriormente se obtuvieron las matrices para calcular los índices PI, CI, RI y CFI para los arboles obtenidos en el software Nona 2.0 (Goloboff, 1993) vía Winclada 1.00.08 (Nixon 2002) por medio de búsquedas heurísticas de 1000 replicas. RESULTADOS En análisis de sensibilidad, los ILD para las familias Amblystegiaceae, Epiconidae y Phyllodocidae fueron de 0.031, 0.065 y 0.034 respectivamente (Tabla1).Para los tres sets de datos se obtienen porcentajes bajos (3-6%) de PI de los datos morfológicos, los porcentajes más altos están presentes en los datos moleculares excepto el caso del gen 2 en la familia Amblystegiaceae. Los índices de consistencia mas altos se mantienen en los datos moleculares a diferencia de los índices de retención los cuales fueron variables entre los datos moleculares y morfológicos. También se pueden observar índices de retención bajos para los datos de evidencia total. El índice de consenso retenido, mide la resolución de las topologías obtenidas; se observa que en todo el análisis este índice no fue menor al 50%. Los porcentajes mas altos (100%) para la familia Amblystegiaceae solo se da para el gen 3 y para datos combinados solo 60%. Para la familia epiconidae se observan que los porcentajes mas altos de CFI, lo presentan los datos moleculares, sin embargo la evidencia total presenta un porcentaje considerable para la resolución de la topología de datos combinados (88%). El CFI en Phyllodocidae es alto (100%) para los datos combinado y las particiones excepto por el gen 1 el cual presenta un porcentaje del 88%. DISCUSIÓN Para el análisis realizado, se puede determinar que la inclusión de los datos morfológicos tiene un efecto positivo sobre la resolución de las topologías (CFI) en el análisis combinado. Así mismo, también se observó que el %PI de los datos morfológicos no presentaron un efecto significativo. Sin embargo se debe tener en cuenta que esto puede darse debido a que el numero de caracteres morfológicos utilizados para cada set de datos es pequeño comparado con el total de datos moleculares. Pese a lo anterior no fue afectada la resolución de las topologías en los datos combinados (evidencia total); por lo tanto, se podría esperar que tenga un efecto significativo sobre los resultados del análisis filogenético, aunque no sea tan grande como el efecto de los datos moleculares. Eernisse y Kuge (1993), proponen que el combinar caracteres moleculares y morfológicos presenta efectos positivos debido a que las hipótesis obtenidas están basadas en la máxima evidencia posible y que inclusive los datos no informativos pueden aumentar el nivel de información por la congruencia con otros caracteres de conjuntos distintos. En general, el CI es un buen indicador de la estabilidad: en conjuntos de datos con CI superior a 0,80 se dice que no hay cambios cuando en los caracteres se establecen homoplasias con pesos implicados (Goloboff 1993). En los conjuntos de datos con CI por debajo del 80% presentan una baja resolución de las topologías (CFI) y las que presentan una resolución de 1, y bajos CI podría ser porque a pesar de que el árbol no presenta politomias pueden tener soportes bajos en los nodos o posiblemente porque CI es sensible a los caracteres que no aportan información. Cuando este índice es 1 (100%) no hay homoplasia, la calidad del árbol desciende a medida que lo hace el CI. Presenta una correlación negativa con el número de caracteres y taxones, es decir, mayor número de éstos implica menor CI. Por eso no es útil para comparar árboles diferentes entre sí. En ese sentido RI es mejor que CI, es alto cuando los cambios de estado ocurren predominantemente en los nodos internos y bajo cuando los cambios están concentrados en ramas pertenecientes a taxones terminales. El RI tiene la ventaja de que no es sensible a los caracteres no informativos, por eso no se observa dependencia de un cambio de este índice a causa del cambio de CFI o PI. Los análisis de estudio de combinación de caracteres combinados aun sigue en discusión (Wortley & Scotland, 2006), generando nuevas técnicas de análisis filogenético para que puedan ser utilizados En su aplicación más generalizada, la combinación de datos en estudios recientes han demostrado que la morfología pueden ser buenas o importantes. El presente trabajo muestran el efecto positivo de combinar caracteres, sin embargo, se recomienda adicionar una análisis de soportes para darle más sustento a esta hipótesis. BIBLIOGRAFIA EERNISSE, D.J. & KLUGE, A.G. 1993. Taxonomic congruence versus total evidence, and amniote phylogeny inferred from fossils, molecules, and morphology. Mol. Biol. Evol., 10(6):1170-1195. FARRIS, J. S., KÄLLERSJÖ, M., KLUGE, A. G. AND BULT, C. 1995. Constructing a significance test for incongruence. Syst. Biol. 44:570-572. GOLLOBOFF, P.A.,1993. Estimating carácter weights during tree search. Cladistics, 9:83-91. GOLOBOFF, P.A., FARRIS, J.S., NIXON, K.C. 2008. T.N.T. Tree analysis using new technology. Programa y documentación disponible en: http://www.zmuc.dk/public/phylogeny/TNT/. NIXON, K. C. 1999-2002. WinClada ver. 1.0000 Published by the author, Ithaca, NY, USA. PATTERSON, C. (1988). ‘‘Molecules and Morphology in Evolution: Conflict or Compromise?’’ Cambridge Univ. Press, Cambridge. PATTERSON, C., WILLIAMS, D. M., AND HUMPHRIES, C. J. (1993). Congruence between molecular and morphological phylogenies. Annu. Rev. Ecol. Syst. 24: 153–188. VARÓN, A., L. S. VINH., I. BOMASH AND WHEELER W. C. 2008. POY 4.0.2911. American Museum of Natural History. http://research.amnh.org/scicomp/projects/poy.php. WORTLEY, A & SCOTLAND R. 2006. The Effect of Combining Molecular andMorphological Data in Published Phylogenetic Analyses. Syst. Biol. 55(4): 677-685 Phyllodocidae Epiconidae Amblystegiaceae TABLA1. Datos obtenidos para el analisis de parsimonia. PI: numero de caracteres informativos de parsimonia, CI: Indice de consistencia), RI: índice de retención, CFI: índice de consenso retenido. ILD=0.031 E.T Gen1 Gen2 Gen3 Morfo ILD=0.065 E.T Gen1 Gen2 Gen3 Morfo ILD= 0.034 E.T Gen1 Gen2 Gen3 Morfo # caracteres 2103 474 668 1716 68 # caracteres 3978 2321 564 573 48 # caracteres 3225 1800 901 519 29 PI 348 47 19 324 27 PI 921 403 231 235 24 PI 361 75 139 146 19 PI% --11 5 78 6 PI% --45 26 26 3 PI% --20 37 38 5 Longitud 2832 396 226 982 73 Longitud 4936 1788 628 1539 73 Longitud 1449 332 549 525 51 CI 78 87 98 80 72 CI 76 93 94 67 72 CI 75 83 78 69 70 RI 63 76 90 77 62 RI 59 89 91 57 63 RI 48 51 57 46 69 CFI 0.6 0.87 0.62 1 0.5 CFI 0.88 1 1 1 0.75 CFI 1 0.88 1 1 1