Análisis filogenético del Virus de Inmunodeficiencia en Humanos (HIV) y en Simios (SIV) (Retroviridae) Castellanos, D., Chacón, A., Gómez, N., Sanabria, O. Resumen El virus HIV perece tener su origen en África central a partir de infecciones procedentes de cepas de SIV. El presente trabajo reconstruye la filogenia del virus a partir del genoma de 38 cepas HIV-1, HIV-2, SIV y FIV, realizando análisis Bayesiano, Parsimonia y Máxima Verosimilitud (ML) y. Las topologías halladas sustentan monófila del clado HIV-1, relacionado con el grupo SIVcpzptt, y del clado HIV-2 relacionado con el grupo SIVsmm. Algunas de las cepas del SIV revelan tasas significativas de cambio, mostrando una relación no cercana con las demás cepas del SIV. Introducción El HIV y SIV pertenecen a los lentivirus de la familia Retroviridae, que se caracteriza por codificar una polimerasa llamada transcriptasa inversa; el HIV es uno de los agentes patógenos con mayor tasa de variabilidad genética y con una alta capacidad de adaptación en su hospedero humano [1], esta diversidad se refleja en la existencia de diferentes grupos M, N y O [2], y hasta 32 especies recombinantes [3], cada uno de los cuales parece haber surgido de manera independiente en África central a partir de infecciones procedentes de cepas de SIV[4]. Se puede decir que el HIV es una de las entidades biológicas mejor estudiadas, lo que no implica, que todas las preguntas sobre su origen y evolución hayan sido resueltas en forma satisfactoria [5]. Este estudio pretende evaluar si SIV y HIV son grupos hermanos y las relaciones internas de los mismos utilizando datos moleculares. Metodología El análisis filogenético se realizó a partir de genomas completos de 35 cepas HIV-1, HIV2, SIV y tres taxas outgropus, las secuencias y los números de accesión se descargaron del GenBank (Tabla 1). Se aplicó un análisis de sensibilidad de las secuencia nucleotidicas con POY5 [6], para tres sets de costos diferentes (costo 1 = ts1tv1g1; costo 2 = ts1tv2g2, costo 3 = ts1tv2g4) y se determinó cual se ajustaba mejor a los datos según las tasas asignadas a transición, transversión y gaps. A continuación se seleccionó el costo más adecuado utilizando el índice de congruencia de Farris [7], posteriormente se realizó un análisis de parsimonia con TNT 1.1 [8], con un hold de 10000 y boostrap de 100. Adicionalmente se realizó el alineamiento de los datos moleculares con el programa SeaView 4 (opción Muscle) [9]; se determinó el modelo evolutivo para cada gen (gag, pol, vif, vpx, vpr, env, nef) y para el genoma completo mediante jModelTest 3.7 [10] bajo el criterio de Akaike (AIC). A continuación se realizó el análisis de Máxima Verosimilitud (ML) para el genoma, con una estrategia de búsqueda de la topología basada en algoritmos NNI y SPR, utilizando PhyML 3.0 [11]. El análisis Bayesiano fue realizado usando MrBayes 3.1.2, [12] por ocho millones de generaciones, con cuatro cadenas de Markov-Montecarlo bajo el algoritmo de Metropolis-Hasting (MCMC), esto para el genoma completo. Los árboles se visualizaron con el programa Figtree 1.2.2 [13]. Resultados y Discusión El mejor costo del análisis de sensibilidad se obtuvo con valores de ts1tv1g1 para los genes y el genoma. De acuerdo con del índice de incongruencia de Farris la interacción de costos óptimos presento un ILD=0,192 (Tabla 2). El modelo de sustitución nucleotídica obtenido con JModelTest fue GTR+G+I para cada gen y el genoma. Las estimaciones de las relaciones filogenéticas bajo el criterio de máxima verosimilitud (ML) para el genoma señalaron monofila para el grupo HIV1 y para el grupo HIV2, cada uno relacionado con SIVcpz y SIVsmm respectivamente (Figura 1). Los grupos de estudio bajo este análisis arrojan un buen soporte, con tazas evolutivas de cambio bajas: 0.339 para SIVcpz-HIV1 y 0.044 para SIVsmm-HIV2, lo cual es congruente con las teorías de evolución del virus según Sharp & Hahn [14], Charleston & Robertson [15], Wertheim & Worobey [16] y Lucie & Martine [17], evidenciando una variabilidad adecuada en las secuencias analizadas lo que permitió obtener una buena resolución en la topología de los taxones estudiados, congruente con los artículos anteriormente citados. El análisis de inferencia bayesiana para la evidencia total (Figura 2), representó una topología con un buen soporte de probabilidad posteriori en toda la filogenia; sin embargo, se presenta una politomía que disminuye el poder explicativo del cladograma, debido a que no permite dilucidar las relaciones de parentesco entre los grupos dentro de la politomía. Esto pudo deberse a un muestreo pobre a causa de la falta de poder computacional disponible para la resolución de dicha topología, por lo que no se relacionó debidamente la presencia de la variabilidad entre secuencias. La topología es el producto de un consenso de la mayoría para solucionar los conflictos entre los árboles disponibles en el programa. Sin embargo, los taxas terminales propias del grupo HIV1 relacionados con SIVcpz y el grupo HIV2 relacionados con el SIVsmm son consistentes respectivamente con los resultados obtenidos por Paraskevis et al [18] y Santiago et al [19]. El análisis de parsimonia realizado con TNT 1.1 se obtuvo un árbol consenso de longitud de 22239 pasos (Figura 3). Los valores de remuestreo de Bootstrap dan buen soporte en todos los nodos de la topología. Existe consistencia en las tres topologías halladas por parsimonia, máxima verosimilitud e inferencia bayesiana en cuanto a la monofilia del clado HIV1 el cual se encuentra relacionado con el grupo SIVcpzptt. La monofilia del clado HIV2 que está emparentado con el grupo SIVsmm está soportada en parsimonia y máxima verosimilitud. Conclusiones En la hipótesis del origen del HIV, propuesta por Sharp & Hahn [14], Charleston & Robertson [15], Wertheim & Worobey, [16], Lucie & Martine [17], Heeney et al. [22,] plantean al SIV como el origen del HIV, siendo el HIV producto de eventos de trasmisión de distintos SIV desde primates africanos no-humanos a humanos; el SIV de Pan troglodytes troglodytes dio lugar a los grupos M, N, y O del HIV1, por otra parte HIV2 surgió a partir de cepas del SIVsmm provenientes del primate no-humano Cercocebus sp [21]. Lo anterior plantea que el HIV y SIV no son grupos hermanos, esto se evidencia en las topologías halladas en los análisis de este estudio, en las cuales se encuentran taxas terminales correspondientes a algunas cepas de SIV que presentan tasas significativas de cambio, mostrando una relación no cercana con las demás cepas del SIV. Concluimos que el HIV es producto de la variabilidad, mutación y adaptación de SIV aun nuevo hospedero, el humano, esto se debe a la alta tasa mutacional presente en los genes de la cápside (gag), envoltura (env) y polimerasa inversa (pol) que causa la gran heterogeneidad del virus, pero aun así, los datos son insuficientes para proporcionar una conclusión confiable sobre ello. Recomendaciones Se recomienda el uso del programa TNT 1.1, para el análisis de parsimonia, debido a que es un programa con algoritmos de búsquedas de árboles muy rápido, con una extensiva capacidad de manejo y diagnosis del mismo [23]. Bibliografia 1. Requejo HI. 2006. Worldwide molecular epidemiology of HIV. Rev Saude Publica. 40(2): 331-45. 2. Kalish ML, Robbins KE, Pieniazek D & col. 2004. Recombinant viruses and early global VIH- epidemic. Emerging infectious diseases 10:1227-1234. 3. Kuiken C, Thakallapalli R, esklid A & de Ronde A. 2000. Genetic analysis reveals epidemiologic patterns in the spread of human immunodeficiency virus. Am J Epidemiol. 152(9): 814-22. 4. Nájera R, Delgado R, Pérez_Álvarez L & col. 2002. Genetic recombination and its role in the development of the VIH-1 pandemic. AIDS 16:S3-S16. 5. Carvajal A, Keith A. Crandal & Posada D. 2005.Caracterización y modelado computacional de la recombinación en secuencias de ADN en el virus del SIDA (VIH-1) Biojournal (2). 6. Varón A, Lucaroni, L. & Hong, W. 2011. POY 5.0.Black Sabbath Development build 6ed6dd92b5f3 R.C. New York, American Museum of Natural History. L. M. Crowley, M. Cevasco, J. S. S. Denton. 7. Farris J, Kallersjo M, Kluge, A. & Bult C. 1995. Constructing a significance test for incongruence. Syst. Biol. 44: 570-572. 8. A. Goloboff, Farris, & Nixon. 2008. Cladistics 24:774-786. 9. Gouy M, Guindon S, and Gascuel O. 2010. SeaView version 4: a multiplatform graphical user interface for sequence alignment and phylogenetic tree building. Mol. Biol. Evol. 27: 221-224. 10. Posada D. & Crandall K, 1998. Modeltest: testing the model of DNA substitution. Bioinformatics 14: 817-818 11. Guindon S. & Gascuel O., 2008. A simple, fast and accurate algorithm to estímate large phylogenies by maximun likelihood. Systematic Biology 52, 696-704. 12. Huelsenbeck J & Ronquist F. 2001. MrBayes v3.1.2: Bayesian inference of phylogeny. Bioinformatics 17: 754-755. 13. Rambaut, A. 2009. Tree Figure Drawing Tool. Versión 1.2.3. Institute of Evolutionary Biology, University of Edinburgh. 14. Sharp P. & Hahn B., 2011. Origins of HIV and the AIDS Pandemic. Cold Spring Harb Perspect Med 2011; doi: 10.1101/cshperspect.a006841 15. Charleston MA, Robertson DL. 2002.Preferential host switching by primate lentiviruses can account for phylogenetic similarity with the primate phylogeny. Syst Biol. 51 : 528-35. 16. Wertheim JO, Worobey M. 2007. A challenge to the ancient origin of SIVagm based on African green monkey mitochondrial genomes. PLoS Pathog. 17. Lucie E & Martine P, 2010, Origine du VIH, une réussite émergentielle, Institut de recherche pour le développement, Université de Montpellier, France, Virologie, 14 (3) : 171-8. 18. Paraskevis D., Lemey P., Salemi M., Suchard M., Van der Peer Y., & Vandamme M.2003, Analysis of the evolutionary relationships of HIV-1 and SIVcpz sequences using Bayesian inference: Implications for the origin of HIV-1. Society for Molecular Biology and Evolution. 19. Santiago M., Range F., Keele B., Li Y., Bailes E., Bibollet F., Fruteau C., Noe R., Peeters M., Brookfield J., Shaw G., Sharp P. and Hahn B. 2005. Simian Immunodeficiency Virus Infection in Free-Ranging Sooty Mangabeys (Cercocebus atys atys) from the Taı¨ Forest, Coˆte d’Ivoire: Implications for the Origin of Epidemic Human Immunodeficiency Virus Type 2. Journal of virology, Oct. p. 12515–12527, 20. Alcamí J. 2004, Avances en la inmunopatología de la infección por el VIH. Unidad de Inmunopatología del Sida. Centro Nacional de Microbiología. Instituto de Salud Carlos III. Majadahonda. Madrid. España.22(8):486-96 21.Wertheim JO, Worobey M. 2009. Dating the Age of the SIV Lineages That Gave Rise to HIV-1 and HIV-2. PLoS Comput Biol 5. 22. Heeney. J, Dalgleish. A, Weiss. R, 2006. Origins of HIV and the Evolution of Resistance to AIDS. DOI: 10.1126/science.1123016 Science 313, 462. 23. Goloboff, 1999, Cladistics 15:407-428 Anexos Tablas Código de accesión EU117991.1* Secuencia FIV EU117991.1 Pantera leo FIV EF455614 Puma concolor FIV U56928 Felis manul Abreviatura outgroupa Año 2008 Ubicación geográfica Congo, Zambia, Angola y Sudáfrica outgroupc 2008 América outgroupb 1997 HIV1 AB485633 Ghana HIV1 AY271690 Cameroon HIV1 AJ866555 Cote d'Ivoire HIV1 AY322190 Kenya HIV1 AF197341 Central African HIV1 AF069671 Uganda HIV1 AF361873 Tanzania HIV1 AJ251057 Senegal HIV1 FM877778 Republica democratica SIV HQ378594.1 Chlorocebus sabaeus HIV1Ghana 2006 Entre los 1000 y 4000 metros en Irán, India, Pakistán, Afganistán, China y Mongolia. Ghana HIV1Cameroon 2003 Camerón HIV1CotedIvoire 2005 Cote d´Ivoire HIV1Kenya 2004 Kenya HIV1Central África HIV1Uganda 2002 África Central 2000 Uganda HIV1Tanzania 2001 Tanzania HIV1Senegal 2006 Senegal HIV1 Repubdemocr 2009 República democrática SIVChlorosab a 2011 África subsahariana (desde Senegal: Sudáfrica) M66437.1 SIV_M66437.1 Chlorocebus sabaeus SIVChlorosab b 2008 África subsahariana (desde Senegal: Sudáfrica) M58410.1 SIV M58410.1 Chlorocebus sabaeus SIV AY159322.1 Mandrillus sphinx SIV Chlorosab c 1991 África subsahariana (desde Senegal: Sudáfrica) SIV Mandrillus sphi SIV Mandrileuc 2006 Oeste de África , desde Guinea Ecuatorial al Congo Camerún, Nigeria y Guinea Ecuatorial SIVPantroglo a 2003 África central, Sudán, Tanzania, Zambia, Uganda y R. del Congo. SIV Pantroglo b 2011 Gabón, Guinea y R. del Congo. SIV Pantrogl c 2005 Gabón, Guinea y R. del Congo. EF455614* U56928* AB231898 AY271690 AJ866555 AY322190 AF197341 AF069671 AF361873 AJ251057 FM877778 HQ378594.1 AY159322.1 AY159321.1 SIV AF447763.1 FR686510.1 X52154.1 SIV AY159321.1 Mandrillus leucophaeus SIV AF447763.1 Pan troglodytes schweinfurthii SIV FR686510.1 Pan troglodytes troglodytes SIV X52154.1 Pan troglodytes troglodytes 2006 SIV AF103818.1 Pan troglodytes troglodytes SIV FM165200.1 Procolobus verus SIV Pantrogl d 1999 Gabón, Guinea y R. del Congo. SIV Procoverus 2010 SIV AF301156.1 Colobus guereza SIV M19499.1 Macaca mulatta SIV Colobgue 2001 SIVMaccamul 2000 Costa de Marfil, Ghana, Guinea, Liberia, Nigeria y Sierra Leona. África oriental y central, Etiopía, Tanzania, Nigeria, Zambia y Chad. Etiopía SIV L06042.1 Cercopithecus mitis SIV U58991.1 Cercopithecus tantalus SIVCercopi a 2000 SIVCercopi b 2005 HM803689.1 SIV HM803689.1 Cercocebus torquatus SIV Cercopi c 2010 NC001549 SIV NC001549.1 Cercopithecus aethiops SIV FR751162.1 Cercopithecus solatus SIV AF075269.1 Cercopithecus l'hoesti SIV Cercopi d 2009 SIVCercopi e 2011 Selva humedad en Gabón SIV Cercopi f 1999 Uganda, Burundi, Ruanda y el Congo HIV2 M30502 Mali HIV2 X52223 Gambia HIV2 J04542 Ghana HIV2 D00835 Guinea Bissau HIV2 AF208027 Cote d`Ivoire HIV2 EU028345 Camerón HIV2 M15390 Senegal HIV2 U27200.1 Costa de marfil HIV2 Mali HIV2 Gambia 2002 2005 Mali Gambia HIV2 Ghana HIV2 GuiBiss 2000 2007 Ghana Guinea Bissau HIV2 CotdIvoi 2000 Cote d` Ivoire HIV2 Camero 2008 Camerón HIV2 Senegal 1996 Senegal HIV2 Costmarf 1995 Costa de Marfil AF103818.1 FM165200.1 SIV AF301156.1 M19499.1 L06042.1 U58991.1 FR751162.1 AF075269.1 M30502 X52223 J04542 D00835 AF208027 EU028345 M15390 U27200.1 Entre el Valle del Rift y río Congo hasta Angola y Zambia. Ghana, Sudan y Kenia. Camerún, R.D.Congo, Costa de Marfil, Guinea, Gabón , Ghana, Nigeria, Senegal y Sierra Le África subsahariana (desde Senegal: Sudáfrica) Tabla 1. Listado de cepas con sus respectivas abreviaturas y números de accesión para los genomas usados en el presente estudio. Las especies marcadas con asterisco (*) fueron consideradas como outgroup. Costos ET Env Gap Pol Vif Vpx Vpr Nef,Tat,Env ILD 111-111-1 66028 1737 9 8965 1616 2 107 2 201 0 206 9 5689 0,19207003 122-1222 10589 0 2764 1 1387 5 2457 9 175 3 329 2 335 5 9199 0,20961375 124-1244 13289 4 3320 2 1644 7 2766 6 217 0 421 5 407 8 11486 0,25305883 Tabla 2. Índice de incongruencia de Farris (ILD) para con los tres sets de costos asignados a los Genes Env, Gap, Pol, Vif, Vpx, Vpr respectivamente. Se resalta el valor de ILD óptimo. Ilustraciones Figura 3. Filogenia de lentivirus. Mostrando las relaciones evolutivas en las secuencias genómicas de HIV y SIV derivados de varios huéspedes primates; El grupo externos son miembros de la familia felidae y están con los siguientes nombres: “Outpantera”, “Outfelis” y “Outpuma”. Los virus de la cepa SIVcpz están señalados con azul, los virus de la cepa SIVsmm con rojo. Este árbol fue estimado usando el método de parsimonia. Figura 2. Filogenia de lentivirus. Mostrando las relaciones evolutivas en las secuencias genómicas de HIV y SIV derivados de varios huéspedes primates; El grupo externo son miembros de la familia felidae y están con los siguientes nombres: “Outpantera”, “Outfelis” y “Outpuma”. Los virus de la cepa SIVcpz están señalados con azul, los virus de la cepa SIVsmm con rojo. Este árbol fue estimado usando el método de inferencia bayesiana. Figura 1. Filogenia de lentivirus. Mostrando las relaciones evolutivas en las secuencias genómicas de HIV y SIV derivados de varios huéspedes primates; El grupo externo son miembros de la familia felidae y están con los siguientes nombres: “Outpantera”, “Outfelis” y “Outpuma”. Los virus de la cepa SIVcpz están señalados con azul, los virus de la cepa SIVsmm con rojo. Este árbol fue estimado usando el método de máxima verosimilitud (ML).