USO DEL PAQUETE ESTADÍSTICO SIMFIT EN QUÍMICA FÍSICA Y TÉCNICAS INSTRUMENTALES F. J. Burguillo1 y W. G. Bardsley2 1 Dpto. de Química Física, Fac. de Farmacia, Universidad de Salamanca (España), e-mail: burgui@usal.es 2 School of Biological Sciences, University of Manchester (U. K.), e-mail: bill.bardsley@man.ac.uk En esta comunicación se sugiere el uso del paquete estadístico SIMFIT para la enseñanza del análisis de datos en los laboratorios de Química Física y Técnicas Instrumentales, así como para el diseño de experimentos y tratamiento de datos en la investigación de estas disciplinas. Se expondrán primero las características generales del programa, sus tipos de gráficos, ajustes de regresión lineal y no lineal, integración de ecuaciones diferenciales...etc, para luego pasar a describir las posibles aplicaciones del paquete en Química Física a través de algunos ejemplos de laboratorio. SIMFIT ha sido desarrollado por uno de nosotros (W.G. Bardsley), es totalmente compatible con Windows 95/98/2000/Me/XP y se encuentra disponible en español en la dirección http://simfit.usal.es. Introducción Con la popularización de los ordenadores personales, las técnicas de análisis de datos y modelización matemática se han convertido en uno de los aspectos más interesantes en la enseñanza de la Química Física (1-4). Algunos autores han propuesto usar hojas de calculo tipo Excel (1), otros han defendido las ventajas de programas matemáticos como Mathcad (2) o Mathematica (3) y sólo alguno ha sugerido el uso programas de análisis de datos tipo KaleidaGraph, Origin o SPSS (4). Sin embargo, la pregunta acerca de cuál de estas estrategias es la más adecuada no es de fácil respuesta y harán falta estudios comparativos que analicen las ventajas e inconvenientes de cada método, sobre todo en cuanto a su rendimiento con alumnos con poca preparación en estadística e informática. Características del Paquete Estadístico SIMFIT Tiene editores para introducir los datos desde el teclado, pero también se pueden importar desde hojas de calculo como Excel a través del portapapeles. Puede hacer diferentes tipos de gráficas: representaciones normales, histogramas, diagramas de barras y de sectores, gráficas 3D...etc. En ellas es posible asignar diferentes tamaños y colores a todos los objetos. Dispone de programas en formato amigable que ajustan tanto ecuaciones lineales (línea recta, polinomios) como no lineales (exponenciales, Michaelis-Menten, cocientes de polinomios...). Los propios programas calculan las estimas iniciales, ajustan en secuencia diferentes modelos dentro de la jerarquía elegida (por ej.: una exponencial, dos exponenciales...) y determinan en cada caso la bondad del ajuste (residuales, r2, test F, límites de confianza de los parámetros...). Con esta información, el usuario puede discriminar entre posibles modelos rivales y quedarse con el que cumpla el mayor número de requisitos estadísticos. Superpone en una sola gráfica los datos y las curvas ajustadas, por lo que resulta fácil comparar visualmente los diferentes ajustes. Esta superposición puede hacerse tanto en el espacio directo como en otros tipos de representación (logarítmica, doble inversa, Scatchard, Hill...). Si la ecuación a ajustar no está disponible en la librería de SIMFIT, el usuario puede definir su propia ecuación mediante reglas sencillas y luego ajustarla a sus datos mediante un módulo general de optimización (QNFIT). Incluye todas las pruebas estadísticas habituales: estadística descriptiva de una muestra, comparación de medias, ANOVA, Mann-Whitney, correlaciones de Pearson...etc. 1 Posibles aplicaciones de SIMFIT en Química Física y Técnicas Instrumentales Curvas de calibrado y predicción inversa. Existen en SIMFIT diferentes posibilidades para ajustar curvas con fines de calibración, entre ellas el ajuste a una línea recta o a polinomios de distinto grado por regresión lineal. En cualquier caso, el programa superpone a la curva de ajuste las bandas de confianza al 95% y hace predicción inversa (obtención de x a partir de y) con sus límites de confianza al 95%. Estas horquillas de confianza permiten al investigador no sólo conocer la concentración de una sustancia en una muestra sino estimar también la precisión del análisis. En la Figura 1 se presenta el calibrado de una sustancia cualquiera, donde el ajuste se ha realizado por regresión lineal con pesos estadísticos (wi =1/si) basados en las Fig. 1: Curva de calibrado desviaciones estándar (si) calculadas de réplicas. Determinación de velocidades iniciales, tiempos de latencia y asíntotas. La medida de estas magnitudes es un problema habitual en muchas investigaciones cinéticas, para ello SIMFIT dispone de un módulo específico (INRATE) que ajusta la ecuación seleccionada por el usuario y hace un análisis de la misma para estimar analíticamente la velocidad inicial y la asíntota. Ajuste a funciones exponenciales en sistemas cinéticos. El uso de monoexponenciales, biexponenciales...etc, es muy frecuente en la interpretación de muchos fenómenos cinéticos (reacciones de orden 1, reacciones consecutivas, farmacocinética compartimental...). SIMFIT contempla la posibilidad de ajustar diferentes tipos de exponenciales, tanto decrecientes como crecientes y siempre con la opción de ajustar una suma de exponenciales hasta el grado deseado. Estos ajustes se realizan siempre por regresión no lineal a la función directa y nunca por regresión lineal a sus posibles transformaciones lineales (por ej. la linealización logarítmica de una monoexponencial). La razón es conocida, se basa en que al hacer una transformación lineal cambian los pesos estadísticos a considerar con la variable dependiente, precaución que no suele ser tenida en cuenta y que, además, no es necesaria cuando se ajusta la función directa por regresión no lineal. En la Figura 2 se muestra el ajuste consecutivo de 1 y 2 exponenciales a unos datos y, como inserto, a efectos ilustrativos tradicionales, se incluye la representación semilogarítmica. En este caso, la estadística asociada al ajusta concluye que el ajuste a Fig. 2: Ajuste de exponenciales 2 exponenciales es mejor que el de 1 exponencial. Equilibrios de unión de ligandos a macromoléculas. Este tipo de equilibrios se puede abordar en SIMFIT con dos módulos, uno para el caso de sitios idénticos cooperativos (SFFIT) y otro para el caso de sitios diferentes de alta y baja afinidad (HLFIT). Si nuestro caso fuese el de una macromolécula con 2 sitios de unión, nuestra investigación debería ir encaminada a distinguir si los dos sitios son independientes (grado 1, una sola K de equilibrio) o son cooperativos (grado 2, hay una K1 y una K2 de equilibrio). Para ello SIMFIT realiza los respectivos ajustes y hace un análisis completo de la cooperatividad, a la vez que nos ofrece los resultados bajo diferentes representaciones: directa, Scatchard y Hill. Cinética enzimática michaeliana y no-michaeliana. Existen en el paquete dos módulos con este objetivo; uno sencillo (MMFIT), que ajusta suma de ecuaciones de Michaelis Menten a unos datos v-[S] y proporciona las distintas Vmax y Km y las representaciones habituales (directa, LineweaverBurk, Eadie-Hofstee), y otro más avanzado (RFFIT) que ajusta cocientes de polinomios de distinto grado en [S] a datos v-[S], que es el formalismo general de las cinéticas no michaelianas. 2 Ajustes a ecuaciones con más de una variable. En muchos estudios puede ser necesario estudiar la influencia de 2 variables independientes sobre una dependiente, como ocurre por ejemplo en el estudio de las inhibiciones enzimáticas, en las que las ecuaciones de velocidad son del tipo v=f([S],[I]). Estos experimentos se suelen hacer variando la concentración de sustrato a distintas concentraciones fijas de inhibidor, para luego analizar las series de datos individualmente y encontrar el tipo de inhibición. Una vez hecho esto, se podría hacer un ajuste de la matriz de datos completa (v,[S],[I]) a la superficie dada por la respectiva ecuación v=f([S],[I]). Así, la Figura 3, recoge el ajuste de la ecuación de una ihibición no competitiva a unos datos cinéticos, mostrándose la superficie de ajuste pero omitiéndose los valores Fig. 3: Ajuste de una superficie encontrados para Km, KI y Vmax. Sistemas dinámicos en ecuaciones diferenciales. Existe en SIMFIT un módulo especial (DEQSOL) para simular por integración sistemas de ecuaciones diferenciales ordinarias. Incluye una colección con diferentes modelos dinámicos de “n” variables, tales como mecanismos de reacción, dinámica de poblaciones...etc. A modo de ejemplo, la Figura 4 muestra la integración de las reacciones consecutivas A > B > C reversibles. El propio usuario puede cambiar interactivamente el valor de los parámetros de las ecuaciones, el intervalo de integración...etc, por lo que las posibilidades de simulación son numerosas y muy instructivas. Con fines de investigación, se podría suministrar también al programa una serie de datos experimentales y ajustarlos con un sistema de ecuaciones diferenciales Fig. 4: Simulación de ecuaciones diferenciales de la librería de SIMFIT o definido por el usuario. Simulación de experimentos. El paquete permite simular todo tipo de ecuaciones algebráicas de una o varias variables, por lo que resulta muy valioso a la hora diseñar experimentos, validar modelos o como simulador a efectos didácticos. La filosofía es simple, primero se simulan datos exactos y luego se perturban con errores al azar para mimetizar la situación experimental. Estadística descriptiva y tests estadísticos. En cualquier laboratorio es frecuente realizar medidas que fluctuan ligeramente debido al azar, por lo que una tarea habitual es encontrar el valor medio, la desviación estándar, representar los datos en forma de histograma, ajustarlos a una distribución normal....etc. SIMFIT puede hacer todo este tipo de cálculos y representaciones (Figura 5). Así mismo, el investigador puede realizar los tests estadísticos habituales, como el test “t” de comparación de medias, ANOVA, Mann-Whitney, ji-cuadrado, series temporales, conglomerados...etc. Fig. 5: Histograma y curvas de probabilidad (1) Harris, D.C. “Nonlinear Least-Squares Curve Fitting with Microsoft Excel Solver”. J. Chem. Educ. 1998, 75, 119-121. (2) Zielinski, T.J. “Symbolic Software in the Chemistry Curriculum”. J. Chem. Educ. 2000, 77, 668-670. (3) Ferreira, M.M.C.; Ferreira Jr., W.C., Lino, C.S. and Porto, M.E.G. “Uncovering Oscillations, Complexity and Chaos in Chemical Kinetics Using Mathematica”. J. Chem. Educ. 1999, 76, 861. (4) Tellinghuisen, J. “Nonlinear Least-Squares Using Microcomputer Data Analysis Programs”. J. Chem. Educ. 2000, 77, 1233-1239. 3