Revista Cubana de Medicina Intensiva y Emergencias Rev Cub Med Int Emerg 2003;2(55-61) TRABAJOS ORIGINALES Unidades de Cuidados Intensivos Hospital Militar Central “Dr. Luis Díaz Soto” Utilización del Modelo de Probabilidad de Mortalidad II (MPM II) en un grupo de pacientes críticos. Dr. Fernando Fernández Reverón,1 Dr. Armando Padrón Sánchez,2 Dr. Andrés Quiñónez Zamora3 y Dr. Ernesto Chávez Pérez.3 RESUMEN Se realizó un estudio descriptivo y transversal en el Servicio de Urgencias del Hospital Militar Central “Dr. Luis Díaz Soto” con 251 pacientes ingresados. Objetivo: Evaluar los resultados en la validación del modelo de predicción de la mortalidad II (MPM II). Se computó el MPM II y la evolución de los pacientes fue seguida hasta el alta. El análisis estadístico incluyó índices de calibración (prueba de bondad de ajuste), discriminación (área bajo la curva de las características operativas del receptor, COR). Resultados: El modelo de admisión en la muestra de validación estaba mal calibrado (prueba de bondad de ajuste con P = <0,048), pero con una discriminación adecuada (área bajo la curva de COR = 0,715). El modelo aplicado a las 24 horas resultó igualmente mal calibrado (p = 0,040), pero con una buena discriminación (área bajo la curva de COR = 0,897). Conclusiones: La discriminación, y especialmente la calibración del modelo, son pobres en este medio, por lo que su aplicación no resulta fiable. Palabras claves: predicción, métodos; pronóstico, mortalidad; unidades de terapia intensiva. 1 Especialista de II Grado en Pediatría y en Medicina Intensiva y Emergencias. Profesor Titular. 2 Especialista de I Grado en Medicina Interna. Diplomado en Medicina Intensiva. Instructor. 3 Especialista de I Grado en Medicina General Integral. Diplomado en Medicina Intensiva. INTRODUCCIÓN Uno de los dilemas más trascendentales que enfrenta el médico intensivista contemporáneo es cuándo decidir el ingreso de un paciente en la UCI1-5 y una vez ingresado y tratado con una serie de técnicas de soporte vital, si la evolución no resulta satisfactoria, por cuánto tiempo mantenerlas.6, 7- 9 Tales decisiones poseen importantes implicaciones éticas, pues rebasado cierto límite, la beneficencia que se busca puede transformarse en maleficencia al someter al paciente a un largo, doloroso y costoso proceso de morir.10–13 Los sistemas marcadores para calibrar la gravedad de la afección en el paciente críticamente enfermo se crearon como un 55 mecanismo para evaluar sistemáticamente la calidad y efectividad de la asistencia en las UCI, por cuanto proporcionan una estimación “objetiva” de la mortalidad hospitalaria en los pacientes ingresados. Este pronóstico calculado ha sido usado como “regla de oro” para evaluar el rendimiento de las UCI en dependencia del grado de desviación del resultado obtenido sobre esa base.14 El empleo de estos sistemas se ha extendido también a las investigaciones clínicas, ya que por medio de ellos los pacientes pueden ser estratificados según la gravedad de su padecimiento, con lo cual se ha mejorado el escenario para el análisis comparativo de los tratamientos intensivos, la calidad del servicio y probablemente la decisión clínica. El MPM II (Mortality Probability Model) dado a conocer en 1993 por Stanley Lemeshow, se derivó de técnicas estadísticas univariadas y múltiples de regresión logística para reducir las numerosas características de los pacientes a pocas variables estrechamente relacionadas, clínica y estadísticamente, con el estado al egreso.15 Con el objetivo de precisar la aplicabilidad de este sistema en el hospital, así como las variaciones y peculiaridades que presenta en la UCI, se decidió llevar a efecto el presente trabajo. MATERIAL Y MÉTODOS Se hizo un estudio descriptivo y transversal sobre el sistema de valoración pronóstica MPM II en 251 pacientes críticos, ingresados consecutivamente en el Servicio de Cuidados Intensivos Emergentes y Cuidados Intensivos de Adultos del Hospital Militar Central Dr. Luis Díaz Soto desde Agosto del 2001 hasta Diciembre del 2001. Se fijó como condición básica la valoración previa del paciente a su ingreso por un intensivista, basado en el criterio de recuperabilidad y con independencia de la edad, afección o gravedad del cuadro clínico. El MPM II se realizó según los criterios establecidos por sus autores al ingreso de los pacientes y a las 24 horas de estadía en la UCI y se relacionó con el estado al egreso (vivo o fallecido). Fue aplicado mediante un programa de computación elaborado con el programa Excel del paquete Microsoft Office XP. La prueba de bondad de ajuste se utilizó para evaluar la calibración del sistema. Se asociaron la mortalidad pronosticada y la real para tratar de establecer su valor predictivo. Con los resultados de la sensibilidad de la prueba y del rango de falsos positivos (1especificidad) se construyó la curva de COR (características operativas del receptor) correspondiente para evaluar la discriminación del sistema. Como medida de discriminación se utilizó el área bajo esta curva. Se empleó el nivel de significación p > 0,05, o sea, cuando p superaba e valor de 0,05, se interpretaba como no significativo, por lo que se infería que no había diferencias significativas entre lo observado y lo esperado. RESULTADOS Los datos para la validación del sistema pronóstico MPM II se obtuvieron de 251 pacientes como se muestra en la tabla # 1, de los cuales permanecieron ingresados 244 en la UCI después de las primeras 24 horas. La mortalidad general fue de 21,09 %. Aproximadamente 70 % de los integrantes de la serie tenían edades entre 20 y 59 años, con valores extremos de 16 y 80; hubo predominio del sexo masculino, y si bien más del 50 % de ellos provino de la 56 Unidad de Cuidados Intensivos de Emergencia (UCIE), cerca de 20 % lo hizo del Servicio de Cirugía General. Tabla # 1. Características generales de la muestra Número de pacientes 251 Edad promedio (en años) - Vivos 51,97 años - Fallecidos 58,14 años Sexo - Masculino 157 (62 %) - Femenino 94 (38 %) Estado al egreso - Vivos 196 - Fallecidos 55 (21,09 %) Tabla # 2: Supervivientes y defunciones observadas y esperadas según el índice MPM II0 por deciles de riesgo. Probabilidad de Supervivientes Defunciones morir Observado Esperado Observado Esperado ≤0,050 40 44,6 1 1,0 >0,050-0,079 35 34,5 1 1,0 >0,079-0,108 19 26,8 2 1.0 >0,108-0,137 24 21,7 2 4,7 >0,137-0,174 25 17,8 3 8,2 >0,174-0,236 18 15,3 5 9,6 >0,236-0,327 16 10,8 7 2,8 >0,327-0,470 11 10,8 9 11,6 >0,470-0,678 6 3,4 10 16,1 >0,678-1,000 2 3,8 15 12,4 Ĉ = 14,9 (p = 0,048) Ĉ = estadístico de Hosmer - Lemeshow En las tablas # 2 y 3, donde se comparan el número de sobrevivientes y no sobrevivientes observados con lo esperado en cada estrato de riesgo respecto al MPM0 y el MPM24, se encontró poca homogeneidad, reveladora de que la valoración basada en el modelo fue inferior al número de muertes observado. El cálculo de la prueba de bondad de ajuste mostró que dicho modelo (MPM) no permite valorar adecuadamente la probabilidad de muerte hospitalaria en este grupo de pacientes (p < 0,03) ni al ingreso ni a las a las 24 horas, aunque se debe señalar que a las 24 horas (MPM24), los valores de la calibración y discriminación fueron mejores. La tabla # 4 representa los valores numéricos de las pruebas así como una representación cualitativa de las mediciones de la escala predictiva estudiada. Un valor p < 0,05 representa un modelo que no se ajusta, o sea, que existe una variación inaceptablemente grande entre los resultados observados y los esperados. 57 Tabla # 3: Supervivientes y defunciones observadas y esperadas según el índice MPM II24 por deciles de riesgo. Probabilidad de Supervivientes Defunciones morir Observado Esperado Observado Esperado ≤0,037 41 41,5 1 1,0 >0,037-0,061 33 34,5 1 1,0 >0,061-0,087 29 28,8 1 1.0 >0,087-0,117 24 24,7 2 4,7 >0,117-0,162 21 19,8 5 8,2 >0,162-0,228 17 23,3 6 9,6 >0,228-0,313 11 10,8 6 9,8 >0,313-0,466 9 7,8 9 11,6 >0,466-0,711 8 3,4 11 16,1 >0,711-1,000 3 6,8 13 11,4 Ĉ = 9,9 (p = 0,040) Ĉ = estadístico de Hosmer - Lemeshow Tabla # 4: Comparación de predicción cualitativa y cuantitativa de la calibración y la discriminación del modelo MPM realizada en los 251 pacientes a las 0 y a las 24 horas. Modelo Calibración Discriminación predictivo ĉ p Sens. Espec. ABC MPM0 14,9 0,048 59,78 87,90 0,715 MPM24 9,9 0,040 91,12 0,897 0 horas de ingreso. MPM0 24 horas de ingreso. MPM24 79,80 ++ + +++ ++ ĉ = estadístico Chi cuadrado de Hosmer - Lemeshow. p = significación estadística, Sens = sensibilidad, Espec = especificidad, ABC = área bajo la cura COR. DISCUSIÓN El comportamiento de un modelo estadístico puede ser evaluado examinando la exactitud de las probabilidades que genera. La calibración compara el número estimado de defunciones según la probabilidad de morir con el número real observado, por grupos de pacientes. Dicho de otra forma, si tenemos 100 58 pacientes con probabilidad de morir del 25 % ¿mueren aproximadamente 25 pacientes? Si no es así, el modelo no está bien calibrado. Posibles causas de una calibración deficiente pueden ser una composición de pacientes no usual, o un comportamiento diferente en la UCI con respecto a las UCI del modelo orignal. También puede darse el caso de que el modelo utilizado no sea el adecuado. La prueba estadística que evalúa la calibración es la de Hosmer-Lemeshow, que compara el número de defunciones y de supervivencia esperadas y observadas por deciles de riesgo.6, 8, 10,12 La discriminación evalúa en que grado el modelo distingue a los pacientes que sobreviven de los que mueren. Como medida de discriminación se utiliza el área bajo la curva de características operativas del receptor (COR) que representa, para todos los pares posibles formados por un paciente superviviente y un paciente muerto, la proporción en la que el paciente que murió tenía un riesgo de muerte superior, según el modelo, con respecto a los pacientes supervivientes. Si el área bajo la curva COR vale 0,5 el modelo no se comporta mejor que el lanzamiento de una moneda. A partir de 0,7 el modelo se considera aceptable. Cuando se realiza una validación por parte de un grupo diferente de investigadores o en un grupo diferente de pacientes, los resultados rara vez son tan buenos como los del informe original, ya que es difícil duplicar exactamente los métodos originalmente desarrollados; además, los nuevos pronósticos incluyen variaciones naturales (ruidos) que no aparecen en el estudio inicial.14-16 Semejante a lo encontrado en nuestra serie, en los últimos años diversos trabajos relacionados con los modelos de pronóstico generales han mostrado un patrón similar: una buena discriminación con una pobre calibración; este patrón se ha observado en distintos marcos y con disímiles modelos.8–12 A pesar de las innumerables ventajas que reporta este modelo: resultar menos sensible al sesgo de tiempo de avance y a la selección, necesitar un mínimo de pruebas de laboratorio, no requerir un diagnóstico único, no producir una puntuación sino una probabilidad directa y tener un componente importante para la valoración de la calidad de la asistencia en la UCI, al ser independiente del tratamiento en esta. Concluimos que el MPM II no es aplicable en nuestras unidades sin reajustar previamente el peso asignado a cada variable adaptándose mediante el método de regresión logística17-19, a partir de los datos observados en un grupo amplio de pacientes. Una vez adaptado el modelo es preciso evaluar de nuevo su calibración. REFERENCIAS BIBLIOGRÁFICAS 1. Schuster DP. Predicting outcome after ICU admission. Chest 1992; 102 (6):1861-70. 59 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. Vega Stteb J. Medical Intensive Care Unit: admission and mortality. Rev Med Chile 1988; 116(10):1034-40. Zimmerman, JE, Wagner, DP, Draper, EA, et al. Evaluation of acute physiology and chronic health evaluation III predictions of hospital mortality in an independent database. Crit Care Med 1998; 26:1317. Le Gall, JR, Lemeshow, S, Saulnier, F. A new simplified acute physiology score (SAPS II) based on a European/North American multicenter study. JAMA 1999; 270:2957. Auriant, I, Vinatier, I, Thaler, F, et al. Simplified acute physiology score II for measuring severity of illness in intermediate care units. Crit Care Med 2000; 26:1368. Lemeshow, S, Teres, D, Klar, J, et al. Mortality probability models (MPM II) based on an international cohort of intensive care unit patients. JAMA 1993; 270:2478. Teres D, Lemeshow S. Using severity measures to describe high performance intensive care unit. Crit Care Clin 1999; 9 (3): 543-54. Knaus WA, Wagner DP, Draper EA. The APACHE III prognostic system. Risk prediction of hospital mortality for critically ill hospitalized adults. Chest 1991; 100:1619-36. Zimmerman JE, Wagner DP, Draper EA, Wright L, Aizola C, Knaus WA. Evaluation of APACHE III predictions of hospital mortality in an independent database. Crit Care Med 1998; 26:1317-26. Le Gall JR, Lemeshow S, Saulnier F. A new simplified acute physiology score (SAPS II) based on a European/North American multicenter study. JAMA 1998; 270:2959-63. Teres D, Lemeshow S, Haris D. Mortality prediction model (MPM) for ICU patients. Probl Crit Care 1998; 3:585. Lemeshow S. Mortality probability model (MPM II) based on an international cohort of ICUS patients. JAMA 1999; 270 (20): 2478-86. Metnitz PG, Valentin A, Vesely H. Prognostic performance and customization of the SAPS II: results of a multicenter australian study. Intens Care Med 1999;25:192-7. Moreno R, Morais P. Outcome prediction in intensive care: results of a prospective and multicenter portuguese study. Intens Care Med 2000; 23:17786. Nouira S, Belghith M, Elatrous S. Predictive value of severity scoring systems: comparison of four models in tunisian adult intensive care units. Crit Care Med 1998; 26:852-9. Zimmerman, JE, Wagner, DP, Knaus, WA, et al. The use of risk predictions to identify candidates for intermediate care units: Implications for intensive care utilization and cost. Chest 1995; 108:490. Li, T, Phillips, M, et al. On-site physician staffing in a community hospital intensive care unit. Crit Care Med 1994; 252:2023. Brown, JJ, Sullivan, GS. Effect on ICU mortality of a full-time critical care specialist. Chest 1999; 9:127. 60 19. Moreno R, Reis Miranda D, Fidler V, Van Schilfgaarde R. Evaluation of two outcome predictors on an independent database. Crit Care Med 1998;26:5061. 61