[Index FAC] [Index CCVC] Bioingeniería e Informática M édica/Bioengineering- Medical Informatics Curso: Bioestadística básica para m édicos asistenciales Clase Nº 6: Hipótesis de Trabajo Ra úl E. Ortego, Carlos R. Secotaro Index curso - Clase anterior - Clase siguiente Podríamos comenzar parafraseando a Shakespeare, ya que trataremos de responder a una pregunta esencial: ¿Será diferente o NO será (parece) diferente?. Hemos aceptado que estudiamos un universo aleatorio y que las técnicas utilizadas para proyectar e inferir trabajan con fracciones de las poblaciones denominadas "muestras". La definición de una fracción de la población como "muestra" implica como condición sine qua non que los valores de la variable de la población incluídos en tal fracción hayan sido incorporados rigurosamente por azar. Hemos comprendido en el análisis del Error Standard, que el "muestreo" supone la consecuencia de que las muestras tienen diferentes funciones estadísticas (promedios, desvíos, etc) que la población de origen y aún entre ellas mismas. Muestras de la misma población son "funcionalmente" diferentes entre sí. Este concepto es primordial en la interpretación de los datos estadísticos. En efecto, las comparaciones en biología, como discutíamos en los primeros capítulos, procuran averiguar, cambiando circunstancias en una muestra, si se producen modificaciones en las funciones estadísticas de la misma, modificaciones "de fondo", modificaciones "significativas". Si se modifican de manera significativa las funciones estadísticas de la muestra, se concluirá que las circunstancias operativas han cambiado a la población de referencia. Analizemos un ejemplo de lo expuesto: 1. 2. 3. Los pacientes Diabéticos sin control estricto de la glucemia, como población, est án caracterizados por determinados indicadores de complicaciones microvasculares en retina, riñón, etc. Los pacientes diabéticos con control estricto de la glucemia están caracterizados por diferentes (menores) índices de tales complicaciones. Controlar estrictamente la glucemia ha determinado que exista una nueva población de pacientes diabéticos con características (expresadas por las funciones estadísticas) significativamente diferentes de la población de diab éticos que no tienen esa circunstancia del control estricto de la glucemia. Repitamos un concepto que expusimos a propósito de introducirnos en la Estadística Inferencial: se analizan las funciones estadísticas de las muestras para procurar saber (inferir), si esas muestras provienen o no de la misma población. Si la circunstancia estudiada modifica características funcionales (los parámetros) de la población, significa que en realidad ha cambiado la población de referencia, ya que los parámetros son esencialmente constantes para cada población. La estadística trabaja habitualmente con estadígrafos (funciones de muestras) y a partir de ellos proyecta y/o infiere parámetros (funciones de poblaci ón). De la discusión previa sugerimos recordar que en las comparaciones estadísticas la diferencia entre muestras es la regla. Hipótesis sobre el significado de la diferencias 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology El tema es darle un significado a las diferencias e inferir si se trata de representantes de diferentes poblaciones o simplemente de consecuencias del azar que supone el muestreo. La pregunta inicial, "¿es diferente o parece diferente?", en el lenguaje estadístico se plantea en términos de "hipótesis". En términos coloquiales: la presunción a verificar . La hipótesis nula, implica que la diferencia observada se atribuye al azar. La hipótesis alternativa, interpreta que la diferencia observada significa que se está frente a representantes (muestras) de poblaciones diferentes. El análisis de los trabajos de investigación culmina en aceptar la hipótesis nula o la hipótesis alternativa. La conclusión es dar significado a las diferencias observadas. El uso de los verbos atribuir e interpretar es absolutamente tendencioso, procura como finalidad ratificar que el significado estadístico es sólo una respuesta razonable. Frente a la incertidumbre, el significado estadístico es una aproximación a la verdad, acorde a una probabilidad calculada, de ninguna manera es una pretensión de certeza, ya que un hallazgo "estadísticamente significativo" no es una verdad de cumplimiento inexorable para individualidades. Creemos muy conveniente recordar una vez más que "comprar billetes de lotería" no es un mecanismo estadísticamente significativo para "zafar" económicamente; intente explicárselo a una persona que se "sacó la grande" o a alguien que no le gusta trabajar y "compra billetes de lotería" con dinero que otro ganó trabajando. Estamos empleando reiteradamente dos palabras de gran importancia en el lenguaje estadístico y con asociación implícita indisoluble: "probabilidad y significado". Para la estadística, por la probabilidad (p) se asume el significado. "Estadísticamente significativo" Estadísticamente significativo es un par de vocablos, que asociados expresan sobre el hallazgo al que hacen referencia, que es poco probable que sea sólo casual. Subrayar el término "poco" lo creemos necesario para señalar que en las conclusiones estadísticas se debe indicar precisamente el nivel de probabilidad (p) al cual se le asignará "significado estad ístico". El lector de los datos presentados tiene la opción de plantearse otro nivel de probabilidad para descartar la hipótesis nula. Veamos un ejemplo: 1. 2. 3. 4. 5. 6. Un trabajo concluye que la prescripción de determinada droga disminuye de manera "significativa" la mortalidad del Infarto Agudo de Miocardio. En "material y método" los autores describen el tratamiento estadístico que hacen de los datos obtenidos; expresan que interpretarán las diferencias como "significativo" con una p < 0.05. Los datos obtenidos muestran una disminución de la mortalidad en el grupo tratado con la droga con respecto al control "con p < 0.03". Para los autores la diferencia es estadísticamente significativa, descartan la hipótesis nula y aceptan la hipótesis alternativa. Un eventual lector decide no trasladar esa prescripción a su práctica hasta que no se presenten trabajos similares que tengan "p < 0.01". El lector piensa que la evidencia no es suficiente para descartar la hipótesis nula, a su juicio, la diferencia hallada en la mortalidad puede haber sido sólo casual. Cálculo de "p" Estimamos que todavía puede persistir la desazón que nuestros lectores experimentaron al leer el artículo "probabilidad de pertenecer". 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology ¡¡Haya Paz!! y tranquilidad. No insistiremos con las ecuaciones … por ahora. Baste, por el momento, con tener "in mente" que trabajando con las diferencias obtenidas, con los estadígrafos apropiados; teniendo en cuenta el tipo de variable estudiada, y la distribución (sim étrica o asimétrica), se puede estimar con notable precisión la probabilidad de que las diferencias observadas, "aparecidas", sean sólo casuales, la consecuencia del muestreo. La probabilidad de hallazgo casual se expresa con la conocida "p = un número". Los diversos tratamientos estadísticos de los datos, que veremos someramente en próximos artículos, procuran establecer la "p" de las diferencias observadas. Errores de significado Con la "p" de que el hallazgo sea casual se interpreta el significado de ese dato; si se lo acepta como diferencia casual, se confirma la hipótesis nula y se concluye que todos los datos corresponden a muestra (s) de una sola población. Por el contrario, la interpretación de que la diferencia hallada no fue casual, significa que los datos corresponden a muestras de poblaciones diferentes, por lo tanto se acepta la hipótesis alternativa. Con este planteo existen sólo dos errores posibles: 1. 2. Error (alfa) o Tipo I. Consiste en equivocarse dándole a los hallazgos un significado que implica descartar la Hipótesis Nula y Aceptar la Hip ótesis Alternativa. En términos coloquiales: parece diferente pero es más de lo mismo. Error (beta) o tipo II . Es la equivocación opuesta, negar la diferencia como significativa cuando en realidad efectivamente corresponde a muestra (s) de poblaciones diferentes. En la calle se dice que "se equivocaron ya que es "sincero" porque no sólo parece … , en realidad es … ." El error o tipo I La manera más sencilla de cometer un error es aceptar diferencias como significativas con niveles "altos" de que las mismas sean casuales. En general, en bioestadística se interpreta como casual a cualquier diferencia que tenga una p > de 0.05 de serlo . Recordando algo del cálculo de "p", se interpreta como casuales a diferencias que tengan un desvío < a dos Desvíos Standard. Sin profundizar en teoría del Error por cuanto no sólo escapa a la finalidad de estos artículos, sino también, y especialmente, al conocimiento acabado de los autores, creemos importante señalar algunas actitudes que subyacen, disimuladas, en interpretaciones con error tipo I ó "falso positivo ": 1. 2. 3. Extraer de los datos más información de la pretendida: Los investigadores ensayan todo tipo de comparación y combinación posible no prevista en el diseño que calculó el nivel de "p" aceptable y el tamaño de la muestra. A mayor número de comparaciones y combinaciones de datos entre las muestras, mayor probabilidad de Error tipo I en alguna de las comparaciones. Análisis de fracciones de datos: Son los conocidos subgrupos, en el tratamiento de conjunto no se alcanzó "significación" pero en tal o cual "subgrupo" "la p dió significativa". Nuevamente, fraccionamiento de datos no previstos en el diseño aumenta la probabilidad de Error tipo I. Obstinación: Como la idea es "buena" si la "p" no "dá" es porque el tratamiento estad ístico es "malo". A mayor número de enfoques (tratamientos) estadísticos, mayor probabilidad de Error tipo I al obtener "p significativa" con alguno de ellos. Mayores y mejores especificaciones sobre este trascendente tema pueden hallarse en el libro "Investigación Clínica en Cardiología" del Dr Arturo Cagide, editado por Propulsora Literaria (1991) en el cap 5 pag 39 a 46. Sólo destaquemos que se puede calcular matemáticamente el error al comienzo del estudio, en el diseño, o aún después si se considera necesario o conveniente realizar algunas de las acciones descriptas en los párrafos previos. Le proponemos a nuestros lectores recordar al error o tipo I como la equivocación por el "sí fácil" o 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology por empecinamiento, popularmente expresado como "sí ó sí …". El error o tipo II y la potencia del estudio El error o tipo II quizás podríamos guardarlo en nuestra memoria idiomática como el error por trabajar con una muestra pequeña para la diferencia observada. En efecto, error es negar significado a una diferencia porque el cálculo de "p" arroja un resultado superior al límite de corte asumido para las diferencias casuales. Coloquialmente "no dió la p" o "dió una p alta". Sostenemos la intención de cumplir con los postulados iniciales de este ensayo, pedimos perdón, pero debemos retomar el tema de las ecuaciones, aunque sólo para mirar. Al observar las ecuaciones del Desvío Standard (DS ó G) y del Error Standard (ES), que son a su vez los denominadores en el cálculo de Z (Zeta) o de (chi), se aprecia que ambos ( DS ó G y ES) tienen relación inversa con el tamaño de la muestra (n). Cuanto menor tamaño la muestra, mayor DS, mayor ES. Recordemos el ejemplo del exponente negativo: Si se observa la ecuación de la distribución simétrica, especialmente la "mini" ecuación para calcular el exponente negativo Z (Zeta), o la ecuación similar para calcular (chi) como veremos más adelante; la relación es tal que a mayor DS (ó G) menor Z (Zeta), y ocurre lo mismo con la relación del ES para calcular (chi). Cuanto menor Z (Zeta) o menor (chi), mayor probabilidad de aparición "y". La máxima frecuencia de aparición "y" coincide con Z = 0, (Valor de x = µ). Una diferencia pequeña en el numerador de la mini ecuación de Z (Zeta) o de (chi), que se mantuviese prácticamente sin variaciones a medida que aumenta el tamaño de la muestra (n) se traducirá en un Z (Zeta) o (chi) progresivamente mayor porque irá disminuyendo gradualmente G (DS) o el ES (si se está calculando ). A mayor tamaño de la muestra, menor DS y/o ES, mayor Z (Zeta) y/o (chi). El numerador prácticamente no varía porque en el caso que nos ocupa la diferencia es de poblaciones, no parece, es real, genuina, no es sólo casual por muestreo; el resultado final al aumentar ( n) en estas circunstancias es que la misma diferencia tendrá progresivamente menor chance de parecer casual, irá disminuyendo la "p". En el diseño de un estudio se determina el error o tipo II "aceptable", en general en el orden del 20%, se expresa de modo inverso indicando que la "potencia" del estudio es del 80%, y se introduce en los cálculos para establecer el tamaño de la muestra. La potencia del estudio es su capacidad de detectar pequeñas diferencias y asume una determinada probabilidad de error o tipo II. Si resulta que "la p no da significativa", se confirma la Hipótesis Nula y se descarta la Hipótesis Alternativa, sabiendo que la probabilidad de una interpretación erróneamente negativa (Falso Negativo) es la inversa de la potencia, predeterminada al calcular el tamaño de la muestra (vg: 0.20 ó 20%). 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology La Hipótesis, el Error, y la Bioética Hemos discutido estos temas ex profeso antes de analizar diseños de protocolos para investigar cualquier tema que necesite de la Bioestadística. Creemos que es muy buena práctica de los equipos de trabajo revisar sistemáticamente sus rutinas laborales, sus resultados, y las propuestas y resultados de otros equipos. Nos parece también muy bueno, incluir en la revisión sistemática las bases te óricas de los procedimientos implementados. Los temas a investigar suelen decidirse en el marco de las discusiones que implican esas revisiones sistemáticas. La propuesta de una investigación debería superar siempre y en primera instancia la infranqueable barrera del respeto, a los derechos humanos y a la conservación del ambiente en el que la vida es posible. Estamos convencidos de que el diseño de un protocolo es esencial en las consideraciones bioéticas; en conjunciones expresivas, diríamos el "qué" y el "cómo". Nos parece un tema relevante, trascendente, un tema "mayor", discutir con el experto en estad ística los aspectos vinculados al "cómo" se debe y se puede percibir si una suposición tiene, marca, manifiesta, una diferencia significativa. La "presión por publicar", cuando no también la búsqueda del natural "reconocimiento social" o su desviación frecuente, el afán de notoriedad; y por qué negarlo, también intereses económicos financieros, se manifiestan en tratar a la bioestadística como un tema "menor"; es "nada más que el análisis matemático de los datos obtenidos". Por el simple recurso de descubrir que el tamaño de la muestra necesario para lograr una "potencia" razonable en una determinada investigación escapa a las factibilidades reales del equipo, se puede decidir presentar "sólo" una estadística descriptiva. En bioética se discuten temas como la equidad y la justicia en el uso de los recursos. No es un tema "menor" la discusión sobre invertir recursos humanos, recursos limitados y "no renovables" de los humanos como lo es el tiempo, recursos comunitarios como los econ ómicos financieros, insumos comunitarios como son los recursos tecnológicos, aún los "privados" por aquello de la "responsabilidad social del capital", etc. Este apartado procuró destacar algunos términos de significado muy preciso en la jerga estadística para nuestras conversaciones proyectando eventuales investigaciones. Index curso - Clase anterior - Clase siguiente Publicación: Octubre 2005 Tope Preguntas, aportes y comentarios ser án respondidos por el relator o por expertos en el tema a través de la lista de Bioingeniería e Informática Médica Llene los campos del formulario y oprima el botón "Enviar" Preguntas, aportes o comentarios: Nombre y apellido: País: Argentina Dirección de E-Mail: 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology Enviar Borrar Dr. Diego Esandi Co -Presidente Comité Científico Dra. Silvia Nanfara Co -Presidente Comité Científico Prof. Dr. Armando Pacher Presidente Comité Técnico/Organizador Correo electrónico Correo electrónico Correo electrónico ©1994-2005 CETIFAC - Bioingenier ía UNER Webmaster Updated: 08/17/2005 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology