Clase Nº 6: Hipótesis de Trabajo Curso: Bioestadística básica para

Anuncio
[Index FAC] [Index CCVC]
Bioingeniería e Informática M édica/Bioengineering- Medical Informatics
Curso: Bioestadística básica para m édicos asistenciales
Clase Nº 6: Hipótesis de Trabajo
Ra úl E. Ortego, Carlos R. Secotaro
Index curso - Clase anterior - Clase siguiente
Podríamos comenzar parafraseando a Shakespeare, ya que trataremos de responder a una pregunta
esencial: ¿Será diferente o NO será (parece) diferente?.
Hemos aceptado que estudiamos un universo aleatorio y que las técnicas utilizadas para proyectar e inferir
trabajan con fracciones de las poblaciones denominadas "muestras".
La definición de una fracción de la población como "muestra" implica como condición sine qua non que
los valores de la variable de la población incluídos en tal fracción hayan sido incorporados
rigurosamente por azar.
Hemos comprendido en el análisis del Error Standard, que el "muestreo" supone la consecuencia de
que las muestras tienen diferentes funciones estadísticas (promedios, desvíos, etc) que la
población de origen y aún entre ellas mismas.
Muestras de la misma población son "funcionalmente" diferentes entre sí.
Este concepto es primordial en la interpretación de los datos estadísticos.
En efecto, las comparaciones en biología, como discutíamos en los primeros capítulos, procuran averiguar,
cambiando circunstancias en una muestra, si se producen modificaciones en las funciones estadísticas de
la misma, modificaciones "de fondo", modificaciones "significativas".
Si se modifican de manera significativa las funciones estadísticas de la muestra, se concluirá que las
circunstancias operativas han cambiado a la población de referencia.
Analizemos un ejemplo de lo expuesto:
1.
2.
3.
Los pacientes Diabéticos sin control estricto de la glucemia, como población, est án
caracterizados por determinados indicadores de complicaciones microvasculares en retina, riñón,
etc.
Los pacientes diabéticos con control estricto de la glucemia están caracterizados por
diferentes (menores) índices de tales complicaciones.
Controlar estrictamente la glucemia ha determinado que exista una nueva población de
pacientes diabéticos con características (expresadas por las funciones estadísticas)
significativamente diferentes de la población de diab éticos que no tienen esa circunstancia del
control estricto de la glucemia.
Repitamos un concepto que expusimos a propósito de introducirnos en la Estadística Inferencial: se
analizan las funciones estadísticas de las muestras para procurar saber (inferir), si esas muestras
provienen o no de la misma población.
Si la circunstancia estudiada modifica características funcionales (los parámetros) de la población,
significa que en realidad ha cambiado la población de referencia, ya que los parámetros son
esencialmente constantes para cada población.
La estadística trabaja habitualmente con estadígrafos (funciones de muestras) y a partir de ellos
proyecta y/o infiere parámetros (funciones de poblaci ón).
De la discusión previa sugerimos recordar que en las comparaciones estadísticas la diferencia entre
muestras es la regla.
Hipótesis sobre el significado de la diferencias
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
El tema es darle un significado a las diferencias e inferir si se trata de representantes de diferentes
poblaciones o simplemente de consecuencias del azar que supone el muestreo.
La pregunta inicial, "¿es diferente o parece diferente?", en el lenguaje estadístico se plantea en términos
de "hipótesis". En términos coloquiales: la presunción a verificar .
La hipótesis nula, implica que la diferencia observada se atribuye al azar.
La hipótesis alternativa, interpreta que la diferencia observada significa que se está frente a
representantes
(muestras) de poblaciones diferentes.
El análisis de los trabajos de investigación culmina en aceptar la hipótesis nula o la hipótesis alternativa.
La conclusión es dar significado a las diferencias observadas. El uso de los verbos atribuir e
interpretar es absolutamente tendencioso, procura como finalidad ratificar que el significado
estadístico es sólo una respuesta razonable.
Frente a la incertidumbre, el significado estadístico es una aproximación a la verdad, acorde a una
probabilidad calculada, de ninguna manera es una pretensión de certeza, ya que un hallazgo
"estadísticamente significativo" no es una verdad de cumplimiento inexorable para individualidades.
Creemos muy conveniente recordar una vez más que "comprar billetes de lotería" no es un mecanismo
estadísticamente significativo para "zafar" económicamente; intente explicárselo a una persona que se
"sacó la grande" o a alguien que no le gusta trabajar y "compra billetes de lotería" con dinero que otro
ganó trabajando.
Estamos empleando reiteradamente dos palabras de gran importancia en el lenguaje estadístico y con
asociación implícita indisoluble: "probabilidad y significado".
Para la estadística, por la probabilidad (p) se asume el significado.
"Estadísticamente significativo"
Estadísticamente significativo es un par de vocablos, que asociados expresan sobre el hallazgo al que
hacen referencia, que es poco probable que sea sólo casual.
Subrayar el término "poco" lo creemos necesario para señalar que en las conclusiones estadísticas se debe
indicar precisamente el nivel de probabilidad (p) al cual se le asignará "significado estad ístico".
El lector de los datos presentados tiene la opción de plantearse otro nivel de probabilidad para
descartar la hipótesis nula.
Veamos un ejemplo:
1.
2.
3.
4.
5.
6.
Un trabajo concluye que la prescripción de determinada droga disminuye de manera
"significativa" la mortalidad del Infarto Agudo de Miocardio.
En "material y método" los autores describen el tratamiento estadístico que hacen de los datos
obtenidos; expresan que interpretarán las diferencias como "significativo" con una p < 0.05.
Los datos obtenidos muestran una disminución de la mortalidad en el grupo tratado con la droga
con respecto al control "con p < 0.03".
Para los autores la diferencia es estadísticamente significativa, descartan la hipótesis nula y
aceptan la hipótesis alternativa.
Un eventual lector decide no trasladar esa prescripción a su práctica hasta que no se presenten
trabajos similares que tengan "p < 0.01".
El lector piensa que la evidencia no es suficiente para descartar la hipótesis nula, a su juicio, la
diferencia hallada en la mortalidad puede haber sido sólo casual.
Cálculo de "p"
Estimamos que todavía puede persistir la desazón que nuestros lectores experimentaron al leer el artículo
"probabilidad de pertenecer".
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
¡¡Haya Paz!! y tranquilidad. No insistiremos con las ecuaciones … por ahora.
Baste, por el momento, con tener "in mente" que trabajando con las diferencias obtenidas, con los
estadígrafos apropiados; teniendo en cuenta el tipo de variable estudiada, y la distribución (sim étrica
o asimétrica), se puede estimar con notable precisión la probabilidad de que las diferencias observadas,
"aparecidas", sean sólo casuales, la consecuencia del muestreo.
La probabilidad de hallazgo casual se expresa con la conocida "p = un número".
Los diversos tratamientos estadísticos de los datos, que veremos someramente en próximos artículos,
procuran establecer la "p" de las diferencias observadas.
Errores de significado
Con la "p" de que el hallazgo sea casual se interpreta el significado de ese dato; si se lo acepta como
diferencia casual, se confirma la hipótesis nula y se concluye que todos los datos corresponden a
muestra (s) de una sola población.
Por el contrario, la interpretación de que la diferencia hallada no fue casual, significa que los
datos corresponden a muestras de poblaciones diferentes, por lo tanto se acepta la hipótesis
alternativa.
Con este planteo existen sólo dos errores posibles:
1.
2.
Error (alfa) o Tipo I. Consiste en equivocarse dándole a los hallazgos un significado que
implica descartar la Hipótesis Nula y Aceptar la Hip ótesis Alternativa. En términos coloquiales:
parece diferente pero es más de lo mismo.
Error (beta) o tipo II . Es la equivocación opuesta, negar la diferencia como significativa
cuando en realidad efectivamente corresponde a muestra (s) de poblaciones diferentes. En la calle
se dice que "se equivocaron ya que es "sincero" porque no sólo parece … , en realidad es … ."
El error o tipo I
La manera más sencilla de cometer un error es aceptar diferencias como significativas con niveles
"altos" de que las mismas sean casuales. En general, en bioestadística se interpreta como casual a
cualquier diferencia que tenga una p > de 0.05 de serlo . Recordando algo del cálculo de "p", se
interpreta como casuales a diferencias que tengan un desvío < a dos Desvíos Standard.
Sin profundizar en teoría del Error por cuanto no sólo escapa a la finalidad de estos artículos, sino
también, y especialmente, al conocimiento acabado de los autores, creemos importante señalar algunas
actitudes que subyacen, disimuladas, en interpretaciones con error tipo I ó "falso positivo ":
1.
2.
3.
Extraer de los datos más información de la pretendida: Los investigadores ensayan todo tipo
de comparación y combinación posible no prevista en el diseño que calculó el nivel de "p" aceptable
y el tamaño de la muestra. A mayor número de comparaciones y combinaciones de datos entre las
muestras, mayor probabilidad de Error tipo I en alguna de las comparaciones.
Análisis de fracciones de datos: Son los conocidos subgrupos, en el tratamiento de conjunto no
se alcanzó "significación" pero en tal o cual "subgrupo" "la p dió significativa". Nuevamente,
fraccionamiento de datos no previstos en el diseño aumenta la probabilidad de Error tipo I.
Obstinación: Como la idea es "buena" si la "p" no "dá" es porque el tratamiento estad ístico es
"malo". A mayor número de enfoques (tratamientos) estadísticos, mayor probabilidad de Error tipo I
al obtener "p significativa" con alguno de ellos.
Mayores y mejores especificaciones sobre este trascendente tema pueden hallarse en el libro
"Investigación Clínica en Cardiología" del Dr Arturo Cagide, editado por Propulsora Literaria (1991)
en el cap 5 pag 39 a 46.
Sólo destaquemos que se puede calcular matemáticamente el error al comienzo del estudio, en el
diseño, o aún después si se considera necesario o conveniente realizar algunas de las acciones descriptas
en los párrafos previos.
Le proponemos a nuestros lectores recordar al error o tipo I como la equivocación por el "sí fácil" o
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
por empecinamiento, popularmente expresado como "sí ó sí …".
El error
o tipo II y la potencia del estudio
El error o tipo II quizás podríamos guardarlo en nuestra memoria idiomática como el error por
trabajar con una muestra pequeña para la diferencia observada.
En efecto, error es negar significado a una diferencia porque el cálculo de "p" arroja un resultado
superior al límite de corte asumido para las diferencias casuales. Coloquialmente "no dió la p" o "dió una p
alta".
Sostenemos la intención de cumplir con los postulados iniciales de este ensayo, pedimos perdón, pero
debemos retomar el tema de las ecuaciones, aunque sólo para mirar.
Al observar las ecuaciones del Desvío Standard (DS ó G) y del Error Standard (ES), que son a su vez
los denominadores en el cálculo de Z (Zeta) o de (chi), se aprecia que ambos ( DS ó G y ES) tienen
relación inversa con el tamaño de la muestra (n).
Cuanto menor tamaño la muestra, mayor DS, mayor ES.
Recordemos el ejemplo del exponente negativo:
Si se observa la ecuación de la distribución simétrica, especialmente la "mini" ecuación para calcular el
exponente negativo Z (Zeta), o la ecuación similar para calcular (chi) como veremos más adelante; la
relación es tal que a mayor DS (ó G) menor Z (Zeta), y ocurre lo mismo con la relación del ES para
calcular (chi).
Cuanto menor Z (Zeta) o menor (chi), mayor probabilidad de aparición "y".
La máxima frecuencia de aparición "y" coincide con Z = 0, (Valor de x = µ).
Una diferencia pequeña en el numerador de la mini ecuación de Z (Zeta) o de (chi), que se mantuviese
prácticamente sin variaciones a medida que aumenta el tamaño de la muestra (n) se traducirá en un Z
(Zeta) o (chi) progresivamente mayor porque irá disminuyendo gradualmente G (DS) o el ES (si se está
calculando ).
A mayor tamaño de la muestra, menor DS y/o ES, mayor Z (Zeta) y/o (chi).
El numerador prácticamente no varía porque en el caso que nos ocupa la diferencia es de poblaciones,
no parece, es real, genuina, no es sólo casual por muestreo; el resultado final al aumentar ( n) en
estas circunstancias es que la misma diferencia tendrá progresivamente menor chance de parecer casual,
irá disminuyendo la "p".
En el diseño de un estudio se determina el error
o tipo II "aceptable", en general en el orden del 20%,
se expresa de modo inverso indicando que la "potencia" del estudio es del 80%, y se introduce en los
cálculos para establecer el tamaño de la muestra.
La potencia del estudio es su capacidad de detectar pequeñas diferencias y asume una determinada
probabilidad de error o tipo II. Si resulta que "la p no da significativa", se confirma la Hipótesis
Nula y se descarta la Hipótesis Alternativa, sabiendo que la probabilidad de una interpretación
erróneamente negativa (Falso Negativo) es la inversa de la potencia, predeterminada al calcular el
tamaño de la muestra (vg: 0.20 ó 20%).
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
La Hipótesis, el Error, y la Bioética
Hemos discutido estos temas ex profeso antes de analizar diseños de protocolos para investigar cualquier
tema que necesite de la Bioestadística.
Creemos que es muy buena práctica de los equipos de trabajo revisar sistemáticamente sus rutinas
laborales, sus resultados, y las propuestas y resultados de otros equipos.
Nos parece también muy bueno, incluir en la revisión sistemática las bases te óricas de los procedimientos
implementados.
Los temas a investigar suelen decidirse en el marco de las discusiones que implican esas revisiones
sistemáticas.
La propuesta de una investigación debería superar siempre y en primera instancia la infranqueable barrera
del respeto, a los derechos humanos y a la conservación del ambiente en el que la vida es posible.
Estamos convencidos de que el diseño de un protocolo es esencial en las consideraciones bioéticas; en
conjunciones expresivas, diríamos el "qué" y el "cómo".
Nos parece un tema relevante, trascendente, un tema "mayor", discutir con el experto en estad ística los
aspectos vinculados al "cómo" se debe y se puede percibir si una suposición tiene, marca, manifiesta, una
diferencia significativa.
La "presión por publicar", cuando no también la búsqueda del natural "reconocimiento social" o su
desviación frecuente, el afán de notoriedad; y por qué negarlo, también intereses económicos financieros,
se manifiestan en tratar a la bioestadística como un tema "menor"; es "nada más que el análisis
matemático de los datos obtenidos".
Por el simple recurso de descubrir que el tamaño de la muestra necesario para lograr una "potencia"
razonable en una determinada investigación escapa a las factibilidades reales del equipo, se puede decidir
presentar "sólo" una estadística descriptiva.
En bioética se discuten temas como la equidad y la justicia en el uso de los recursos.
No es un tema "menor" la discusión sobre invertir recursos humanos, recursos limitados y "no
renovables" de los humanos como lo es el tiempo, recursos comunitarios como los econ ómicos
financieros, insumos comunitarios como son los recursos tecnológicos, aún los "privados" por aquello de la
"responsabilidad social del capital", etc.
Este apartado procuró destacar algunos términos de significado muy preciso en la jerga estadística para
nuestras conversaciones proyectando eventuales investigaciones.
Index curso - Clase anterior - Clase siguiente
Publicación: Octubre 2005
Tope
Preguntas, aportes y comentarios ser án respondidos por el relator
o por expertos en el tema a través de la lista de Bioingeniería e Informática Médica
Llene los campos del formulario y oprima el botón "Enviar"
Preguntas, aportes o
comentarios:
Nombre y apellido:
País: Argentina
Dirección de E-Mail:
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
Enviar
Borrar
Dr. Diego Esandi
Co -Presidente
Comité Científico
Dra. Silvia Nanfara
Co -Presidente
Comité Científico
Prof. Dr. Armando Pacher
Presidente
Comité Técnico/Organizador
Correo electrónico
Correo electrónico
Correo electrónico
©1994-2005
CETIFAC - Bioingenier ía UNER
Webmaster Updated: 08/17/2005
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
Descargar