Propuesta metodologica sobre la resolucion de problemas Biomedicos que conducen a la distribucion Ji-cuadrado (ppt)

Anuncio
Volver
Trabajo publicado en www.ilustrados.com
La mayor Comunidad de difusión del conocimiento
“Propuesta metodológica sobre la resolución de problemas
Biomédicos que conducen a la distribución Ji-cuadrado”.
Lic. Profesor Asistente Lorenzo Pérez Milanés
Facultad de Ciencias Médicas “Zoilo E. Marinello Vidaurreta”
Las Tunas Cuba
E-mail: lorenzopere@yahoo.es
lorenzo@cucalambe.ltu.sld.cu
Resumen Introducción Desarrollo Bibliografía Datos del autor Ir a “Propuesta”
Este artículo está dirigido fundamentalmente a los profesionales de la Salud y en especial a los
estudiantes de 2do. Año de la carrera de Medicina, Estomatología y Enfermería de la Facultad de
Ciencias Médicas “Zoilo E. Marinello Vidaurreta” de Las Tunas, los cuales reciben las asignaturas de
Informática Médica II y Informática e Investigación III en la que se aborda la problemática de la
resolución de problemas biomédicos que conducen a la distribución Ji-cuadrado en el marco de la
Estadística Inferencial. En el mismo se presentan algunas valoraciones teóricas sobre el tema y una
propuesta metodológica con una serie de pasos lógicos para realizar las pruebas de hipótesis que
utilizan este modelo, así como algunas indicaciones en el uso del procesador Statgraphics versión 2,1
en Inglés para el cálculo y análisis de los resultados . Además este material puede ser también útil a
otros profesionales que aborden la Estadística Inferencial en general.
Regresar
En el desarrollo de los métodos estadísticos modernos las primeras técnicas de inferencia que aparecieron fueron las
que hicieron buen número de suposiciones acerca de la naturaleza de la población de la que obtuvieron los datos.
Puesto que los valores de población son “parámetros” estas técnicas estadísticas son llamadas “paramétricas”. Una
técnica de inferencia, como ya hemos visto, puede basarse en la suposición de que los datos se sacaron de una
población distribuida normalmente. Tales técnicas nos conducen a conclusiones que tienen limitaciones, por lo que más
recientemente se han desarrollado gran número de técnicas de inferencia que no hacen suposiciones numerosas ni
severas acerca de los parámetros. Estas “distribuciones libres” o “técnicas no paramétricas” permiten sacar
conclusiones a las que hay que hacer menor reserva.
Existen multitud de situaciones en el ámbito de la salud en el que las variables de interés, las cuales no pueden
cuantificarse mediante cantidades numéricas, entre las que el investigador esté interesado en determinar posibles
relaciones. Ejemplos de este tipo de variables pueden ser las complicaciones tras una intervención quirúrgica, el
sexo, el nivel socio-cultural, etc. En este caso tendríamos, a lo sumo, las observaciones agrupadas en forma de
frecuencia, dependiendo de las modalidades que presente cada paciente en cada una de las variables, por los que los
métodos estudiados en los capítulos anteriores no serían aplicables.
La experiencia nos ha conducido a tener en cuenta el fracaso que experimentan los principiantes y estudiantes en el
proceso de resolución de problemas que conducen a la distribución x2 y en especial en la realización de pruebas de
hipótesis por numerosos factores como, prestar su atención solamente en las habilidades computacionales, en el
quehacer metodológico o en la rama descriptiva de la Estadística como ciencia. Para la Estadística Inferencial ha
quedado el papel de “oveja negra” por razones diversas, que incluyen desde la complejidad de su contenido hasta la
predisposición a impartirla por predominio de personal docente no afín a la especialidad; la realidad es que hay que
buscar un enfoque de mayor acierto para la docencia de esta temática en el contexto de los nuevos paradigmas de
creación, difusión y utilización del conocimiento, y los apuntes que se proponen es un elemento a considerar en este
sentido.
Regresar
Test o contraste Ji-cuadrado
En general este tipo de tests consisten en tomar una muestra y observar si hay diferencia significativa entre las
frecuencias “observadas” y las especificadas por la ley teórica del modelo que se contrasta, también denominadas
frecuencias “esperadas”.
Esta prueba 2 puede ser utilizada en forma útil en relación con la compatibilidad de frecuencia observada y
esperadas (caso de haber independencia) en tablas de dos sentidos o “tablas de contingencia” ( Es un contraste para
determinar la dependencia o independencia de caracteres cualitativos).
 Estas tablas se construyen generalmente con objeto de estudiar la relación entre las dos variables de clasificación.
Por medio de la prueba 2 es posible probar la hipótesis de que las dos variables son independientes.

La fórmula a utilizar para calcular 2 será la siguiente:
r
(1)
2 = 
k
Donde:
 ( Qij – Eij)2 / Eij
k: número de columnas.
i=1 j=1
r:
“
“ filas.
Qij: Frecuencias absolutas observadas de casos clasificados en la fila i de la
columna j.
Eij : Frecuencias absolutas de casos esperados conforme a Ho para ser
clasificados en la fila i de la columna j.
Para encontrar la frecuencia esperada para cada casilla, se multiplican los dos totales marginales de una casilla
particular y dividimos el producto por el número total de casos “ n “.
Regresar Continuar
Ejemplo:
A
B
Total
a
*12
32
44
b
22
14
36
c
9
6
15
Total
43
52
95
J
i
i
Tabla que muestra las frecuencias observadas en cada casilla a partir de la cual determinaremos las frecuencias
esperadas.
* Frecuencia esperada de la casilla situada en la primera fila y primera columna.
E11= ( 44)(43) / 95 = 19.9
, n = 95
 Si las frecuencias observadas están estrechamente de acuerdo con las frecuencias esperadas, las diferencias ( Qij
–Eij )serán por supuesto pequeñas y consecuentemente el valor 2 será pequeño. Con un valor pequeño de este
estadígrafo “ no podemos rechazar la hipótesis de nulidad” que supone independientes entre si a los dos conjuntos
de características.
 Si hay una o varias diferencias grandes, el valor de 2 también será grande. Tanto mayor es 2 tanto más probable
es que los dos grupos difieran con respecto a las clasificaciones.
 Puede mostrarse que la distribución muestral de 2 , definida por la fórmula antes expuesta, se aproxima a la
distribución Chi-cuadrado con el valor:
gl = ( r-1)(k-1)
donde gl son los grados de libertad.
Las probabilidades asociadas con diferentes valores de Chi-cuadrado se encuentran en la tabla de valores de 2. Si
un valor calculado de este estadígrafo es mayor que el dado en la tabla en un nivel de significación prefijado-en un gl
en particular, se rechaza Ho a ese nivel de significación.
Regresar Continuar
Nótese que hay una distribución muestral diferente para cada valor de gl, es decir, la significación de cualquier valor
particular de 2 depende del número de grados de libertad en los datos con los que ha sido calculado.
Los grados de libertad para una tabla r x k pueden hallarse con :
gl = (r-1)(k-1) , donde :
r: número de clasificaciones(filas).
K: número de grupos(columnas).
¿ Tendrá limitaciones este test ?....¿ Qué pasará si gl = 1 ?.
Después de haber analizado los elementos teóricos anteriores aparecen gravitando alrededor del tema que nos ocupa,
las siguientes interrogantes: ¿ Cuándo tendríamos que realizar una prueba Ji-cuadrado ?,¿ Cómo se hace este tipo de
prueba ?, ¿ Cuáles serían los pasos a seguir para tener éxito en la realización de la misma ?, ¿ Qué tendríamos que
hacer en cada paso ?, en fin para responder a estas y a otras interrogantes que puedan surgir les proponemos a
continuación una “metodología” de resolución de problemas biomédicos que conducen a estas pruebas de hipótesis. La
misma esta constituida por una serie de pasos lógicos que recomendamos seguir y que han sido extraídos de la
experiencia que hemos acumulado en la impartición y en el trabajo metodológico a la Estadística Inferencial por parte
del colectivo docente, así como de resultados en la aplicación de exámenes y técnicas cualitativas para conocer el
grado de aceptación y satisfacción de esta metodología en los estudiantes con el propósito de facilitar y guiar a los
mismos en la obtención del éxito de estos tests.
Hemos querido presentarle a continuación la “metodología” con los pasos que sugerimos seguir para realizar la prueba
y en los que se podrán apreciar vínculos que nos mostraran, a través de un ejemplo concreto, que debe hacerse en
cada uno de ellos, así como su contenido.
Regresar Continuar
Volver
I. Identificar la distribución Ji-cuadrado en el problema biomédico.
II. Buscar el valor tabulado de X2 según  y los grados de libertad.
III. Planteamiento de las hipótesis nula y alternativa, el nivel de
significación  y los grados de libertad.
IV. Calculo del estadígrafo X2 con el procesador estadístico.
V. Análisis e interpretación de los resultados.
VI. Toma de decisión.
Regresar
Paso 1
Supongamos que deseamos probar si existe independencia entre el tipo de dieta ingerida por los adolescentes
en cierta región durante determinado período y la cantidad de caries y se toma
una muestra de 95
adolescentes.
Los resultados se plantean a continuación( o sea, frecuencia absoluta Oij ).
Tipos de dietas
A
B
Total
1-2
12
32
44
3-5
22
14
36
6 ó más
9
6
15
Total
43
52
95
Cantidad de caries
Después de leer el problema varias veces debemos identificar el tipo de prueba de hipótesis, para ello debemos
darnos cuenta que en el problema clasifican dos variables cualitativas y ordinales(tipos de dietas y cantidad de
caries), pero además se quiere saber la dependencia entre ambas en una muestra que es lo suficiente grande( n
 30 ), de manera que estos elementos son suficientes para saber que estamos en presencia de una prueba no
paramétrica o Ji-cuadrado.
Regresar
Paso 2
Tabla 2

gl
.05
.01
1
3.84
6.63
2
5.99
9.21
3
7.81
11.34
4
9.49
13.28
5
11.07
15.09
6
12.59
16.81
En la tabla se puede observar que para un gl = 2 el
valor de xt2 es 9.21
Regresar
Paso 3
La hipótesis de nulidad supone que el tipo de dieta es un factor independiente del número de caries, por tanto,
la hipótesis de nulidad y la hipótesis alternativa se expresan:
Ho : Existen independientes.
H1: No existen independientes.
Tomaremos un nivel de significación  = 0.01
El criterio de decisión será:
Rechazar Ho si el valor de 2 obtenido mediante la fórmula es mayor que el tabulado t2 ( 2  t2 ). Este punto
crítico t2 se obtiene en la tabla 2 para gl = (3-1)(2-1) = 2 ,el cual constituye el paso 2.
Aceptar Ho si 2  t2
En nuestro caso t2 = 9,21
Regresar
Paso 4
Procesador
Paso 1: Selección de la escala de medición de la variable
Seleccionamos...Describe...Categorical Data..Contingency
Tables.. del menú y hacemos clic.
Regresar Continuar
Paso 2: Seleccionar las variables en la base de datos
DATA.- nombre de las variables que contienen los datos que se quieren
analizar. Hacemos clic en OK
Regresar Continuar
Paso 3: Seleccionar la opción para realizar la tabulación de la
variable
Seleccionamos el botón Tabular options de la barra de
herramientas y hacemos clic.
Regresar Continuar
Paso 4: Selección de la prueba
Seleccionamos...Chi-Square Tests de la caja de diálogo y hacemos clic en el
botón OK
Regresar Continuar
Paso 5: Extraer los resultados obtenidos para efectuar el análisis
e interpretación que se plantea en el punto V de la metodología
Como se observa en los resultados para un gl = 2 el valor del
estadígrafo x2 es 10.71 y el P-valor = 0.0047
Regresar
Paso 5
Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos con el procesador y teniendo
en cuenta los diferentes aspectos del paso 2 es que se hacen los análisis e interpretaciones finales del problema.
De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes:

Utilizando el nivel de significación  = 0.01 y los grados de libertad dados por el número de filas y columnas de
la tabla de frecuencias observadas se obtuvo que el valor tabulado de t2 es de 9.21 y a partir del procesador el
valor 2 que corresponde a la fórmula (1), resultando ser 10.71, de manera que si hacemos las comparaciones
pertinentes de acuerdo al criterio de decisión podemos ver que 10.71  9.21 y tendremos que rechazar la hipótesis
nula Ho, es decir, que “rechazamos” que exista independencia entre la dieta administrada y la cantidad de caries en esos
pacientes

Si no hubiéramos utilizado el procesador tendríamos que haber calculado las frecuencias esperadas dadas por
la tabla:
Tipos
deBdietasTotal
A
0-2
19.9
24.1
44
3-5
16.3
19.7
36
6 ó más
6.8
8.2
15
Total
43
52
95
Cantidad de caries.
y haber calculado por la fórmula (1) a 2 que por los datos de la tabla es el siguiente:
2 = (12-19.9)2 / 19.9 + (32-24.1)2 / 24.1 + .........+ (6-8.2)2 / 8.2
= 3.14 +2.59 +.........+ 0.59
2 = 10.67
10.67  que el punto crítico 9.21 que aparece en la tabla, podemos rechazar la hipótesis de nulidad a un nivel de
significación de 0.01, es decir, que rechazamos que exista independencia entre la dieta administrada y la cantidad
de caries en esos pacientes.
Regresar
Paso 6
Es en este paso donde usted debe decidir si a los resultados de la prueba
de hipótesis los toma, los deja o se abstiene de ellos, en fin todo lo que
hicimos antes fue para “DECIDIR”.
Regresar
Limitaciones
La muestra de tamaño n debe ser suficientemente grande, de modo que ninguna de las frecuencias
esperadas Eij sea menor que 1 y no más del 20 % de los mismos sea menor que 5.
Corrección de Yates ( si gl = 1 )
Cuando los resultados para una distribución continua se aplican a datos discretos, se deben hacer
correcciones para la continuidad. La corrección consiste en rescribir a la ecuación (1):
r
(1) 2 = 
k
 ( Oij – Eij)2 / Eij
i=1 j=1
2 (corregida) = ( Q1-E1-0.5)2/E1 + (Q2-E2-0.5)2/E2 + ........+(Qn-En-0.5)2/En
Esta corrección se debe hacer cuando gl = 1 ( un solo grado de libertad). En muestras grandes la
corrección conduce a los mismos resultados que sin efectuar la corrección.
Regresar
1. Cursos de Maestrías. Metodología de la Investigación, Promoción y Educación para la salud. [en CDROM User Guide]. ENSAP. Versión 1,0 La Habana, 2004.
2. Freund E. John. Estadística Elemental Moderna. Edición Revolucionaria. La Habana. 1987.
3. Colectivo de autores. Laboratorio de Estadística Matemática II. Editorial Félix Varela, la
Habana,2004.
4. Guerra Bustillo W. Caridad y otros. Estadística. Editorial Félix Varela, la Habana,2004.
5. Oliva G. Leonardo, O´Farril M. Esperanza. Bioestadística y Computación, quía de estudio. Edit.
Pueblo y
Educación. La Habana. 1988.
6. Oliva G. Leonardo y otros. Bioestadística. Cuaderno de ejercicios. Edit. Pueblo y
Educación. La
Habana. 1988.
7. Colectivo de autores. Bioestadística y Computación. Editorial Pueblo y Educación. La Habana,1987.
Regresar
Lic. Profesor Asistente Lorenzo Pérez Milanés
Facultad de Ciencias Médicas “Zoilo E. Marinello Vidaurreta”
Las Tunas Cuba
E-mail: lorenzopere@yahoo.es
lorenzo@cucalambe.ltu.sld.cu
Regresar
Descargar