Estadística

Anuncio
Test
Estadística
Test
Estadística
1.
1)
2)
3)
4)
5)
2.
3.
2)
3)
4)
5)
Señale cuál de las siguientes es una variable cuantitativa discreta:
Glucemia basal.
Sexo.
Número de camas.
Color de pelo.
Respuesta a tratamiento analgésico.
6.
1)
1)
2)
3)
4)
5)
2)
3)
4)
5)
En nueve familias estudiadas, el número de hijos por familia era
de 4, 6, 2, 2, 4, 3, 2, 1, 7. La media, la mediana y moda de hijos
por familia es:
7.
1)
2)
3)
4)
5)
4.
3,4; 2; 3
3; 3,4; 2
3; 3; 2
2; 3,5; 3
3,4; 3; 2
1)
2)
3)
4)
5)
Si se suman el número de procesos catarrales de cada individuo estudiado y se divide entre 50 se obtendrá 1.
La mitad de los sujetos estudiados han tenido dos o más
catarros durante ese año.
La muestra estudiada no es homogénea.
Es posible que alguno de los sujetos estudiados haya presentado un número elevado de catarros.
En la muestra estudiada lo más frecuente es haber tenido
más de un proceso catarral durante ese año.
4)
5)
8.
Se emplea para comparar la variabilidad relativa de diferentes
distribuciones.
Se aplica partiendo del problema de que las desviaciones
típicas no son comparables directamente.
Puede decirse que los valores no son homogéneos si la
desviación típica supone más de un tercio de la media.
El coeficiente de variación permite comparar la variabilidad
relativa de dos muestras.
No puede utilizarse para comparar dos muestras expresadas
en distintas unidades.
La media es igual a la moda, y ésta, igual a la mediana.
El 50% de las observaciones son mayores que la moda.
Aproximadamente el 68% de las observaciones caen dentro
de ±1 desviación estándar de la media.
El número de observaciones entre 0 y 1 desviación estándar
de la media es el mismo que entre 1 y 2 desviaciones estándar
de la media.
El valor que más se repite es la media.
En una determinada muestra estudiamos la glucemia, llegando
a la conclusión de que 120 corresponde al percentil 80:
1)
2)
3)
4)
5)
9.
5.
Moda.
Percentil 50.
Rango.
Mediana.
Todas las siguientes afirmaciones con respecto a la distribución
normal son cier­tas, excepto:
1)
2)
3)
Se han estudiado el número de procesos catarrales por año en
20 sujetos de edades comprendidas entre los 18 y los 55 años.
Se informa de que la mediana es 1. ¿Cuál de las siguientes afirmaciones le parece correcta?
1.ª vuelta Distancia
Respecto al coeficiente de variación, una de las siguientes afirmaciones es FALSA:
¿Cuál de las siguientes es una variable cualitativa?
Duración del sangrado menstrual.
Número de familias numerosas/1.000 habitantes.
Escala de Glasgow.
Consumo diario de cigarrillos.
Colesterol sérico.
1.ª vuelta Distancia
El 80% de la población tiene una glucemia mayor de 120.
El 20% de la muestra tiene una glucemia de 120 o superior.
El 20% de la muestra tiene una glucemia superior a 120.
El 80% de la muestra tiene una glucemia igual a 120.
La mediana es 80.
¿Cuál de los siguientes parámetros es de dispersión?
Si quisiera realizar un estudio y tuviera que trabajar con una
muestra sesgada, ¿que parámetros utilizaría?
1)
1)
Media aritmética.
Tamaño muestral, mediana, rango intercuartílico.
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid • Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
1
Test
Estadística
2)
3)
4)
5)
Media, moda, mediana.
Coeficiente de variación de Pearson.
Tamaño muestral, media, desviación típica.
Media, varianza y moda.
1)
2)
3)
4)
5)
1.ª vuelta Distancia
196 - 204
180 - 220
160 - 240
198 - 202
170 - 230
10. Respecto a la mediana, señale la respuesta INCORRECTA:
1)
2)
3)
4)
5)
Es una medida de tendencia central.
Es útil es muestras grandes y homogéneas.
No siempre es un valor de la muestra.
Divide al conjunto de datos en partes iguales.
En una distribución normal es el valor que más se repite.
11. Le informan de que la TAD media de un grupo de adolescentes
con anorexia nerviosa es de 60 mm de Hg con una desviación
estándar de 5. Es cierto:
1)
2)
3)
4)
5)
La TAD media de las personas que padecen anorexia
nerviosa es 60.
La TAD media de las personas que padecen anorexia nerviosa es 60, con una probabilidad de equivocarnos con esta
afirmación menor al 5%.
La TAD media de las personas que padecen anorexia
nerviosa estará entre 50 y 70, con una probabilidad de
equivocarnos con esta afirmación menor al 5%.
La TAD media de las personas que participaron en este
estudio estará entre 50 y 70, con una probabilidad de
equivocarnos con esta afirmación menor al 5%.
El 68% de las personas que participaron en este estudio
tienen una TAD entre 55 y 65.
15. En una muestra de 100 pacientes se ha observado que un tratamiento produce una disminución media de la colesterolemia
de 2 mmol/l, con un error estándar de la media de 0,5 mmol/l.
¿Cuál de las siguientes afirmaciones es correcta?
1)
2)
3)
4)
5)
16. En relación con la inferencia estadística es FALSO:
1)
2)
3)
4)
5)
12. Se ha estudiado una muestra de 100 personas, obteniéndose una
glucemia basal media de 80 mg/ml, con una desviación estándar
de 10 mg/ml. La glucemia basal media de la población será:
1)
2)
3)
4)
5)
80 ± 2 mg/ml.
80 ± 20 mg/ml.
80 ± 2 mg/ml, p <0,05.
80 ± 2 mg/ml, p <0,01.
80 ± 3 mg/ml, p <0,01.
13. Leemos en un artículo publicado que la frecuencia cardíaca
media de los varones fumadores es de 70 ± 5 lpm, con p <0,05.
Esto significa:
1)
2)
3)
4)
5)
La probabilidad de que la frecuencia cardíaca media obtenida
en la muestra no sea 70 lpm es menor de 0,01.
El 95% de los sujetos muestreados está entre 60 y 80 lpm.
La probabilidad de que la frecuencia cardíaca media de
los varones fumadores esté entre 65 y 75 lpm es menor
de 0,05.
La probabilidad de que la frecuencia cardíaca media de los
varones fumadores no esté entre 65 y 75 lpm es menor de
0,05.
Se tiene un 95% de confianza de que el verdadero valor
poblacional está entre 60 y 80 lpm.
14. En una muestra de 100 niños se encuentra una colesterolemia
media de 200 mg/dl. Usted ha leído que en la población pediátrica la colesterolemia media es 196 - 204, p < 0,05. Señale qué
intervalo incluye al 95% de los niños de su muestra:
El 95% de los sujetos disminuyeron entre 1,5 y 2,5 mmol/l.­
El 95% de los sujetos disminuyeron entre 1 y 3 mmol/l.
­­­­­­­­
Se tiene un 95% de confianza de que el verdadero descenso
se sitúe entre 1,5 y 2,5 mmol/l.
Se tiene un 95% de confianza de que el verdadero descenso
se sitúe entre 1 y 3 mmol/l.
El 95% de los pacientes con hipercolesterolemia conseguirán descensos entre 1 y 3 mmol/l a ese grado de
significación.
Consiste en estimar un parámetro poblacional a partir de
un dato muestral.
La precisión de los resultados depende principalmente del
valor del parámetro estudiado en la muestra.
Es necesario conocer el tamaño muestral.
Si el tamaño muestral aumenta 4 veces, el error estándar de
la media se reduce a la mitad.
El IC del 99% se calcula con la media muestral +/- el resultado de multiplicar el error estándar de la media por 2,57.
17. Se ha obtenido que en el intervalo (175-225), está incluido el
68% central de una muestra de diabéticos. Si el tamaño muestral
es 100 y la media 200, calcule un intervalo en el que se incluya
el verdadero valor medio poblacional con una probabilidad del
95%:
1)
2)
3)
4)
5)
197,5-202,5
195-205
150-250
199,5-200,5
175-225
18. En una muestra de 100 mujeres, la media de peso fue de 65 kg
con un error estándar de 0,5 kg. ¿Cuál es el intervalo de confianza
del 95% para la media poblacional?
1)
2)
3)
4)
5)
60 - 70
55 - 75
64 - 66
63 - 67
62 - 68
19. En una revista médica se publica un artículo en el que se afirma
que el colesterol medio de los pacientes obesos mayores de 45
años es 260 ± 10 mg/dl, p < 0,05. Esto significa que:
1)
La probabilidad de que el colesterol medio obtenido en la
muestra no sea 260 es menor de 0,05.
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid • Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
2
Test
Estadística
1.ª vuelta Distancia
El 95% de los sujetos muestreados tiene una colesterolemia
entre 240 y 280 mg/dl.
La probabilidad de que el colesterol medio de los pacientes
obesos mayores de 45 años no esté entre 250 y 270 es menor
del 5%.
La probabilidad de que el verdadero valor medio poblacional
esté entre 240 y 280 es del 95%.
El 95% de los sujetos muestreados tiene un colesterol entre
250 y 270.
diferencia es significativa, p < 0,05; lo que se debe interpretar
como que:
20. En una muestra de 37 pacientes se realiza determinación de
la uricemia, obteniéndose una media de 7 y una desviación
estándar de 1. La estimación de la media poblacional (p < 0,05)
será:
26. Se efectuó un estudio para valorar un nuevo procedimiento quirúrgico planeado para disminuir la frecuencia de complicaciones
posoperatorias. La frecuencia de complicaciones fue del 40% en
25 pacientes sometidos al nuevo procedimiento, y del 60% en 20
pacientes en quienes se practicó el procedimiento antiguo. La
diferencia no es estadísticamente significativa. Cabe deducir:
2)
3)
4)
5)
1)
2)
3)
4)
5)
7±2
7±1
7 ± 0,16
7 ± 0,32
7
2)
No se rechaza la hipótesis alternativa, siendo cierta.
Se rechaza la hipótesis alternativa, siendo cierta.
No se rechaza la hipótesis nula, siendo cierta.
Se rechaza la hipótesis nula, siendo cierta.
Se clasifica a un enfermo como tal.
22. En un contraste de hipótesis, la probabilidad de aceptar la
hipótesis nula, siendo falsa es:
1)
2)
3)
4)
5)
5)
1)
21. El error alfa o tipo I es:
1)
2)
3)
4)
5)
1)
2)
3)
4)
3)
4)
5)
1)
5)
23. La capacidad de un test de encontrar diferencias, cuando en
realidad las hay:
1)
2)
3)
4)
5)
1)
2)
3)
4)
5)
Se rechaza la hipótesis nula.
La diferencia es estadísticamente significativa.
La diferencia se debe al azar.
La diferencia es compatible con la hipótesis nula.
La situación laboral no influye en los niveles de glucemia
basal.
25. Al tratar una artritis psoriásica con azatioprina, mejora el 60%
de los pacientes; la 6-mercaptopurina mejora a un 55%. La
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
El nuevo tratamiento es, sin ninguna duda, mejor que el
antiguo.
Si p < 0,05, el resultado no es significativo.
El nuevo tratamiento es un 95% más eficaz que el usual.
Si los dos tratamientos fueran iguales, resultados como los
obtenidos o diferencias aún mayores ocurrirían con una
probabilidad menor del 5%.
No existe la suficiente evidencia como para decir que ambos
tratamientos son diferentes.
28. Indique cuál de las siguientes afirmaciones en relación al contraste de hipótesis le parece FALSA :
Es imprescindible.
Es el error tipo I.
Es el error tipo II.
Es el poder o potencia del test.
Es generalmente de 0,05.
24. Se compara la diferencia entre la media de glucemia basal de dos
grupos de personas, unos con trabajo estable y otros en situación
de desempleo. En el análisis estadístico se obtiene un valor de la
“p” de 0,4. La interpretación correcta del resultado es:
1)
2)
3)
4)
5)
El nuevo procedimiento es eficaz para disminuir las complicaciones posoperatorias.
El nuevo procedimiento es ineficaz para disminuir las complicaciones posoperatorias.
La muestra está sesgada.
El resultado carece de relevancia clínica.
No existe la suficiente evidencia para decir que ambos
procedimientos son diferentes.
27. Al comparar dos fármacos hipoglucemiantes, observamos que
el nuevo es significativamente mejor que el usual ­­­­­­­­­(p < 0,05).
Indique la correcta:
2)
3)
4)
Es la decisión correcta.
Es el error tipo II o beta.
Es la potencia del test.
Es el error tipo I o alfa.
Es nula siempre.
Con azatioprina mejorarán el 60% de tus pacientes.
La azatioprina es en un 95% mejor que la 6-mercaptopurina.
El nivel de significación es del 1%.
Hay diferencias entre los dos tratamientos, a ese nivel de
significación.
No se puede concluir nada.
Si los resultados de un estudio son estadísticamente significativos, por convención, se acepta rechazar la Ho.
Un resultado estadísticamente significativo no demuestra
asociación causal.
Si se ha rechazado la Ho es poco probable cometer un error
tipo II.
El poder estadístico mínimo con el que se debe afrontar un
ensayo clínico es del 80%.
El valor máximo admitido de error alfa para establecer diferencias mediante contraste de hipótesis en trabajos científicos
es del 5%.
29. El resultado de un contraste de hipótesis no es estadísticamente
significativo. Indique la FALSA:
1)
2)
No puede rechazarse la hipótesis nula.
La probabilidad de que el resultado sea explicable por el
azar es mayor del 5%.
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
3
Test
Estadística
3)
4)
5)
Podría haberse conseguido un resultado estadísticamente
significativo con un tamaño muestral mayor.
No hay diferencias.
Las diferencias no exceden lo atribuible al azar.
30. Se quiere comparar un nuevo tratamiento con otro convencional,
para lo que se realiza un contraste de hipótesis, fijando un error
alfa del 1% y un error beta del 3%. ¿Cuál es la probabilidad de
que, existiendo las diferencias, éstas se detecten?
1)
2)
3)
4)
5)
90%
95%
97%
98%
99%
31. Un estudio epidemiológico longitudinal concluye que existe
una asociación estadísticamente significativa entre un factor de
riesgo y determinada enfermedad con un nivel de significación
p < 0,05. ¿Cuál es la conclusión correcta?
1)
2)
3)
4)
5)
En caso de no existir diferencias entre expuestos y no
expuestos al factor de riesgo, la probabilidad de observar
por azar los resultados obtenidos es menor del 5%.
Concluimos que existe asociación real, ya que se ha demostrado asociación estadísticamente significativa.
Hasta el 95% de los expuestos al factor de riesgo desarrollará
la enfermedad.
La asociación no es estadísticamente significativa.
Se confirma relación de causalidad entre el factor de riesgo
y la enfermedad estudiada.
32. Una de las siguientes afirmaciones sobre el contraste de hipótesis
es FALSA:
1)
2)
3)
4)
5)
El valor p es el nivel de significación estadística especificado
para el estudio.
El valor “p” corresponde a la probabilidad alfa de cometer
un error tipo I.
La capacidad del test de detectar diferencias cuando éstas
existen aumenta con el aumento del tamaño muestral.
Un error tipo I consiste en aceptar la hipótesis nula cuando
es falsa.
Los valores de “p” mayores a 5% no indican que la diferencia
sea obligatoriamente debida al azar.
33. Se comparan dos tratamientos para el control de la hiperuricemia.
Antes de comenzar el estudio se establece un nivel crítico del
1%. Se obtiene una “p” de 0,03; indique el enunciado cierto:
1)
2)
3)
4)
5)
El poder con el que se afrontó el estudio fue del 99%.
Los resultados son significativos.
Se consideran significativos resultados con “p” menor al 1%.
La probabilidad de cometer un error alfa en este estudio era
muy alta.
La probabilidad de cometer un error beta en este estudio
era muy alta.
34. Se someten a un estudio comparativo la ticlopidina y la aspirina
en cuanto a capacidad para disminuir el riesgo de sufrir ACVA;
la ticlopidina parece mostrarse más eficaz que la aspirina. Sin
1.ª vuelta Distancia
embargo, la diferencia no resulta estadísticamente significativa
en el contraste de hipótesis para p < 0,05. Usted afirma que:
1)
2)
3)
4)
5)
No hay diferencia de eficacia entre aspirina y ticlopidina.
La ticlopidina es un 5% más eficaz que la aspirina.
La probabilidad de que las diferencias observadas se deban
al azar es menor del 5%.
Es posible que aumentando el tamaño de la muestra
obtengamos diferencias significativas para el mismo nivel
de significación.
Las diferencias entre ticlopidina y aspirina exceden lo atribuible al azar.
35. Para calcular el número mínimo de sujetos que es necesario
incluir en un estudio sobre la prevalencia de un problema de
salud se han de realizar las siguientes asunciones, EXCEPTO:
1)
2)
3)
4)
5)
Proporción de sujetos que se espera encontrar con el problema de salud.
La confianza con la que se quiere dar el IC.
Grado de seguridad deseado.
Error tipo II.
La precisión con que se quiere dar el resultado.
36. Se analizan los resultados de dos ensayos clínicos que comparan
antiagregantes frente a placebo. En el primero se contrasta A
frente a placebo (ictus A: 10%, placebo 40%, p = 0,001). En el
segundo se contrasta B frente a placebo (ictus B: 2%, placebo
50%, p = 0,04). Señale la correcta:
1)
2)
3)
4)
5)
El valor de la “p” demuestra que A es mejor que B.
Como la “p” de B es menor, la eficacia es menor que A.
El fármaco A es menos eficaz.
Como los dos son significativos, se puede decir que la eficacia
es similar.
La probabilidad de que el azar explique las diferencias con
el azar es menor para el fármaco B.
37. La prueba estadística adecuada para comparar las medias
de tensión arterial entre un grupo de fumadores, uno de exfumadores, y otro de personas que nunca han fumado es:
1)
2)
3)
4)
5)
t de Student para datos independientes.
t de Student para datos apareados.
Análisis de la varianza.
Chi-cuadrado.
Coeficiente de correlación de Pearson.
38. ¿Qué test estadístico debemos utilizar para comparar la presencia cualitativa del antígeno de superficie de la hepatitis B
en estudiantes de Medicina y Odontología?
1)
2)
3)
4)
5)
t de Student.
Test de McNemar.
ANOVA.
Chi-cuadrado.
Test de Friedman.
39. Se comparan tres tratamientos en cuanto a eficacia en la reducción del número de lesiones de acné en pacientes adolescentes
de 14 a 16 años. ¿Qué tipo de test estadístico aplicaremos?
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid • Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
4
Test
Estadística
1)
2)
3)
4)
5)
1)
2)
3)
4)
t de Student.
ANOVA.
Regresión lineal.
Chi-cuadrado.
Coeficiente de correlación de Spear­man.
5)
40. Para comparar la tensión arterial dias­tólica en dos muestras de
mujeres, embarazadas y no embarazadas, el test más apropiado
es:
1)
2)
3)
4)
5)
Chi-cuadrado.
Regresión lineal.
Test exacto de Fisher.
t de Student.
Test de Wilcoxon.
41. Se pretende establecer una ecuación, mediante la que pueda
predecirse el tiempo de reproducción, en base al conocimiento
del fotoperíodo (número de horas de luz/día). ¿Qué tipo de test
utilizaremos?
1)
2)
3)
4)
5)
Coeficiente de correlación.
Análisis de regresión.
Test exacto de Fisher.
t de Student para muestras independientes.
Test de Friedman.
42. Un coeficiente de correlación de Pearson de -1 indica:
1)
2)
3)
4)
5)
No hay correlación.
Existe una débil correlación.
Existe una fuerte correlación.
Al aumentar los valores de la variable x, aumentan los valores
de la variable y.
Al disminuir los valores de la variable x, disminuyen los
valores de la variable y.
43. Son datos apareados:
1)
2)
3)
4)
5)
Tensión arterial en mujeres, frente a tensión arterial en
hombres.
Tiroxina en una muestra pequeña, frente a tiroxina en una
muestra grande.
Aclaramiento de creatinina en una muestra, frente a aclaramiento de creatinina en la población de la que ha sido
extraída la muestra.
Glucemia antes de comer, frente a glucemia después de
comer.
Talla en hombres frente a talla en mujeres.
44. Para comparar el descenso medio en la carga viral del VIH que
se observa al emplear indinavir y saquinavir, se utiliza:
1)
2)
3)
4)
5)
Chi-cuadrado.
t de Student.
Correlación de Pearson.
Test de Spearman.
ANOVA.
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
Son menos potentes que las paramétricas.
Son útiles en muestras pequeñas.
Son útiles en el caso de variables ordinales.
Requieren ciertas asunciones sobre la distribución de las
variables en la población.
Pueden utilizarse para comparar variables de tipo cuantitativo.
46. ¿Qué prueba estadística de las siguientes usaría para comparar el resultado (curación/no curación) de tres tratamientos
distintos?
1)
2)
3)
4)
5)
ANOVA.
Test de Spearman.
t de Student.
Chi-cuadrado.
Test de Wilcoxon.
47. Una muestra de 25 pacientes nefrópatas se somete a determinación cuantitativa de ADN viral (VHB), antes y después de ser
sometidos a hemodiálisis. ¿Qué test emplearía para comparar
los resultados obtenidos?
1)
2)
3)
4)
5)
t de Student para datos apareados.
t de Student para datos independientes.
Correlación de Pearson.
Test de la U de Mann-Whitney.
Test de Wilcoxon.
48. El propósito de un estudio fue identificar el coeficiente de
correlación r entre tamaño de las neoplasias retroperitoneales
primarias y el número de síntomas. Se analizaron en 46 casos
de NRP su coeficiente de correlación r entre tamaño y número
de síntomas mediante un estudio retrospectivo, comparativo
y observacional. El coeficiente de correlación r entre el tamaño
de las NRP y el número de síntomas fue de 0.32 (p=0.02). La
asociación de los 3 síntomas más frecuentes encontrados en
nuestro estudio, fue más frecuente en el grupo de sarcomas que
en los no sarcomas con una Chi-cuadrado de 4,06 (Chi-crítica
3,84), p < 0.05 y odds ratio 7,5 (a favor de los sarcomas). De las
siguientes afirmaciones, es cierta:
1)
2)
3)
4)
5)
45. ¿Cuál de las siguientes afirmaciones sobre las pruebas estadísticas no paramétricas es falsa?
1.ª vuelta Distancia
Se trata de un estudio de cohortes concurrentes.
La probabilidad de que la asociación encontrada entre
el tamaño de la neoplasia retroperitoneal y el número
de síntomas sea debida al azar es demasiado alta (32%)
para considerar los resultados estadísticamente significativos.
Los resultados de este estudio sugieren una débil correlación negativa entre el tamaño de la neoplasia retroperitoneal y el número de síntomas.
Los resultados de este estudio sugieren que, a mayor
tamaño de la neoplasia retroperitoneal, el número de
síntomas es mayor.
No hay asociación entre el tipo de tumor retroperitoneal
y la presencia de los tres síntomas más frecuentes.
49. Para saber si hay diferencias significativas en la gravedad de
la UVI de tres hospitales, se compara el test de Glasgow en las
diferentes instituciones. Señale qué test estadístico emplearía
con este propósito:
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
5
Estadística
1)
2)
3)
4)
5)
Test
1.ª vuelta Distancia
ANOVA.
Test multivariante.
Kruskal-Wallis.
Chi-cuadrado
Wilcoxon.
50. Es una prueba de contraste de hipótesis útil para establecer
relación entre una variable cualitativa y otra cuantitativa:
1)
2)
3)
4)
5)
Distribución t de Student.
Análisis de regresión.
Corrección de Yates.
Test de Mann-Whitney.
Prueba de Spearman.
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid • Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
6
Estadística
Comentarios de Test a distancia 1.ª vuelta
Comentarios de Test a distancia
1.ª vuelta
Estadística
Pregunta 1.- R: 3
Los estudios estadísticos pretenden llegar a conocer a la población a
partir de un análisis de una muestra de individuos.
Lo que se estudia acerca de cada individuo de la muestra es lo que se
llama carácter o variable; es decir, se trata de una característica observable en los individuos. El color de los ojos, el estado civil, el número de
hijos, las pulsaciones por minuto, la talla o la velocidad de sedimentación
constituyen ejemplos de variables.
Las variables cuantitativas son aquellas que pueden medirse, cuantificarse
o expresarse de forma numérica; las variables que no pueden cuantificarse numéricamente reciben el nombre de variables cualitativas; estas
variables, por lo tanto, toman valores no numéricos.
Dentro de las opciones, hay dos variables cuantitativas: la glucemia y
el número de camas. Cuando entre dos categorías cualquiera de una
variable, podemos interponer otra (por ej., entre 80 y 81 mg/dl de glucemia, tenemos 80,5) la variable es continua. El número de camas por
el contrario es discreta.
VARIABLE
Cualitativa
Cuantitativa
SUBTIPO
EJEMPLO
Nominal dicotómica
Sexo
Nominal no dicotómica
Raza
Ordinal
Nivel socioeconómico
Discreta
N.º episodicos de asma/semana
Continua
Uricemia
Pregunta 1. Tipos de variables.
Pregunta 2.- R: 3
Duración del sangrado menstrual, número de familias numerosas/1.000 habitantes, consumo diario de cigarrillos y colesterol
sérico son variables en las que se asignan números a cada una de las
categorías posibles y, lo que es más importante, en las que dichos
guarismos tienen valor matemático, es decir, fumar 20 cigarillos es
el doble que fumar 10. Sin embargo, hay ciertas variables en las que,
aunque utilicemos números para las distintas categorías, estos números carecen de valor matemático. Un ejemplo de estas variables
es la escala de Glasgow.
Esta escala se utiliza para la exploración del coma o del traumatismo
craneoencefálico y en ella se consideran tres parámetros: respuesta
motora, ocular y verbal. Según el estado del paciente, se asignan unos
puntos a cada parámetro, obteniéndose un resultado final que va de 3,
que se considera una situación muy grave, a 15, que sería una situación
de normalidad.
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
Pero si te das cuenta, estos números no aportan un valor matemático (7
no significa “doble” peor pronóstico que 14), sino que son tan sólo una
manera arbitraria de aproximarnos con números a categorías cualitativas
(desde normalidad a coma profundo).
Esta variable, la escala de Glasgow, por lo tanto, es cualitativa, y como las
categorías de esta variable tienen una manera lógica de ordenarse (de
3 a 15), se denomina cualitativa ordinal, a diferencia de otras variables
cualitativas (por ej., el color de pelo) que no pueden ser ordenadas de
un modo lógico y se denominan nominales.
Pregunta 3.- R: 5
El primer escalón dentro de la estadística es el descriptivo. En esta fase
se realiza la recogida de la información, que debe ser posteriormente
ordenada, resumida y presentada de una forma comprensible que permita
pasar posteriormente a la segunda fase, que es el análisis de los datos.
Dentro del apartado de estadística descriptiva nos encontramos con
las medidas de centralización que se mencionan en esta pregunta: la
media, la mediana y la moda.
La media se obtiene sumando todos los valores numéricos observados
y dividiendo el resultado por el número de observaciones. Es la medida
de centralización más empleada. Recuerda que es muy sensible a las
observaciones atípicas. En este caso: 31, que es la suma total, entre 9,
que es el número de observaciones, da 3,4.
La mediana sólo emplea el valor central de la serie (es decir, el que deja a
cada lado, la misma proporción de la muestra); sin embargo, se afecta menos por observaciones atípicas (por ejemplo, errores de medida). En este
caso, es 3. La moda es el dato que más se repite en una serie, puede no ser
un valor único, a diferencia de los otros dos parámetros. En este caso, es 2.
Pregunta 4.- R: 4
Las medidas de centralización informan sobre alrededor de qué valores
se agrupan los datos observados; son la media, la mediana y la moda.
La medida de centralización más utilizada es la media aritmética, si bien,
en ciertas circunstancias, es mejor utilizar la mediana.
Es preferible el uso de la mediana como medida de centralización en
los siguientes casos:
• Mediciones atípicas.
• Errores de medición.
• Muestra no homogénea.
• Distribución asimétrica.
En el estudio que nos plantean, el dato de centralización aportado es
la mediana, por lo que es de suponer que estamos bajo alguno de los
supuestos anteriores.
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
1
Estadística
La opción 3 (“La muestra estudiada no es homogénea”) es falsa porque
no sabemos con seguridad cuál ha sido el motivo para calcular la mediana en vez de la media.
De todas las opciones, la que encaja con todo lo expuesto es la 4 (“Es
posible que alguno de los sujetos estudiados haya presentado un número
elevado de catarros”), es decir, es posible que hayan aparecido observaciones atípicas y, por eso, haya sido preferible el cálculo de la mediana.
Pregunta 5.- R: 4
El concepto de dispersión implica “cuánto están de separados los datos
con respecto al dato central (a la media)”, por tanto, se puede calcular
como la suma de las diferencias con la media de los datos. Hay que tomar
los valores absolutos, ya que, puesto que hay unos datos mayores que
la media y otros menores, el sumatorio de las diferencias daría cero si
no se emplease esta argucia matemática. Posteriormente se divide la
suma total entre el número de individuos de la muestra, para que sea
comparable con otras dispersiones en otras series con distinto número de
individuos. Así se obtiene la desviación media de los datos con respecto
a su media aritmética.
Avanzando un poco más, podemos, a partir de la desviación media,
obtener un mejor índice de dispersión: si en vez de trabajar con valores
absolutos, elevamos al cuadrado las diferencias, también nos deshacemos de los números negativos, y pasamos a trabajar con “áreas” en vez
de segmentos (las diferencias se elevan al cuadrado); hemos obtenido
la varianza, que es una excelente medida de dispersión.
El problema de la varianza es que sus unidades son las mismas que las
de los datos pero elevadas al cuadrado, lo cual es matemáticamente
incómodo, por ello se obtiene la raíz cuadrada positiva del resultado de
la varianza para manejarse más cómodamente; a este valor se le llama
desviación típica, y es el mejor índice de dispersión.
El rango o recorrido es la media de dispersión más elemental. Su interés
es muy relativo, ya que utiliza solamente dos datos de la serie (el primero
y el último), que son, precisamente, los menos representativos, puesto
que son los valores extremos o más raros de la variable.
MEDIDA DE CENTRALIZACIÓN
MEDIDA DE DISPERSIÓN
Distribución
homogénea
Media
Desviación típica
o estándar
Distribución
asimétrica
Mediana
Rango intercuartílico
Rango
Pregunta 5. Formas de medida.
Pregunta 6.- R: 5
El coeficiente de variación es adimensional, debido a que representa el
porcentaje de la desviación estándar sobre la media.
Su utilidad está en que sirve para comparar la variabilidad de dos o más
distribuciones, estén expresadas en las mismas o en diferentes unidades.
Por tanto, la opción 5 es la falsa.
La forma de comparar dos desviaciones típicas de muestras diferentes
se hace mediante el coeficiente de variación, que considera cada desviación en relación a la muestra de la que procede, es decir, en relación
(división) a la media de la muestra. Mediante la relación, se obtiene una
medida adimensional que puede compararse con la de otra muestra.
Después de hablar de las medidas de dispersión surge la pregunta
“¿Cuándo se puede decir que una distribución es concentrada o dispersa?, ¿a partir de qué valor de la desviación típica?”. En general, para
distribuciones biológicas de datos, sin valores negativos, se pueden
considerar concentradas aquellas cuya desviación típica no excede 1/3
del valor de la media. Desviaciones superiores a la mitad de la media se
traducen en dispersiones excesivas.
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
Comentarios de Test a distancia 1.ª vuelta
Pregunta 7.- R: 4
La distribución normal sigue una forma de campana en la que el valor
central es la media y también la mediana (puesto que la campana es
simétrica) y la moda (puesto que en ese punto la curva tiene su máxima
altura).
Entre ± 1 desviación estándar se encuentra el 68% de las observaciones
y entre ± 2 desviaciones estándar están el 95% de las observaciones. Por
tanto, entre 1 y 2 desviaciones estándar se encuentran el 27% (95-68),
por lo que la opción 4 es incorrecta.
El resto de opciones resumen una serie de características que debes
conocer sobre la curva de Gauss.
Pregunta 7. Distribución normal.
Pregunta 8.- R: 3
Los percentiles son parámetros de posición que dividen el conjunto de
las observaciones en 100 partes iguales. El percentil (Pc) 80 nos indica
que el 80% de nuestras observaciones serán menor o igual a su valor (en
esta pregunta 120), o lo que es lo mismo, el 20% de las observaciones
serán mayor a 120 (respuesta 3 correcta). El percentil 50 equivale a lo
mismo que la mediana.
Pregunta 9.- R: 1
Los parámetros que definen a una muestra son su tamaño, una medida
de tendencia central y una de dispersión. Las más utilizadas son la media
y la desviación típica, sin embargo, nos especifican que tenemos una
muestra SESGADA, es decir, heterogénea o asimétrica, por eso preferimos
usar la mediana y, por lo tanto, el rango intercuartílico.
Pregunta 10.- R: 2
La mediana es una medida de tendencia central cuya principal utilidad
es en muestras heterogéneas, ya que elimina los valores extremos.
Recuerda que en las distribuciones normales, la media, la moda y la
mediana son iguales, por eso la respuesta 5, aunque es la definición de
la moda, es correcta.
Pregunta 11.- R: 5
En los estudios estadísticos se escoge una muestra pequeña de la población y sobre ella se realizan todas las mediciones; estos resultados
son ciertos para el 100% de la muestra, es decir, que en la muestra no
se aporta ninguna probabilidad de error porque conoces a todos los
individuos de la misma. Por eso es falsa la opción 4 y correcta la opción
5 (“El 68% de las personas que participaron en este estudio tienen una
TAD entre 55 y 65”). Observa que en esta formulación, que hace referencia
a la muestra, no se da probabilidad de error (p).
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
2
Estadística
Una vez expuestos los resultados de tu estudio, se deben generalizar
o inferir a la población; durante este proceso hay que aceptar que la
muestra, por muy representativa que sea, nunca va a ser idéntica a la
población y, por tanto, la generalización va a tener que asociar una probabilidad de que en el intervalo de confianza estimado NO se encuentre
la verdadera medida del parámetro estimado (el valor que se obtendría
si se calculase con toda la población).
Como ves, siempre que acompañando a un intervalo vaya una “p” podemos deducir que se trata de un intervalo de confianza que, con con una
probabilidad dada, contendrá al verdadero parámetro en la población.
Con los datos que aportan en esta pregunta (media y desviación estándar) no se puede calcular el intervalo de confianza, ya que falta el
tamaño muestral.
Pregunta 12.- R: 3
En esta pregunta nos están pidiendo un intervalo en el que con una
confianza determinada (95% o 99%) esté la media poblacional de glucemia, por lo que las dos primeras opciones NO pueden ser correctas,
ya que al estimar un parámetro en la población (en este caso una media)
hay que aportar la probabilidad de que en ese intervalo no esté el valor
poblacional (la “p”).
Como dos de las opciones tienen una p < 0,01, calcularemos en primer
lugar el intervalo de confianza del 99% y, en caso de que NO coincida
con estas dos opciones, marcaremos la opción 3.
IC 99% = X +
– 2,6
DS
Pregunta 14.- R: 3
Es importante darse cuenta de que en esta pregunta, aunque nos
dan algunos datos poblacionales, lo que se pide es un intervalo que
comprenda al 95% de una muestra. Este intervalo (que NO se llama de
confianza), si la variable sigue una distribución normal (en caso de que
este dato no lo aporten, como ocurre casi siempre en el MIR, se asume
que es así) se calcula:
X ± 2 x DS
Del enunciado, extraemos que la media es 200 mg/dl y el dato que nos
falta es la desviación típica.
Para determinar la desviación típica es necesario darse cuenta de que en
el cálculo del dato poblacional que nos aporta el enunciado (el intervalo
de confianza del 95%) está la desviación típica.
IC 95% = X +
– 2
DS
n-1
Aplicando la fórmula:
IC 95% = 200 +
– 2
DS
100
(Date cuenta de que generalmente al tamaño muestral NO se le resta
uno, ya que la diferencia del resultado es mínima y el cálculo de la raíz
cuadrada es mucho más sencillo).
Sustituimos el IC 95% por los valores que nos dan en el enunciado de
la pregunta:
n-1
Aplicando la fórmula:
IC 99% = 80 +
– 2,6
Comentarios de Test a distancia 1.ª vuelta
DS
10
196 - 204 = 200 +
– 2
100
100
IC 99% = 80 +
– 2,6
Si desarrollamos esta ecuación (eligiendo el límite superior o el inferior
del IC), tenemos:
Como vemos, el resultado NO coincide con las dos últimas opciones,
por lo que la correcta es la tercera:
IC 95% = 80 +
– 2
10
204 - 200 = 2 (DS/10)
4 = 2 DS / 10
40 = 2 DS; DS = 20
100
De cara al cálculo del intervalo de confianza, en el MIR, si la raíz cuadrada
del tamaño muestral es un número entero (por ejemplo, raíz de 100), se
suele redondear y no se resta 1.
Pregunta 13.- R: 4
La clave de esta pregunta es tener claro qué es un intervalo de confianza
y cómo se expresa.
Un intervalo de confianza es una horquilla de dos valores entre los que
hay una probabilidad dada de que se encuentre el valor poblacional de
determinada medida (una media, una prevalencia).
Los intervalos de confianza se pueden dar desarrollados (por ejemplo,
65-75 lpm, p < 0,05) o sintéticos (por ejemplo, 70 ± 5 lpm, p < 0,05).
Lo más importante es darse cuenta de que en el enunciado de esta pregunta YA nos dan el intervalo de confianza (en el 5 está comprendido 2 x
error estándar de la media), por lo que la probabilidad de que la media
de frecuencia cardíaca en la población NO esté en ese intervalo que nos
dan es menor del 5%, que es lo que dice la opción 4.
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
Ahora que ya tenemos la desviación típica, podemos calcular el intervalo
de la muestra por el que nos preguntaban:
X ± 2 x DS
Aplicación de la fórmula:
200 ± 2 x 20 = 200 ± 40 = 160 - 240
Pregunta 15.- R: 4
Con los datos que aporta el enunciado (tamaño muestral, media y error
estándar de la media), podemos calcular la desviación típica, por lo que,
de todas la opciones, puede ser cierta alguna que hable de la muestra
(cuyos intervalos se calculan con la media y la desviación típica) o de la
población (cuyos intervalos de confianza se calculan con la media y el
error estándar de la media).
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
3
Estadística
Ya que nos dan el error estándar de la media, lo más fácil es calcular
primero el IC 95% y, en caso de que no coincida con las opciones que
hablan de la población (la 3 y la 4), desarrollar después el intervalo que
incluye el 95% de la muestra y comprobar con cuál de las opciones que
se refieren a la muestra (opciones 1 y 2) coincide.
IC 95% = X ± 2 x EEM
Comentarios de Test a distancia 1.ª vuelta
Nos dicen que el 68% de la muestra está comprendido entre 175 y 225,
por lo que:
X ± DS = 175 - 225
200 ± DS = 175 - 225
Desarrollando esta ecuación, obtendremos que la DS es 25.
Ahora sólo tenemos que retomar la fórmula del IC 95%:
Aplicación de la fórmula:
IC 95% = 200 ± 2 (DS/10)
IC 95% = 200 ± 2 (25/10)
IC 95% = 200 ± 2 x 2,5
IC 95% = 200 ± 5
IC 95% = 195 - 205
IC 95% = 2 ± 2 x 0,5
IC 95% = 2 ± 1
Es decir, que se tiene un 95% de confianza de que el verdadero descenso
medio se sitúe entre 1 y 3 mmol/l, que es lo que dice la opción 4).
Pregunta 16.- R: 2
La inferencia estadística o estimación de parámetros consiste en estimar
un parámetro poblacional a partir de un dato de la muestra que ha sido
estudiada. La precisión de los resultados de un estudio no depende
principalmente del valor del parámetro estudiado en la muestra, sino
del tamaño muestral. Dicho de otro modo, que el intervalo de confianza
quede más o menos estrecho no depende de que la media me haya
salido 80 o 120, sino de que tenga 30 o 300 personas en el estudio. Así
que la opción FALSA es la 2. En la fórmula del error estándar de la media
(EEM), la desviación típica está en el numerador y el tamaño muestral
en el denominador. Para reducir el EEM, no podemos actuar sobre el
numerador, ya que la desviación típica es una característica que depende de la variable que estamos midiendo. Lo que sí podemos hacer es
aumentar el denominador, es decir el tamaño muestral, de modo que
al aumentar el tamaño muestral cuatro veces (como está dentro de una
raíz cuadrada), conseguimos disminuir el EEM a la mitad. De modo que
si un intervalo de confianza es demasiado amplio y queremos reducirlo
(esto es, ganar en precisión), deberemos aumentar el tamaño muestral.
Recuerda que aunque calculamos el IC del 99% con la media muestral
+/- eem x 3, en realidad es una“licencia”matemática que nos permitimos,
el valor real es media muestra -/- eem x 2,57 como dice la respuesta 5,
pero es mucho más fácil multiplicarlo por 3 (eso no quiere decir que lo
apliques así si tienes que calcularlo, sólo que conozcas el concepto). De
la misma manera, el IC del 95% lo calculamos con la media muestral +/eem x 2, pero el valor real es media muestral +/- eem x 1,96.
Pregunta 17.- R: 2
En esta pregunta nos piden un intervalo que incluya con una probabilidad del 95% la verdadera media poblacional, es decir, el intervalo de
confianza del 95%:
IC 95% = X +
– 2
DS
n-1
Aplicación de la fórmula:
IC 95% = 200 +
– 2
DS
Pregunta 18.- R: 3
En esta pregunta nos piden el intervalo de confianza del 95%, y tenemos
que andar con mucho ojo porque podemos confundirnos si creemos
que en el enunciado nos están dando el tamaño muestral, la media y
la desviación estándar, es decir, los datos más habituales con que nos
piden un IC.
DS
196 - 204 = 200 +
– 2
100
Sin embargo, en esta pregunta no nos hablan de desviación estándar
o típica sino de error estándar, y por eso para el cálculo del intervalo de
confianza no tenemos que dividir 0,5 entre la raíz de 100, ya que 0,5 ya
es el error estándar.
Así que el IC 95% será:
IC 95% = 65 ± 2 x 0,5
IC 95% = 64 - 66
Recuerda que en la muestra no se da probabilidad de error, así que ERROR
estándar de la media tiene que ser un dato de dispersión poblacional.
Pregunta 19.- R: 3
Para contestar a esta pregunta hay que tener claro que 260 ± 10 con
una p < 0,05 no puede ser otra cosa que el intervalo de confianza del
95% (recuerda que en la muestra no hablamos de confianza y no se
aporta probabilidad de equivocarnos, es decir, la “p”) y que en el 10 ya
está incluido 2 x EEM.
Si nos ha quedado claro lo anterior, la probabilidad de que en ese intervalo NO esté la verdadera media poblacional de colesterol será del 5%,
que es lo que dice la opción correcta (la 3).
Si te das cuenta, con los datos que aporta el enunciado (NO nos dan
tamaño muestral, por lo que NO podemos calcular la desviación típica
a partir del intervalo de confianza), NO podemos calcular intervalos de
la muestra, por lo que aquellas opciones que hablen de la muestra (1,
2 y 5) serán falsas.
Pregunta 20.- R: 4
En esta pregunta nos piden el intervalo de confianza del 95% y nos
aportan todos los datos necesarios para su cálculo:
100
IC 95% = 200 ± 2 (DS/10)
DS
Para su cálculo nos falta la desviación estándar, que no nos la dan
directamente, pero que la podemos buscar en un dato de la muestra.
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
196 - 204 = 200 +
– 2
100
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
4
Estadística
Aplicación de la fórmula (aquí sí restamos 1 al tamaño muestral, ya que
en este caso facilita el cálculo):
1
IC 95%= 7 +
– 2
36
IC 95% = 7 ± 2 (1/6)
IC 95% = 7 ± 0,32
Pregunta 21.- R: 4
Cuando se comparan dos muestras o grupos (por ejemplo, dos grupos de
personas sometidos a dos tratamientos distintos), incluso aunque entre
estos dos grupos no hubiera diferencia, al medir en ellos una variable
resultado (por ejemplo, respuesta o no a un analgésico o disminución de
la TA con una antihipertensivo) es muy poco probable que el promedio
de la variable resultado de ambos grupos sea exactamente el mismo.
Para entender en qué consiste el contraste de hipótesis, deberemos partir
del anterior razonamiento: “en caso de que ambos grupos sean iguales,
se pueden obtener pequeñas diferencias en la variable resultado que
se deben a la variabilidad del muestreo”.
En contraste de hipótesis, al supuesto de que ambos grupos o muestras provienen de una población homogénea (es decir, de que son iguales o de que
no hay diferencias entre ellos), lo llamamos hipótesis nula (Ho) y las diferencias
que se deben al muestreo son diferencias que se pueden explicar por el azar.
Por lo tanto, podríamos repetir el anterior argumento con otros términos:
“en caso de que la Ho sea cierta, se pueden obtener pequeñas diferencias
en la variable resultado que se deben al azar”.
¿Y en qué consiste el contraste de hipótesis? Consiste en establecer si
las diferencias que se han obtenido entre los dos grupos son probablemente debidas al azar (a la variabilidad en el muestreo) y, por lo tanto,
no podremos refutar la hipótesis nula o si, por el contrario, las diferencias
obtenidas son demasiado grandes y la probabilidad de que se deban
al azar es pequeña y, por tanto, rechazaremos la Ho y diremos que las
diferencias son compatibles con la hipótesis alternativa (H1), que es
aquella que sostiene que ambos grupos son distintos.
Lo más importante de todo es darse cuenta de que, cuando rechazamos
la Ho, no estamos completamente seguros de que las diferencias encontradas no se deban al azar. Lo que ocurre es que, como la probabilidad
de que se deban al azar es tan pequeña, nos inclinamos a pensar que
la que es cierta es la H1.
¿Y qué parámetro estadístico es el que determina cuál es la probabilidad de
que la diferencia obtenida se deba al azar? El grado de significación (la “p”).
Proponemos un ejemplo para la comprensión de uno de los conceptos
más importantes de la Estadística y del bloque de Estadística en el
examen MIR.
Para comparar la TAD de los hombres y las mujeres, se recluta a 10
mujeres y 10 hombres sin HTA y se les toma la TAD. Se calcula la media
aritmética de ambos grupos, y el resultado es:
X de TAD en hombres: 80
X de TAD en mujeres: 63
Según estos resultados, estaríamos tentados a decir que la TAD es distinta en hombres y en mujeres, pero ANTES de afirmar dicha diferencia,
deberemos preguntarnos: ¿estas diferencias encontradas no se deberán
a la variabilidad que deriva de trabajar con muestras en vez de con toda
la población de mujeres y hombres?
Imaginamos que se calcula el grado de significación y se obtiene un 3%,
es decir, la probabilidad de que estos resultados (la diferencia obtenida en
nuestro estudio) se deba al azar es muy pequeña, por lo que tendremos
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
Comentarios de Test a distancia 1.ª vuelta
suficiente evidencia para rechazar la hipótesis nula y decir que entre los
dos grupos hay diferencias.
Pero, ¿es posible que habiendo dicho que la TAD en hombres es distinta
a la de mujeres nos hayamos equivocado?
Efectivamente, la probabilidad de que hayamos rechazado la Ho y fuese
cierta (lo que se denomina error tipo I), coincide con la probabilidad de
que las diferencias encontradas se deban al azar (es decir, que NO haya
diferencias), esto es, el grado de significación.
Por lo que, recapitulando: siempre que rechazamos la hipótesis nula,
deberemos aportar la probabilidad de que nos equivoquemos, es decir,
de cometer un error tipo I: la “p”.
Pregunta 22.- R: 2
En el caso de que la hipótesis nula fuese falsa (esto es, si en realidad
hubiese diferencias) y el grado de significación obtenido no fuera tan
pequeño como el nivel mínimo exigido en Estadística (5%), NO podremos
rechazar esa hipótesis nula, aunque sea falsa.
A ésto, en contraste de hipótesis, se le denomina error tipo II.
Es importante insistir en que cuando no se tiene suficiente evidencia
para rechazar la Ho, no por ello se dice que sea cierta.
REALIDAD
RESULTADOS
DEL TEST
EXISTE DIFERENCIA
Ho falsa
NO EXISTE
DIFERENCIA
Ho cierta
Hay diferencias
significativas
Rechazo Ho
1-beta
Poder estadístico
o potencia del test
Error tipo I
o error alfa
No hay diferencias
significativas
No rechazo Ho
Error tipo II o error
beta
1-alfa
Pregunta 22. Contraste de hipótesis.
Pregunta 23.- R: 4
El poder o potencia estadística es la capacidad de demostrar las diferencias en caso de ser ciertas (esto es, rechazar la hipótesis nula siendo
falsa ésta y siendo cierta la alternativa).
En el caso de que la hipótesis nula fuese falsa (esto es, si en realidad
hubiese diferencias), nos podemos encontrar con dos situaciones:
• No rechazamos la Ho: error tipo II.
• Rechazamos la Ho: poder estadístico.
Como puedes ver, el poder estadístico es el complementario del error
tipo II, es decir, si antes de arrancar un estudio, aceptamos un error tipo
II del 10%, sabremos que la probabilidad de demostrar diferencias, en
caso de haberlas, será del 90%.
Pregunta 24.- R: 4
Cuando se comparan dos grupos con alguna característica que los diferencia (en este caso, la situación laboral) tratamos de demostrar que la
diferencia que se obtiene en la variable resultado (en este caso, la glucemia basal) no se debe al azar, es decir, que es muy raro que se pueda
explicar tan sólo por el hecho de la variabilidad normal de las personas.
Si al comparar dos medias nos encontramos que la probabilidad de
que las diferencias halladas puedan deberse al azar es del 40% (p=0,4),
podremos decir:
• Los resultados NO son significativos.
• No hemos obtenido suficiente evidencia para rechazar la Ho.
• La probabilidad de que esos resultados (esas diferencias) puedan
deberse a variaciones en el muestreo es bastante alta, por lo que
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
5
Estadística
•
posiblemente NO haya verdaderas diferencias, es decir, los resultados
son compatibles con la hipótesis nula (opción 4 correcta).
Es POSIBLE que se haya cometido un error tipo II y, quizás, si aumentásemos el tamaño muestral los resultados serían significativos.
Recuerda que si los resultados del estudio son NO significativos no podemos afirmar que la hipótesis nula sea falsa, es decir, que NUNCA valdrá
una opción como la 5 (“La situación laboral no influye en los niveles de
glucemia basal”) que afirme que no hay diferencias, ni otra en la que se
afirme de manera tajante que los resultados se deben al azar (la opción
3 es falsa por ésto), ya que no estamos seguros de que los resultados se
deban al azar (siempre es posible que se haya cometido un error tipo II).
Por tanto, si la “p” es NO significativa, lo mejor es buscar una opción que
diga:“No se ha obtenido evidencia de que los dos grupos de estudio sean
distintos”. Dicho en palabras más sencillas: “No he demostrado nada”.
Pregunta 25.- R: 4
Incluso si la eficacia de la azatioprina y la 6-mercaptopurina fuese igual
(Ho cierta), es rarísimo que el porcentaje de respuesta sea exactamente igual en dos grupos de personas; lo que tenemos que decidir es si
las diferencias observadas (60% de mejora con azatioprina y 55% con
6-mercaptopurina) se pueden deber al azar; la respuesta a esta pregunta
es el grado de significación, que en este caso es menos del 5%, por lo
que podremos decir que hay diferencias entre esos dos tratamientos
(rechazaremos la Ho), con una probabilidad de equivocarnos (es decir,
de que se deban al azar) menor del 5%, que es lo que dice la opción 4.
Pregunta 26.- R: 5
Nos encontramos con dos grupos de pacientes que, sometidos a distintos procedimientos quirúrgicos, presentan un porcentaje de complicaciones distinto, que desde el punto de vista clínico es importante.
Lo que hay que establecer es con qué probabilidad estas diferencias
pueden ser explicadas por el azar; en el enunciado no nos lo dan directamente, pero la probabilidad de que el azar explique las diferencias
debe de ser mayor del 5%, ya que nos dicen que la diferencia no es
estadísticamente significativa.
Es importante recalcar que, cuando no se tiene suficiente evidencia
para rechazar la Ho, no por ello se dice que sea cierta, por eso lo único
que podremos decir es que no existe evidencia para decir que ambos
tratamientos son diferentes (opción 5 correcta), pero NO podremos
aseverar que los dos tratamientos son iguales.
Pregunta 27.- R: 4
Pongamos un ejemplo que podría ser el del enunciado de esta pregunta:
en 35 personas tratadas con el hipoglucemiante A se consigue como
media una reducción de la glucemia de 45 mg/dl y en 35 personas tratadas con el hipoglucemiante B se consigue como media una reducción
de la glucemia de 60 mg/dl. En el contraste de hipótesis se calcula cuál
es la probabilidad de encontrar estos resultados si los dos tratamientos
fuesen iguales y se obtiene un grado de significación del 2%.
Trasladado a cómo está formulada la pregunta, si los dos tratamientos
fuesen iguales (si la Ho fuese cierta), resultados como los obtenidos
o diferencias aún mayores (en nuestro ejemplo, diferencias mayores
a 60-45), ocurrirían con una probabilidad menor del 5% (en nuestro
caso con una probabilidad del 2%), que es lo que dice la opción 4.
Pregunta 28.- R: 3
Si los resultados de un estudio son estadísticamente significativos, por
convención, se acepta rechazar la Ho, esto es, se afirma que es poco
probable que sea cierta en base a las diferencias observadas entre los
distintos grupos estudiados. Pero a pesar de haberse encontrado una
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
Comentarios de Test a distancia 1.ª vuelta
diferencia elevada (resultado estadísticamente significativo), eso no
indica que haya una asociación causal.
Es importante que entiendas que si rechazamos la Ho el único error que
tiene cabida en esta situación es que, aunque la hemos rechazado, fuera
cierta, es decir, un error tipo I o alfa, por lo que no es poco probable
cometer un error tipo II, es imposible cometer un error de este tipo (la
opción 3 es FALSA).
El poder estadístico mínimo con el que se debe afrontar un ensayo
clínico (como dice la opción 4) es del 80 %, ya que si se hace con
un poder inferior se está poniendo en cierto riesgo a un grupo de
personas cuando la probabilidad de encontrar diferencias, si las
hay, es pequeña y eso no es éticamente aceptable.
El valor máximo admitido de error alfa para establecer diferencias mediante contraste de hipótesis en trabajos científicos es del 5%; el otro
valor habitualmente utilizado (más estricto) es el 1%. Dicho de otro
modo, los niveles críticos que se manejan en estudios epidemiológicos
son el 5% y el 1%.
Pregunta 29.- R: 4
Cuando el grado de significación obtenido es mayor que el nivel crítico
fijado (habitualmente el 5%), la probabilidad de que las diferencias observadas sean debidas al azar es demasiado alta (fíjate que “demasiado
alta” puede ser un 6%), por lo que no tenemos suficiente evidencia para
rechazar la hipótesis nula.
No rechazar la hipótesis nula NO significa que sea cierta (es más, un
grado de significación cercano al 5% sugiere que hay diferencias, pero
que éstas pueden deberse al azar con una probabilidad no tan baja
como la exigida), por lo que NO podremos decir que no haya diferencias
(opción 4 falsa).
Pregunta 30.- R: 3
La probabilidad de que existiendo diferencias (es decir, de que siendo
falsa la hipótesis nula), se detecten, o lo que es lo mismo, se obtenga suficiente evidencia para rechazar la hipótesis nula, es la potencia estadística.
La probabilidad de que habiendo diferencias NO se demuestren es el
error tipo II, por lo que:
Error tipo II + Poder Estadístico = 1
Como el error tipo II y el poder estadístico son complementarios, si la
probabilidad de cometer un error beta es del 3%, la probabilidad de
detectar las diferencias será del 97% (como dice la opción 3).
Pregunta 31.- R: 1
Pongamos un ejemplo para su mejor comprensión.
Se realiza un estudio longitudinal en el que se selecciona un grupo de
personas expuestas a HTA y otro grupo de personas que no presentan
este factor de estudio; se siguen durante 2 años a todas las personas
participantes y se detecta una incidencia de ACV entre las personas que
padecen HTA de 80 por cada 1.000 personas y entre las que no tienen
HTA de 40 por cada 1.000 personas.
¿Estas diferencias encontradas se pueden deber al azar, a la variabilidad
en el muestreo?
La respuesta hay que buscarla en el grado de significación, que en
este caso es menor al 5%, por lo que en caso de que no hubiese una
asociación entre el factor estudiado (la HTA) y la enfermedad (los ACV)
la probabilidad de haber encontrado estos resultados sería menor del
5% (opción 1 correcta).
NO se confirma relación de causalidad entre el factor de riesgo y la enfermedad estudiada, ya que para ello se tienen que cumplir una serie de
criterios de causalidad que en esta pregunta NO se mencionan.
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
6
Estadística
Pregunta 32.- R: 4
Un error tipo I consiste en rechazar la hipótesis nula cuando en realidad
es cierta (opción 4 falsa).
La probabilidad de que rechacemos la Ho y sea cierta coincide con la
probabilidad de que las diferencias encontradas se deban al azar (es decir,
que NO haya diferencias), ésto es, el grado de significación.
En otras palabras, decimos que la probabilidad de que las diferencias
observadas se deban al azar es tan baja como para creer que hay verdaderas diferencias y en realidad, aunque era muy poco probable, las
diferencias encontradas son debidas al azar.
En los trabajos científicos sobre diferencias mediante contraste de
hipótesis, se admite como valor máximo de error alfa (o lo que es lo
mismo, valor máximo de “p”) el 5%. Si “p” es menor a 0,05 el resultado
es estadísticamente significativo, por lo que es muy poco probable que
las diferencias se deban al azar. Si “p” es mayor a 0,05 no existe suficiente
evidencia para decir que ambos tratamientos son diferentes. Las diferencias pueden deberse al azar, con una probabilidad mayor al nivel de
exigencia. Jamás podemos asegurar que las diferencias son por el azar,
ya que éstas pueden ser debidas a, por ejemplo, haber tomado una
muestra insuficiente para realizar las comparaciones. Si aumentamos
el tamaño muestral aumenta la potencia del test (capacidad del test
de detectar diferencias cuando existen en realidad).
Pregunta 33.- R: 3
Antes de arrancar un estudio se establece el nivel de “p” a partir del
que vamos a considerar nuestros resultados significativos (nivel
crítico). Por lo tanto, si en este estudio el nivel crítico es del 1%, se
consideran significativos resultados con “p” menor al 1%, que es lo
que dice la opción 3.
Si asocias la “p” con la probabilidad de cometer un error tipo I, comprenderás que estableceremos un nivel del 1% en aquellas situaciones en
las que, antes de empezar a utilizar el fármaco, queremos asegurarnos
de que las diferencias sean verdaderas, por ejemplo, cuando el fármaco
investigado tiene importantes efectos secundarios.
Por lo tanto, la probabilidad de cometer un error alfa en este estudio era
baja (menor al 1%) y no alta como dice la opción 4.
Lo que no podemos saber es la probabilidad de cometer un error beta,
ya que en el enunciado no nos informan de la potencia estadística. Por
eso mismo sabemos que es falsa la opción 1 (el poder con el que se
afrontó el estudio fue del 99%).
Resumiendo, los resultados de este estudio son no significativos porque establecimos un nivel crítico muy estricto (del 1%), quizás porque
el nuevo medicamento (fármaco experimental) produce más efectos
secundarios que el habitual.
Pregunta 34.- R: 4
Aunque la “p” haya resultado no significativa (para el nivel crítico del 5%),
no podemos decir que no haya diferencia de eficacia entre aspirina y
ticlopidina (no sugerimos que la hipótesis nula sea cierta, simplemente
no tenemos suficiente evidencia para decir que es falsa).
Comentarios de Test a distancia 1.ª vuelta
La “p” no tiene nada que ver con la magnitud de la eficacia, por lo que
la opción que dice “la ticlopidina es un 5% más eficaz que la aspirina”
es FALSA.
La probabilidad de que las diferencias observadas se deban al azar NO
es menor del 5% ya que la “p” no ha sido significativa.
Las diferencias entre ticlopidina y aspirina NO exceden lo atribuible
al azar, ya que ésto se puede decir cuando la “p” es menor al 5%.
De todas las opciones es cierta la que dice que“es posible que aumentando el tamaño de la muestra obtengamos diferencias significativas para
el mismo nivel de significación”, es decir, que aumentando el tamaño
muestral (factor más importante de la potencia estadística) aumentamos
la probabilidad de que se encuentren diferencias si las hay.
Pregunta 35.- R: 4
Ante una pregunta MIR sobre tamaño muestral, primero debemos fijarnos en si se trata de un contraste de hipótesis o una estimación de parámetros. La diferencia más importante en ambos casos es que para un
contraste de hipótesis se debe conocer el valor de beta, y para una estimación de parámetros no. En este caso se trata de una estimación de
parámetros (estudio de prevalencia), por lo que la respuesta correcta es la 4).
Pregunta 36.- R: 3
Un valor de “p” menor a 0,05 en un ensayo clínico nos da las siguientes
informaciones:
• Los resultados son estadísticamente significativos.
• Se ha obtenido suficiente evidencia para rechazar la Ho (no existen
diferencias entre los diferentes tratamientos) y, por tanto, aceptar
la H1 (sí existen diferencias entre los tratamientos).
• La probabilidad de cometer un error tipo I (o alfa) es la “p” obtenida,
cuyo valor es la probabilidad de que en realidad no haya diferencias
y yo diga que sí las hay. En este caso, la probabilidad de que el azar
explique las diferencias es menor para el fármaco A, 0,001 frente a
0,04 (respuesta 5 falsa).
En ambos ensayos (fármaco A frente placebo y fármaco B frente placebo), los resultados son significativos, pero la diferencia en el valor de
“p” no indica mayor o menor eficacia (respuestas 1, 2 y 4 falsas). Para
valorar la magnitud del efecto de ambos fármacos nos debemos fijar
en los resultados de los ensayos. Con los datos que nos dan podemos
calcular la reducción absoluta del riesgo (RAR) de sufrir un ictus en cada
ensayo. Por tanto:
• Fármaco A vs placebo: RAR = 40–10 = 30%
• Fármaco B vs placebo: RAR = 50–2 = 48%
Vemos que el fármaco B tiene un mayor RAR y, por tanto, podemos decir
que es más eficaz (respuesta 3 correcta).
Pregunta 37.- R: 3
Para contestar este tipo de preguntas lo más importante es encontrar
las dos variables del estudio que nos propongan.
VARIABLES
Variable 1
TEST DE CONTRASTE DE HIPÓTESIS
Variable 2
Datos independientes
Datos Apareados
Cualitativa
Cualitativa
Chi-cuadrado
Mc Nemar
Cualitatitva no dicotómica
Cuantitativa
T Student
T student para datos apareados
Cualitatitva no dicotómica
Cuantitativa
ANOVA (análisis de la varianza)
Cualitativa
Cuantitativa
ANOVA para medidas repetidas
Correlación Pearson
Regresión
Pregunta 37. Test paramétricos.
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
7
Estadística
En este caso, la variable predictora (V1) será: no haber fumado nunca, ser ex-fumador o fumador; vemos que se trata de una variable
cualitativa que tiene más de dos categorías (variable cualitativa no
dicotómica). La variable resultado (V2) será: la tensión arterial medida
cuantitativamente.
Con una variable predictora cualitativa de más de dos categorías y una
variable resultado cuantitativa el test de contraste de hipótesis adecuado
es el análisis de la varianza (ANOVA). La opción correcta es la 3.
Pregunta 38.- R: 4
Se pretende determinar si existe asociación entre el tipo de carrera que
se cursa y la presencia o no de antígeno de la superficie del virus de la
hepatitis B, por lo que se aprecian las siguientes variables:
• V1: carrera universitaria que se estudia: variable cualitativa que en
nuestro estudio es dicotómica, ya que sólo tiene dos posibilidades
(Medicina u Odontología).
• V2: presencia o no del antígeno de superficie del VHB: también
variable cualitativa dicotómica, ya que sólo tiene dos posibilidades
(dar positivo para Ag VHB o dar negativo).
El test de contraste de hipótesis adecuado para determinar si existe
asociación o no (es decir, que las diferencias encontradas entre los dos
grupos de estudiantes se puedan deber al azar) entre dos variables cualitativas (independientemente de que sean dicotómicas o no, aunque
en este ejemplo lo sean ambas) es el test de Chi-cuadrado.
La opción correcta es la 4.
Comentarios de Test a distancia 1.ª vuelta
Con una variable predictora cualitativa de dos categorías y una variable
resultado cuantitativa, el test de contraste de hipótesis adecuado es la t
de Student. La opción correcta es la 4.
Pregunta 41.- R: 2
Aunque el enunciado de esta pregunta nos quede un poco confuso,
debemos ser capaces de distinguir las siguientes variables: tiempo de
reproducción y fotoperíodo. La primera es una variable cuantitativa
(el tiempo) y la segunda también (número de horas de luz), por lo que
disponemos de dos posibles test para trabajar:
• Análisis de regresión.
• Test de correlación.
¿Cuál es la clave para elegir uno o el otro?
Cuando lo que nos están pidiendo es la ecuación que relaciona a las dos
variables, dicho de otro modo, la fórmula que me permite decir cuánto
valdrá la “y” en función de la “x” (por ejemplo, cuánto será el tiempo de
reproducción si el fotoperíodo vale 6 horas) hay que hacer un análisis
de regresión. La opción correcta es la 2.
¿Y cuándo se utiliza el test de correlación?
El test de correlación de Pearson sirve para establecer, en dos variables
que entre ellas siguen una relación lineal (la ecuación obtenida con el
análisis de regresión es lineal, del tipo y = A+Bx), si la relación lineal es
buena (la ecuación obtenida se ajusta bien a la realidad) o no (no es una
buena ecuación para predecir “y” en función de “x”).
Pregunta 39.- R: 2
Al buscar las dos variables de este estudio, tienes que darte cuenta de
que la edad de las pacientes NO es una variable, simplemente nos están
definiendo qué personas participan en el estudio, es decir, nos están
dando los criterios de selección. Mediante los criterios de selección
se define la población a la que se podrán extrapolar los resultados de
nuestro estudio, que en este caso será a adolescentes de 14 a 16 años.
Pregunta 42.- R: 3
Un coeficiente de correlación de Pearson de -1 indica que existe una
fuerte correlación lineal entre las dos variables y que esta relación es
negativa, es decir, que cuando aumenta una variable la otra disminuye
y viceversa. La opción correcta es la 3.
Recuerda que los valores del coeficiente de correlación oscilan de -1 a 1, y
que cuanto más se acerca a -1 o a 1 la relación lineal será más fuerte, mientras
que un coeficiente de correlación de 0 indica ausencia de relación lineal.
El objetivo de este estudio es determinar si existen diferencias entre tres
tratamientos en cuanto a la reducción del número de lesiones de acné,
por lo que las variables serán:
• Variable predictora: tratamiento utilizado (variable cualitativa de tres
categorías).
• Variable resultado: el número de lesiones que desaparecen (variable cuantitativa); el resultado lo podían haber expresado como
variable dicotómica (mejora o no), pero en el enunciado nos dejan
claro que van a cuantificar el resultado (“número de lesiones de
acné”).
Pregunta 43.- R: 4
Si se pretende estudiar si hay diferencia o no entre los niveles de glucosa en sangre en personas que no han comido y personas que ya han
comido, el estudio se puede plantear de dos maneras:
a) Cogemos a una muestra de personas y les extraemos una muestra
de sangre antes de comer, y a otro grupo de personas distintas y les
extraemos sangre después de que hayan comido.
b) Cogemos a una muestra de personas y les extraemos una muestra
de sangre antes de comer, y a ese mismo grupo de personas les
extraemos sangre después de que hayan comido.
Con una variable predictora cualitativa de más de dos categorías y una
variable resultado cuantitativa, el test de contraste de hipótesis adecuado
es el análisis de la varianza (ANOVA). La opción correcta es la 2.
En ambos casos, las variables de estudio serían:
• V1: no haber comido o haber comido (variable dicotómica).
• V2: niveles de glucosa en sangre (variable cuantitativa).
La única diferencia es que en el primer caso las muestras son independientes
(dos grupos de personas distintas) y en el segundo hay una muestra pareada
(se mide la V2 en las mismas personas antes y después de comer), por lo que
utilizaríamos un test de t de Student para datos apareados, mientras que en
el primer caso sería para datos independientes. La opción correcta es la 4.
Pregunta 40.- R: 4
Imaginemos que tenemos un grupo de mujeres embarazadas a las que se
les toma la TAD y se obtiene como resultado una media aritmética de 72
mm de Hg, y otro grupo de mujeres no gestantes a las que se les toma la
TAD y se obtiene como resultado una media aritmética de 74 mm de Hg.
Posiblemente esta diferencia se deba a la variabilidad en el muestreo
(al azar), pero para poder hacer esta afirmación tendremos que hacer
el test de contraste de hipótesis que corresponda con las variables de
este estudio:
• V1: estar o no embarazada (variable dicotómica).
• V2: TAD (variable cuantitativa).
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
Pregunta 44.- R: 2
Se quiere establecer si hay diferencia entre el descenso de carga viral
que se consigue con indinavir frente al obtenido con saquinavir, por lo
que las variables de este estudio serán:
• V1: tratamiento con indinavir o saquinavir (variable cualitativa dicotómica).
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
8
Estadística
•
V2: descenso en la carga viral (variable cuantitativa).
Con una variable predictora cualitativa de dos categorías y una variable
resultado cuantitativa, el test de contraste de hipótesis adecuado es la t
de Student. La opción correcta es la 2.
Pregunta 45.- R: 4
La mayoría de las preguntas de test de contraste de hipótesis en el
MIR se refieren a test paramétricos, si bien debemos conocer cuándo
no se pueden utilizar y es necesario elegir un test no paramétrico:
• Cuando el tamaño muestral es pequeño (n < 30).
• Cuando V1 y/o V2 sean variables ordinales.
Los test no paramétricos son menos potentes que los paramétricos, por
ello, siempre que sea posible se prefieren utilizar pruebas paramétricas.
Las pruebas no paramétricas, a diferencia de las paramétricas, no requieren que las variables sigan una distribución normal, pueden usarse
independientemente de cómo sea la distribución de las variables en la
población (normal, binomial, etc.). La opción falsa es la 4.
Pregunta 46.- R: 4
Si se están comparando tres tratamientos distintos, la variable predictora será el tipo de tratamiento (variable cualitativa de tres categorías).
En este estudio, la variable resultado también es cualitativa (curación o
no curación), por lo que el test de contraste de hipótesis que se debe
utilizar será el de Chi-cuadrado. La opción correcta es la 4.
Pregunta 47.- R: 5
Se pretende ver si hay una diferencia entre los niveles de ADN viral del
VHB en pacientes nefrópatas antes de ser sometidos a hemodiálisis y
después de esta intervención, por lo que las variables de este estudio son:
• V1: no haber recibido todavía la hemodiálisis o haberla recibido ya.
• V2: título de ADN viral del VHB.
Vemos que la primera variable (dicotómica) es pareada, ya que la V2 se va
a medir en los mismos pacientes (antes y después); la segunda variable
es cuantitativa (nivel de ADN viral), por lo que el test paramétrico que
le correspondería es el de la t de Student.
Pero como el tamaño muestral es menor de 30, no nos valen los test paramétricos, por lo que tendremos que elegir el equivalente a la t de Student
para datos apareados: el test de Wilcoxon. La opción correcta es la 5.
El test de la U de Mann-Whitney y el test de Wilcoxon ambos son test no
paramétricos para comparar una variable cualitativa dicotómica con una
cuantitativa. La diferencia entre los dos es que el test de la U de MannWhitney se puede usar sólo en caso de datos independientes; el test de
Wilcoxon sirve tanto para datos independientes como también apareados.
Pregunta 48.- R: 4
Este enunciado parece complejo pero podemos resolver la pregunta
sabiendo el significado del coeficiente de correlación “r”. Si se quiere
Comentarios de Test a distancia 1.ª vuelta
saber la manera de relacionarse de dos variables cuantitativas, podemos
realizar dos tipos de análisis:
• El análisis de correlación nos da el valor de el coeficiente de correlación
de Pearson (r), que mide la intensidad de la relación lineal entre las
dos variables cuantitativas. Este coeficiente “r” tiene las siguientes
propiedades:
- Varía de -1 a +1. Cuando r = 0 indica que no hay correlación lineal.
A partir de +/- 0,7 existe una correlación fuerte.
- Para r = +/-1, hay una relación perfecta entre “x” e “y” (todos los
puntos están en una línea recta)
- Un valor positivo de “r” indica que a medida que aumenta o
disminuye una variable, lo hace la otra en la misma dirección. Si
“r” es negativo indica que a medida que aumenta una variable
disminuye la otra, y viceversa.
• Cuando la correlación entre dos variables es fuerte, podrá hacerse
un test de regresión lineal, que nos dará una ecuación que informa
del tipo de relación: y = a + b.x.
“a” y “b” son los coeficientes de regresión, el coeficiente a representa el
punto en el que la línea corta el eje vertical (valor de y para x = 0). El
coeficiente “b” es la pendiente de la recta que muestra la cantidad que
cambia “y” por una unidad de cambio de “x”.
En este estudio el coeficiente “r” entre tamaño de las NRP y el número de
síntomas fue de 0,32 (p = 0,02). Indica, por tanto, una débil correlación
positiva entre ambas variables, siendo esta correlación es estadísticamente significativa con p = 0,02 (no confundas el valor de “p” con el valor
de “r”). La única respuesta correcta es la 4.
Pregunta 49.- R: 3
Las variables en esta pregunta son:
• V1: tres hospitales (variable cualitativa no dicotómica).
• V2: gravedad de la UVI medida con el test de Glasgow (variable
cualitativa ordinal).
Siempre que tengamos una de la variables de tipo ordinal, debemos
pensar en test no paramétricos (una variable ordinal equivale a una
cuantitativa con n < 30). Por tanto, al tratarse de comparar una variable
cualitativa no dicotómica y una variable ordinal, el test necesario será
el de Kruskal-Wallis (respuesta 3).
Pregunta 50.- R: 4
De todas las opciones citadas, la única prueba útil para establecer
relación entre una variable cualitativa y otra cuantitativa es el test de
Mann-Whitney, que se usa cuando la V1 es una variable dicotómica, la V2
es cuantitativa, las muestras son independientes y el tamaño muestral
es menor de 30. La opción correcta es la 4.
El test de la t de Student también es útil para establecer relación entre
una variable cualitativa y otra cuantitativa, pero si lees con cuidado las
opciones, te darás cuenta de que no está (la opción 1 es la distribución
t de Student; no es un test de contraste de hipótesis).
VARIABLES
TEST DE CONTRASTE DE HIPÓTESIS
Variable 1
Variable 2
Cualitativa
Cualitativa
Datos independientes
Datos apareados
Cualitatitva no dicotómica
Cuantitativa
U Mann-Whitney
Wilckoxon
Wilckoxon
Cualitatitva no dicotómica
Cuantitativa
Kruskal-Wallis
Friedman
Cualitativa ordinal
Cualitativa ordinal
Test exacto de Fisher
Rho Spearman
Tau Kendall
Pregunta 47. Test no paramétricos.
CTO Medicina • C/Francisco Silvela, 106 • 28002 - Madrid
• Tfno. (0034) 91 782 43 30/33/34 • E-mail: secretaria@ctomedicina.com • www. ctomedicina.com
9
Descargar