MÉTODOS ESTADÍSTICOS EN ANTROPOLOGÍA SOCIAL Código de carrera: 59 Código de asignatura: 404 curso2006-07convocatoria Febrero 1a P.P-1a Semana. examen tipo A – Señale TIPO DE EXAMEN en la hoja de lectura óptica, DNI, código de carrera, código de asignatura, convocatoria y semana. – Se permite únicamente el uso del libro de texto, y calculadora no programable. entregue sólo la hoja de lectura óptica. duración: 2 horas. – Evaluación: 1 acierto = 1 punto; 1 fallo = -0.25 puntos; 1 blanco o más de una marca = 0 puntos 1. Se lanza 9 veces un dado trucado en el que la probabilidad de obtener un número par es 2/5. ¿Cuál es la moda de la distribución del número de resultados pares obtenidos? a) 4 b) 3 c) Ambas 4 y 3 2. Con objeto de conocer el grado de satisfacción con la implantación de los nuevos planes de estudios, se eligen al azar, entre el profesorado universitario, un grupo de 220 profesores, de los que 100 eran hombres. Con una valoración de 0 a 5, se obtuvieron los siguientes resultados: x̄H = 2.1 ; σ̂H = 0.9 ; x̄M = 1.9 ; σ̂M = 1.2 ¿Con qué riesgo se puede afirmar que la iniciativa tiene más aceptación entre los hombres? a) 0.0764 b) 0.0852 c) 0.0915 3. En cierta población, durante 50 dı́as, divididos en 4 franjas horarias X, se observa el n◦ , Y, de infracciones de tráfico en cada una; obteniéndose la siguiente distribución de frecuencias bidimensional: Y 0 1 2 3 0-6h 12 13 11 14 50 X 6-12h 10 11 13 16 50 12-18h 9 11 13 17 50 18-24h 6 8 14 22 50 37 43 51 69 200 Comparado el número medio de infracciones en las 200 franjas horarias con el número medio de infracciones de 12 a 18h es: a) Mayor. b) Menor. c) Igual. 4. ¿Cuál de las siguientes variables aleatorias es de tipo cualitativo? a) El número de visitas anuales al médico. b) Las asignaturas aprobadas anualmente. c) La presión arterial sistólica. 5. Para conocer cuál de los programas de TV, A o B tiene más audiencia, se realiza una encuesta a 160 personas, resultando 85 votos favorables a A y el resto para B. En otra encuesta posterior a 140 personas, se obtuvo 92 votos para A y el resto para B. ¿Cuál de las dos encuestas tiene más precisión? a) La primera encuesta. b) La segunda encuesta. c) Es indiferente. 6. Para saber si un vı́deo de propaganda electoral de un partido polı́tico tiene el mismo efecto en dos comunidades autónomas A y B, se eligieron 160 personas de la primera y 140 de la segunda que dieron su opinión después de verlo. Los resultados fueron: A Favor En contra Indiferentes A 80 35 45 B 45 40 55 ¿Se puede afirmar que, después de ver el vı́deo, la posición respecto al partido polı́tico es distinta en ambas comunidades? a) Sı́ tanto con nivel de significación α = 0.01, como con nivel de significación α = 0.05 b) Sı́ para α = 0.05 pero no para α = 0.01 c) Sı́ para α = 0.01 pero no para α = 0.05 7. El coeficiente intelectual de una muestra de 250 alumnos de la UNED dio de media x̄ = 114 y de cuasidesviación tı́pica muestral σ̂ = 12. ¿Cuál es el intervalo de confianza para la media poblacional µ, con nivel de confianza 99 %? a) Ic = (112.04; 115.96) b) Ic = (110.87; 117, 29) c) Ic = (106, 53; 124, 36) 8. ¿Cuál es la varianza correspondiente al número de pulsaciones de 110 ciclistas que al final de una etapa, arrojaron los siguientes resultados? (Pulsaciones) Fi (N◦ Ciclistas) [135 − 145) 9 [145 − 155) 26 [155 − 165) 38 [165 − 175) 22 [175 − 185] 15 a) 146.22 b) 138.15 c) 130.38 9. Se lanza tres veces una moneda cargada, de manera que P (cara) = 3/5. La probabilidad de que salgan exactamente 2 caras es: a) 9/125 b) 54/125 c) 18/125 10. La información recogida en la siguiente tabla nos muestra la edad en años, x, y el número de hermanos, y, que tienen 11 niños. x 1 4 2 3 3 4 4 5 1 2 3 y 2 1 2 2 4 4 2 6 1 1 0 La recta de regresión de y sobre x, es: a) y = 0.327 + 0.146x b) y = 0.152 + 0.728x c) y = 0.781 + 0.914x Ic MÉTODOS ESTADÍSTICOS EN ANTROPOLOGÍA. FEBRERO 07. EX A Calificación: Cuestiones correctas 1 punto. Erróneas -0.25 puntos 1. c) Es una distribución binomial, B(9; 2/5), en donde la moda es (n + 1) · p = 2 10· = 4. Por ser dicho producto un número entero, la distribución presenta 5 dos modas que son los valores (n + 1) · p = 4 y (n + 1) · p − 1 = 3. 2. a) Para dos muestras aleatorias de tamaños grandes y supuesto que H0 : µ1 = µ2 es cierta, la distribución en el muestreo de la diferencia de medias muestrales x̄1 − x̄2 , tiene distribución en el muestreo N (0, σ̃), cuyo error tı́pico de estimación de x̄H − x̄M es: r 0.92 1.22 √ σ̃ = + = 0.0201 = 0.14 100 120 Rechazando la igualdad cuando la diferencia x̄M − x̄M es mayor que 2.1 − 1.9 = 0.2, el p-valor es: p-valor = 1 − φ(0.2/0.14) = 1 − φ(1.43) = 1 − 0.9236 = 0.0764 3. c) X 12 − 18h X̄(12−18h ) = yi 0 1 2 3 ni 37 43 51 69 N = 200 yi · ni 0 43 102 207 352 Y 1 11 0 9 (Infr 2 13 Tráf) 3 17 50 9 · 0 + 11 · 1 + 13 · 2 + 17 · 3 88 = = 1.76 50 50 352 Ȳinfracciones = = 1.76 200 Luego el número medio de las infracciones cometidas en las 200 franjas horarias, coincide con el número medio de infracciones cometidas entre las 12 y las 18 horas. 4. b) Las asignaturas aprobadas anualmente es una variable cualitativa ya que sólo nos indica el nombre de las asignaturas aprobadas y no el número de ellas, por lo que son simples “etiquetas”. 5. a) En la primera encuesta el programa A obtuvo 85 votos de entre los 160 85 encuestados, por lo que, p̂1 = 160 = 0.53, siendo el error tı́pico de estimación para la primera encuesta, tomando, p1 = p̂1 , de: r r 0.53 · 0.47 0.2491 = = 0.0395 σ̃1 = 160 160 1 La precisión de estimación para la primera encuesta es: 1 1 = = 25.32 σ̃1 0.0395 En la segunda encuesta el programa B obtuvo 92 votos de entre los 140 92 encuestados, por lo que, p̂2 = 140 = 0.66, siendo el error tı́pico de estimación para la primera encuesta, tomando, p2 = p̂2 , de: r r 0.66 · 0.34 0.2244 σ̃1 = = = 0.04 140 140 La precisión de estimación para la segunda encuesta es: 1 1 = = 25 σ̃2 0.04 por ser 6. 1 1 > , la primera encuesta es más precisa que la segunda. σ̃1 σ̃2 a) A B Total A Favor 80 45 125 En contra 35 40 75 Indiferentes 45 55 100 Total 160 140 300 D sigue una distribución χ2(r−1)·(k−1) g.l = χ2(3−1)·(2−1) g.l = χ22 g.l , siendo su valor: k r X X n2ij D = n −1 + ni mj i=1 j=1 · ¸ 802 352 452 452 402 552 D = 300 −1 + + + + + + = 160 · 125 160 · 75 160 · 100 140 · 125 140 · 75 140 · 100 = 300 · 0.0327 = 9.813 Por ser 9.813 > 9.21, que es el valor que toma la χ22;0.01 , se rechaza H0 con nivel de significación α = 0.01. Igualmente, 9.813 > 5.991, que es el valor que toma la χ22;0.05 , por lo que también rechazamos H0 con nivel de significación α = 0.05. Podemos por tanto afirmar que, después de ver el vı́deo, la posición respecto al partido polı́tico es distinta en ambas comunidades autónomas, tanto al nivel de significación α = 0.01, como para el nivel α = 0.05. 2 7. a) El error tı́pico de estimación de la media es σ̃ = √σ̂ n = √12 250 = 0.7589 Dado que la distribución en el muestreo de la media muestral, x̄, es aproximadamente la distribución normal, x̄ → N (µ, √σ̂n ) → N (12; 0.7589) El intervalo de confianza del 99 % para la media poblacional es: I = (x̄−zα σ̃; x̄+zα σ̃) = (12−2.58·0.7589; 12+2.58·0.7589) = (112.04; 115.96) 8. c) Ic [135 − 145) [145 − 155) [15 − 165) [165 − 175) [175 − 185) P5 i=1 xi Fi x̄ = 9. N xi 140 150 160 170 180 Fi 9 26 38 22 15 N= 110 xi · Fi 1260 3900 6080 3740 2700 17680 xi − x̄ -20.727 -10.727 -0.727 9.273 19.273 17680 = = 160.727 ; Sx2 = 110 P5 (xi − x̄)2 429.61 115.07 0.53 85.99 371.45 (xi − x̄)2 · Fi 3866.49 2991.82 20.14 1891.78 5571.75 14341.98 − x̄)2 Fi 14341.98 = = 130.38 N 110 i=1 (xi b)Si la P (C) = 3/5, la P (X) = 2/5. Al lanza la moneda tres veces al aire, la probabilidad de obtener sólo 2 caras es: 54 3 3 2 P (2C) = {CCX, CXC, XCC} = 3 · · · = 5 5 5 125 También se puede hacer aplicando la Binomial de parámetros n = 3 y p = 0.6 B(3; 0.6), teniéndose: µ ¶ 3 54 · 0.62 · 0.4 = 0.432 = 2 125 10. b) xi 1 4 2 3 3 4 4 5 1 2 3 32 yi 2 1 2 2 4 4 2 6 1 1 0 25 x2i 1 16 4 9 9 16 16 25 1 4 9 110 yi2 4 1 4 4 16 16 4 36 1 1 0 87 xi − x̄ -1.91 1.09 -0.91 0.09 0.09 1.09 1.09 2.09 -1.91 -0.91 0.09 yi − ȳ -0.27 -1.27 -0.27 -0.27 1.73 1.73 -0.27 3.73 -1.27 -1.27 -2.27 3 (xi − x̄)(yi − ȳ) 0.5157 -1.3843 0.2457 -0.0243 0.1557 1.8857 -0.2943 7.7957 2.4257 1.1557 -0.2043 12.2727 P yj nj xi ni 32 = = 2.91 ; ȳ = N 11 N qP q xi 2 110 2 = 2 − x̄ N 11 − 2.91 = 1.239 qP q yi 2 87 2 2 N − ȳ = 11 − 2.27 = 1.66 P x̄ = sx = sy = = 25 11 = 2.27 El coeficiente de correlación r es: r= 1 X (xi − x̄) · (yi − ȳ) 1 12.2727 12.2727 = · = = 0.543 n sx · sy 11 1.238 · 1.66 22.60558 La pendiente b de la recta de regresión es: b=r· Sy 1.66 = 0.543 · = 0.727 Sx 1.239 La ordenada en el origen a de la recta de regresión es: a = ȳ − b · x̄ = 2.27 − 0.727 · 2.91 = 0.154 La ecuación de la recta de regresión es: y = a + bx ; y = 0.154 + 0.727x 4