LUIS J. CASTILLO VÁSQUEZ ------------------------------------------------------------- DISTRIBUCION MUESTRAL DE DIFERENCIAS Y SUMAS Se nos dan dos poblaciones. Por cada muestra de tamaño n 1 extraída de la primera población computemos un estadístico S1. Esto resulta en una distribución muestral para S1 cuya media y desviación típica denotamos por µ s1 , y σ s1 , respectivamente. En forma semejante por cada muestra de tamaño n 2 extraída de la segunda población computamos un estadístico S2 cuya media y desviación típica son µ s 2 y σ S 2 respectivamente. Tomando las posibles combinaciones de estas muestras de las dos poblaciones podemos obtener una distribución de las diferencias, S 1 - S2, que se llama la distribución muestral de la diferencia de estadísticos. La media y la desviación típica de esta distribución muestral, denotada, respectivamente por , están dadas por: Dado que las muestras escogidas en ninguna forma dependan entre sí, es decir las muestras son independientes (en otras palabras, las variables aleatorias S1 y S2 son independientes). Si, por ejemplo S1 y S2 son las medias muestrales de dos poblaciones, denotadas por X1, X 2 respectivamente, entonces la distribución muestral de la diferencia de las medias está dada para poblaciones infinitas con media, y desviación típica 1, 1, 2 , 2 respectivamente por: Este resultado también es válido para poblaciones finitas si el muestreo es con remplazamiento. La variable tipificada En tal caso tiene casi una distribución normal si n1 y n2, son grandes (n1, n2 ≥ 30). Resultados semejantes pueden obtenerse para poblaciones finitas en las que el muestreo es sin remplazamiento 1 LUIS J. CASTILLO VÁSQUEZ ------------------------------------------------------------Resultados correspondientes pueden obtenerse para distribuciones muestrales de diferencias de proporciones de dos poblaciones distribuidas binomialmente con parámetros p1, q 1 y p2, q2 respectivamente. En este caso S1 y S2 corresponden a las proporciones de éxitos P1, y P2 y las ecuaciones resultan ser: En cambio de tomar diferencias de estadísticos algunas veces estamos interesados en la suma de estadísticos. En tal caso la distribución muestral de la suma de estadísticos S1 y S2 tiene media y desviación típica dada por Suponiendo que las muestras son independientes. PROBLEMAS DESARROLLADOS 1. Se identificaron dos poblaciones de alumnos del último ciclo de la Universidad de Lima. La variable de interés en la investigación consistía en los puntajes obtenidos en una prueba de rendimiento en Seminario de tesis que hicieron los estudiantes de las dos poblaciones. Los investigadores suponían que los puntajes de las dos poblaciones estaban distribuidos normalmente con las siguientes medias y varianzas. 1 50 , 12 40 ; 2 40 ; 22 60 una m.a. de tamaño n1 = 10 se extrae de la población 1, y una de tamaño 12 de la población 2. ¿Cuál es la probabilidad de que la diferencia entre las medias muestrales esté entre 5 y 15? Solución: Datos 1 50 2 40 12 40 22 60 n1 10 n2 12 2 LUIS J. CASTILLO VÁSQUEZ ------------------------------------------------------------- P5 X 1 X 2 15 5 (50 40) X 1 X 2 1 2 15 (50 40) P 2 2 40 60 40 60 1 2 10 12 10 12 n1 n2 P 1.67 Z 1.67 PZ 1.67 PZ 1.67 = 0.95257 – 0.04746 = 0.90508 2. Una muestra de 520 de los 5,000 empleados de una Compañía ha sido tomada con el fin de determinar el tiempo empleado en ir y venir del trabajo. Supóngase que la desviación estándar de esos tiempos es igual a 15 para hombres y para mujeres. ¿Cuál es la probabilidad de que una diferencia de más de 8 minutos, haya sido observada en las medias muestrales X M X m , si M m 5 y la muestra contiene 320 hombres y 200 mujeres empleados? Solución: Datos M2 (15) 2 , M 15 , nM 320 , m2 (15) 2 , nm 200 P X M X m m 15 , X M X m M m 8 P M2 m2 n M nm M m 5 85 PZ 2.22 2 2 15 15 320 200 = 1 – P[Z<2.22] = 1 – 0.98679 = 0.01321 3. La distribución de los salarios (en salarios mínimos) de obreros de sexo masculino de una fábrica es N(5.4, 1.692), y del sexo femenino es N(4.5, 3 LUIS J. CASTILLO VÁSQUEZ ------------------------------------------------------------2.252).Se seleccionan dos muestras, una con 16 hombres y otra con 16 mujeres. Si D es la diferencia entre el salario medio de los hombres y de las mujeres. a) Calcule: P[| D | 0.5] b) ¿Cuál es el valor de d tal que P[|D| > d = 0.05? c) ¿Qué tamaño común debería tener ambas muestras para que P[|D| > 0.4] = 0.05? Solución: a) P D 0.5 = 1 P D 0.5 = 1 P 0.5 D 0.5 = 0.5 0.9 0.5 0.9 1 P Z 2 2 1.69 2.25 1.69 2 2.25 2 16 16 16 16 = 1 P 1.99 Z 0.57 = 1 P(Z 0.57) P(Z 1.99) = 1 0.28434 0.0233 = 1 0.26104 0.73896 b) P[|D|>d]= 0.05 =1 – P[|D| < d] = 0.05 P[|D| < d] = 0.95 P[- d < D < d] = 0.95 4 LUIS J. CASTILLO VÁSQUEZ ------------------------------------------------------------- d 0.9 d 0.9 P Z 1.69 2 2.25 2 1.69 2 2.25 2 16 16 16 16 d 0.9 P Z 1.69 2 2.25 2 16 16 d 0.9 2 1.69 2.25 16 16 2 0.95 d 0.9 P Z 1.68 2 2 25 2 16 16 1.96 d 0.9 ; 1.692 2.252 16 16 0.95 1.96 d - 0.9 = 1.3788 d = 2.2788 c) P[-0.4 < D < 0.4] = 0.95 0.4 0.9 P Z 1.69 2 2.25 2 n n 0.4 0.9 1.692 2.252 n P Z 0.4 0.9 1.89 2 2.25 2 n n 0.95 1.96 n = 121.68 = 122 4. Un antropólogo estima que los habitantes de la Sierra tienen un índice cefálico promedio de 80 con una desviación estándar de 3 y que los habitantes de la Costa tienen un índice cefálico promedio y una desviación estándar de 75 y 2, respectivamente. Supongamos que el antropólogo está en lo cierto. ¿Cuál es la probabilidad entonces de que con una m. a. de 40 habitantes de la Sierra y con una m. a. independiente de 50 habitantes de la costa se obtenga una diferencia entre las dos medias muestrales superior o igual a 6? 5 LUIS J. CASTILLO VÁSQUEZ ------------------------------------------------------------- Solución µ s = 80 µc = 75 s = 3 σc = 2 ns = 40 nc 0 50 ( X s X c) 6 (80 75) P X s X c P P( Z 1.81) 1 P( Z 1.81) 1 0.96485 0.03515 2 2 2 2 3 2 s c ns 40 50 nc 5. Los “ratings” de la televisión se basan en muestras que comúnmente comprenden 500 televidentes, más o menos. Supongamos que los programas A y B que trasmiten el canal 20 y el canal 30, tienen los ratings verdaderos de 30% y 35%, respectivamente. Se hace una encuesta sobre una m.a. de 500 casas con TV durante la transmisión del programa A y otra para el programa B, de 500 casas también. ¿Cuál es la probabilidad de que los resultados muestren que el programa B obtenga un rating más alto en este experimento? SOLUCION Datos: n1=500 n2=500 P p 1 - p 20=1-P p1=0,35 p2=0,35 p1 p 2 ( p1 p2 ) p1 (1 p1 ) p2 (1 p2 ) n1 n2 0 0,05 0,3(0,7) 0,35(0,65) 500 =1-P(z<-1,69)=1-0,04551=0,95449 6 LUIS J. CASTILLO VÁSQUEZ ------------------------------------------------------------6. Un antropólogo estima que los habitantes de la sierra tienen un índice cefálico promedio de 80 con una desviación estándar de 3 y que los habitantes de la costa tienen un índice cefálico promedio y una desviación estándar de 75 y 2, respectivamente. Supongamos que el antropólogo esta en lo cierto. ¿Cuál es la probabilidad entonces de que con una m.a. de 40 habitantes de la sierra y con una m.a. independiente de 50 habitantes de la costa se obtenga una diferencia entre las dos medias muéstralas superior o igual a 6. SOLUCION Datos: 1=80 1=3 2=75 2=2 n1=40 n2=50 PX1-X26=? X X 65 1 2 1 2 2 2 9 / 40 4 / 50 1 / n 1 2 / n 2 PX1-X26=1-p PX1-X26=1-p(z1,81)=1-0,96485=0,03215 7. Una muestra de 520 de los 5,000 empleados de una compañía ha sido tomada con el, fin de determinar el tiempo empleado en ir y venir del trabajo. Supóngase que la desviación estándar de esos tiempos es igual a 15 para hombres y para mujeres. ¿Cuál es la probabilidad de que una diferencia de más de 8 minutos haya sido observada en las medias muestrales X H - X M , si H-M=5 y la muestra contiene 320 hombres y 200 mujeres empleados?. SOLUCION Datos: H-M=5 H=M=15 a) P X H X M 8=1- nH=320 nM=200 X H X M 85 H M P 2 2 2 2 H / n H M / nM 15 / 320 15 / 200 P X H- X M8=1-P(Z2,22)=1-0,98679=0,01321 7 LUIS J. CASTILLO VÁSQUEZ ------------------------------------------------------------d (5,4 4,5) pZ =0,95 0,4962 d 0,4 =1,645 0,4962 d=1,216 b) PXH-XM0,4=0,05 X X 0,4 (5,4 4,5) 2 1 2 1-0,5=p 1 12 / n 1 22 / n 2 1,3 2 / n 1,5 2 / n n =1,645 0,05 8. n=1082 Supongamos que X1 y X2 son medias de dos muestras de tamaño n extraída de una población con varianza 2. Determine n de modo que con probabilidad de 0,01, las dos medias muestrales difieren en mas de . SOLUCION Datos: a) 1=X1 12 =2 2=X2 22 =2 n1=n n2=n P X 1- X 2=0,01 X 1 X 2 1 2 =0,01 = 1-P 2 2 2 / n / n / n n=2,342(2)11 8