Examen de estadística: 2º curso de ingeniería química. 9 de febrero de 2009 Nombre Apellidos 1.- Se investiga la temperatura de deflexión bajo carga para dos tipos diferentes de tubería de plástico. Para ello se toman dos muestras aleatorias anotando las temperaturas de deflexión observadas. Tipo I Tipo II 206 177 193 176 192 198 188 197 207 185 210 188 205 206 185 200 194 189 187 201 179 197 178 203 194 180 213 192 205 193 - Calcular para tipo II (1p) Media 192,13 Varianza 89,12 Máximo 206 Mínimo 176 Mediana 193 Meda 7 Primer cuartil 185 Tercer cuartil 200 Rango intercuartilico 15 Percentil1 176 Percentil5 175 Percentil15 180 Percentil90 203 Percentil95 206 - Presentar los datos en forma de tabla de distribución de frecuencias Clase Limite inferior Limite superior Marca Frecuencia Frecuencia rel. Frecuencia ac. Frecuencia rel. ac. Menor o igual -170 0 0 0 0 1 170 180 175 3 0,2 3 0,2 2 180 190 185 3 0,2 6 0,4 3 190 200 195 6 0,4 12 0,8 4 200 210 205 3 0,2 15 1 mayor 210 0 0 15 1 Media = 192,133 desviación estándar = 9,44054 - Dibujar un diagrama de cajas, un diagrama de tallo-hojas y un histograma. Comentar las gráficas 2 6 (5) 7 4 17|67 18|0589 19|23778 19|778 20|0136 6 5 4 3 2 1 0 170 170 180 190 200 180 190 200 210 210 Diagrama tallo-hojas Histograma Diagrama de cajas Del diagrama de cajas se desprende que los datos son bastante simétricos, muestran ligera asimetría a la izda. También se observa en el histograma esta asimetría - Contrastar la igualdad de varianzas (0,5) S12 = 127,07 S22 = 89,12 f0 = 1,43 RC = {F0 > 2,48} {F0 < 0,4} f0 RC. Acepto la igualdad de varianzas ¿Los datos apoyan la afirmación de que la temperatura de deflexión para la tubería 2 es menor que la de la tubería 1? (0,5) X 1 195,73 X 2 192,13 S1 = 11,27 S2 = 9,44 n1 = n2 = 15 S2 = 108,095 H0 : μ1 = μ2 H1 : μ1 < μ2 S = 10,4 S 1 1 = 3,8 15 15 t0 = 0,95 RC ={T0 < -1,701} Los datos soportan la hipótesis μ1 μ2 p-valor P(T28<0,95) 0,8 < p-valor< 0,85 ya que P(t28>0,85)=0,2 y P(T28>1,05) =0,15 1 Supongamos que si la temperatura de deflexión promedia para la tubería de tipo 2 es mayor que la de la tubería de tipo I en 5ºF, entonces sería importante detectarlo con una probabilidad de al menos 0,9. ¿Resulta adecuada la selección del tamaño de las muestras? (0,5) P(-5)= P(RC/ μ1 - μ2 = -5) = P(T0<-1,701/ μ1 - μ2 = -5)= P( P( X 1 X 2 (5) 1 1 s 15 15 -1,701+ 5 1 1 s 15 15 X1 X 2 1 1 s 15 15 -1,701/μ1 - μ2 = -5)= /μ1 - μ2 = -5=P(T28<-0,39)<0,25 No es adecuado el tamaño muestral Calcula in intervalo de confianza para la media de la temperatura de deflexión para la tubería de tipo 1. (0,5) X 1 t 0,025,14 s1 / 15 t0,025,14 = 2,145 X 1 6,24 189,49 μ1 201,97 ¿Error de estimación cometido? (0,25) 6,24 ¿Qué tamaño de muestra se necesita si se pretende que el estimador de la media difiera de la media poblacional en ±0,5 ºF? con una confianza del 95%? (0,25) t 0,025,14 s1 / n = 0,5 n=2337,55 n= 2338 2.- Supongamos que tres fábricas A, B y C vierten productos al río Pisuerga en una proporción 0,4 0,3 0,3. Estos vertidos son tóxicos con probabilidades 0,01 0,05 y 0,1 respectivamente. (0,75) a) Calcular la probabilidad de un vertido tóxico al río Pisuerga. P(tóxico) = P(tóxico/A)P(A)+ P(tóxico/B)P(B)+ P(tóxico/C)P(C) = 4.10-3+15.10-3+30.10-3 = 49.10-3 b) Si se detecta un vertido tóxico en el río, calcular la probabilidad de que este provenga de cada una de las tres fábricas. P(A/tóxico)=P(tóxico/A)P(A)/P(tóxico) = 4/49 P(B/tóxico)=P(tóxico/B)P(B)/P(tóxico) = 15/49 P(C/tóxico)=P(tóxico/C)P(C)/P(tóxico) = 30/49 c) Si se han detectado en el último año 10 vertidos tóxicos, calcular la probabilidad de que 5 sean de A 3 de B y 2 de C. 10 5 P= [ P(A/tóxico])5 [P(B/tóxico)] 3 [P(C/tóxico])2=9,8.10-5 5 3 3.- Un proceso químico utiliza un catalizador. El tiempo de duración del catalizador es una v.a. N (500,250) (0,75p). Calcular P (catalizador funcione más de 500horas) P(X>500)= P(Z>0)= 0,5 P (catalizador funcione más de 1000horas)= P(X>1000)=P(Z>2)= 0,0228 P (catalizador funcione más de 1000horas/ha durado más de 500)= P(X>1000/X>500) = P(X>1000)/P(X>500) = 0,0456 2 4. - Resolver o acotar (0, 5) P (2,54 < F10, 15 < 3,8)= P (F10, 15 < 3,8)- P (F10, 15 < 2,54)= 0,99-0,95 = 0,04 P (0,26 < F15, 10 < 0.39) = P (F15, 10 < 0.39) - P (F15, 10 < 0,26 ) = P (F10, 15 >1/ 0.39) - P (F10, 15 >1/ 0,26 )=0,04 P (1,77 < T13 < 3,85)= P (T13 < 3,85) -P (T13 < 1,77)=p 0.045 p0,0495 P (Z < x) = 0,95 X= 1,64 P (215 < y) = 0,05 Y = 7,26 P (T30 < z) = 0,25 P (T30 >- z) = 0,25 -z = 0,683 z = -0,683 5.- Contesta brevemente (1p) 1. Coeficiente R cuadrado Cociente entre la variación explicada por el modelo y la variación total VE R cuadrado VT 2. Variación explicada por la regresión VE yˆ i y 2 i 3. Hipótesis estadística Cualquier afirmación sobre una característica de la población 4. Hipótesis nula La que se supone cierta, a no ser que los datos la contradigan 5. Estadístico V.a. función de la muestra 6. Región crítica En un contraste de hipótesis, subconjunto de R utilizado para hacer el contraste. Si el valor del estadístico cae en la región crítica, se rechaza la hipótesis nula. 7. Nivel de significación Riesgo que el investigador está dispuesto a asumir. En porcentaje corresponde al tanto por ciento de las veces que obtendríamos un resultado no válido. 8. Varianza muestral 2 2 1 n 1 n o x x x x i i n i 1 n 1 i 1 3 9. Función de densidad de probabilidad Para v.a. continuas .Función positiva verificando f ( x)dx 1 R 10. Función de probabilidad Para v.a. discretas conjunto de valores que toma la variable con su probabilidad (x, Px) xRango(X) 11. Espacio muestral Conjunto de todos los posibles resultados de un experimento 12. Sucesos independientes La ocurrencia de uno de ellos, no influye en la ocurrencia del otro P(AB) = P(A) P(B) P(A/B)=P(A) P(B/A)=P(B) 13. fórmula de Bayes = Ai Ai mutuamente excluyente con P(Ai) >0 y sea B el resultado de un experimento con P(B)>0. La probabilidad a posteriori de los sucesos Ai viene dada por la fórmula P( B / Ai ) P( Ai ) P( Ai / B) P( B / Ai ) P( Ai ) i 14. Potencia de un contraste Potencia en un punto de la región crítica es la probabilidad de rechazar la hipótesis nula cuando es falsa y toma el valor 15. Error de tipo I en un contraste Es la probabilidad de rechazar la hipótesis cuando es cierta. 4