Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 Guía 5 – Simulación. Estimación. Test de hipótesis Un cambio de variable particular: la simulación (es necesario el uso de Excel o algún lenguaje de programación) 5.1) Pruebe que, si U es un número aleatorio generado con la instrucción RANDOM de una calculadora, entonces X definida así: X = − ln(1 − U ) ~ ε (λ λ ) 5.2) Elija un número positivo λ cualquiera, y genere 8 variables aleatorias ε(λ).Luego calcule el promedio y desviación standard muestrales, y compárelos con los valores teóricos. 5.3) Genere 10 variables aleatorias continuas con función de densidad de probabilidad f(x)= k. x, si 0<x<2; f(x)= 0 en otro caso. Calcule su promedio y desviación standard muestral, y compárelos con los valores teóricos. 5.4) Genere 1000 valores de una variable exponencial cuya F T(t)= 1-e -1/10 t cuya media es 10. Calcule el promedio de los 1000 valores obtenidos y verifique que se obtiene un número cercano a la media. Genere un histograma con los valores obtenidos. Repítalo varias veces. ¿Qué observa? 5.5) Genere 5 números random. Defina la variable X = mínimo de los 5 valores. Trace el histograma de X, luego de simularla al menos 100 veces. Calcule el promedio. Ídem para el valor central, el máximo de los cinco valores y el segundo mayor. Interprete los resultados. 5.6) Genere por simulación una tirada de un dado. Con ello resuelva el siguiente problema de decisión: En un juego de generala un jugador se encuentra ante la situación que únicamente le falta completar escalera y 6, habiendo obtenido en los tiros anteriores: 2,3;5;6;6 y quedándole un solo tiro. ¿Le conviene levantar los dados 2;3;5 y apostar a sacar más seis o levantar un dado con 6 y apostar a escalera? Simule una cantidad suficiente de jugadas como para que el valor de decisión (¿cuál?) sea relativamente estable. 5.7) Genere valores de 2 variables uniformes entre -1 y 1. A cada par de valores considérelo un par (x;y). Calcule a partir 1000 pares simulados la proporción de pares que caen dentro del circulo de radio 1. ¿A qué número se parece? 5.8) Simule que llegan autos en una esquina con intervalos de tiempo exponenciales de media 5 segundos. La luz roja dura 40 segundos. ¿Cuántos autos habrá en la cola al encenderse la luz verde? (en cada luz verde se vacía la cola) 5.9) (Modelo de cola simple) A la única ventanilla de atención al público llegan personas con intervalos de tiempo que responden a la F T(t)= 1- e-0,25 t (t>0) t en minutos. El tiempo de atención en las ventanilla es una variable aleatoria X con f X(x) = 2/25 x para 0<x<5. Calcule por simulación el tiempo promedio de espera para entrar en ventanilla, el tiempo promedio en que una ventanilla se encuentra sin clientes, la longitud promedio de la cola, la proporción de clientes que no deben esperar para ser atendidos, la proporción de clientes con mas de 8 minutos de espera. Trace en un diagrama x,y los pares x longitud de la cola para cada persona que llega vs. y su tiempo de espera. Estadistica descriptiva 5.10) Los 30 operarios de una empresa tienen las siguientes alturas y pesos: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 altura m 1,64 1,80 1,71 1,93 1,71 1,68 1,75 1,91 1,63 1,82 1,59 1,80 1,88 1,77 1,68 peso Kg 61 84 69 88 74 68 72 82 68 86 64 81 91 72 59 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 altura m 1,63 1,72 1,78 1,71 1,68 1,81 1,71 1,81 1,74 1,78 1,80 1,80 1,74 1,67 1,93 peso Kg 62 67 81 61 72 88 72 80 77 70 89 84 76 57 101 Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 Presente un informe sintético descriptivo de la población de operarios y realice gráficos representativos. 5.11) Teórico: Explique a una persona sin conocimientos de estadística, a quien le explicaron que la variancia es un valor medio de las distancias cuadráticas a la media, por qué para estimar la variancia muestral divide por (N-1) y no por N. 5.12) Una empresa tiene 150 clientes y hace un censo para establecer el grado de satisfaccion medido de 1 a 5 (1: insatisfecho, 5: totalmente satisfecho) grado respuestas 1 10 2 20 3 50 4 40 5 30 Elabore un informe de estadística descriptiva. 5.13) Se han obtenido valores de tiempos al procesar lotes de hilo en una máquila continua de hilar: (en horas). lote 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 horas 1,72 1,88 2,88 2,23 1,83 1,23 1,42 1,90 1,90 2,91 1,28 2,10 1,75 0,71 1,36 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 2,87 1,60 1,78 1,95 1,77 0,98 2,82 1,96 1,39 2,15 1,80 1,81 1,48 0,88 2,13 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 2,47 0,80 1,25 2,08 1,53 2,34 0,58 1,69 2,36 1,55 2,11 1,61 3,29 1,76 2,35 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 3,22 1,37 1,10 1,69 2,98 1,35 2,30 1,64 0,69 1,60 1,21 1,98 0,91 1,27 1,98 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 1,91 1,87 1,59 3,44 0,96 4,84 1,01 1,62 1,63 2,86 2,21 3,02 1,57 0,89 1,08 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 1,75 2,48 3,06 2,34 1,45 0,64 1,59 1,12 3,66 1,14 0,98 1,15 1,12 2,00 0,81 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 2,03 2,49 1,94 1,78 1,79 2,48 2,05 2,06 2,19 1,49 0,80 0,60 1,53 2,89 1,71 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 2,02 2,50 3,81 1,63 1,82 0,53 1,52 2,30 2,98 3,44 0,71 3,44 2,27 2,06 1,80 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 2,49 2,37 1,76 1,14 1,16 1,48 1,94 2,19 2,74 2,07 1,04 1,67 2,24 0,76 2,51 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 1,23 2,56 2,78 1,62 1,78 1,74 1,30 0,96 2,47 1,35 2,30 3,28 2,71 2,89 1,73 Realice un histograma. Elabore un informe de estadística descriptiva. Estimación de parámetros 5.14) Dé una muestra de 5 números en la cual la mediana coincide con la media, otra en que la mediana tome valores muy por encima de la media, y otra en que tome valores muy por debajo. 5.15) Se desea estimar la media µ de una población normal N(µ; 1), basándose en dos observaciones. Para eso se proponen tres estimadores: Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 4 X1 + X 2 3X1 + X 2 X + X2 µˆ1 = ; µˆ 2 = ; µˆ 3 = 1 5 6 2 Calcule los errores cuadráticos medios de c/estimador ¿Cuál de ellos es preferible? Explique por qué. 5.16) En una serie de m experiencias binomiales se registran X éxitos, y en una serie posterior de n experiencias binomiales se registran Y éxitos. X /m+ Y /n X+Y ; pˆ 2 = 2 m+ n Calcule los errores cuadráticos medios de cada estimador ¿Cuál es preferible? Se proponen los siguientes estimadores del parámetro p: pˆ 1 = 5.17) Estime por el método de máxima verosimilitud, tomando una muestra aleatoria de tamaño n: a) Los parámetros µ y σ de una distribución normal. b) El parámetro p de una distribución Bi(n; p). c) El parámetro p, la media y la varianza de una distribución G(p) d) El parámetro p, la media y la varianza de una distribución de Pascal (r,p) e) La media, la varianza y el desvío standard de una distribución de Poisson. f) El parámetro lambda, la media y la varianza de una distribución exponencial 5.18) Estime por el método de máxima verosimilitud, para una muestra aleatoria de temaño n: a) El parámetro b de una distribución uniforme [0; b]. b) Si el estimador obtenido resulta sesgado, proponga uno que no lo sea. 5.19) Sea una función densidad f(x)= K/x3 para x>a; 0 para otros x. Encuentre el valor de K. Estime el parámetro a si se han obtenido tres valores muestrales 5, 6, 8. Establezca un intervalo de confianza. 5.20) Estime el parámetro a de una función del tipo obtenido 3 valores muestrales: 3; 4; 4,4. f(x)= 1/2 (x-a) para a<x<a+2 si se han 5.21) La longitud (en metros) de ciertas varillas es una variable aleatoria con función de densidad: ax 3 0 < x ≤ K f ( x / a) = 0 en otro caso siendo a>0. Determine K. Estime en forma bayesiana (pregunte a sus docentes la distribución “a priori” para “a”), y presente un intervalo de confianza para el parámetro “a”, si en una muestra de cuatro varillas se obtuvieron las siguientes longitudes en metros: 1, 1, 4, 2. Con esta información calcule la probabilidad de que una varilla mida más de 4 metros. 5.22) Una primera estimacion de la cantidad de enfermos se hizo con una muestra al azar de 50 individuos encontrando 1 enfermo. Se obtiene una segunda muestra de 100 individuos y no se encontró ningún enfermo. ¿Qué puede informar respecto al porcentaje de enfermos en esa población? 5.23) Para estimar la probabilidad de As de un dado que puede estar cargado se lo tira 20 veces obteniéndose 6 ases. Si ahora debe arrojarlo 3 veces y el premio es de 2$ por As obtenido, cuál estima que será la media del premio? 5.24) Un productor de manzanas provee las mismas en cajas de 48 manzanas. Sabe que su cliente elige una caja, controla 5 manzanas y rechaza la partida si encuentra una fuera de calidad. Siendo que el porcentaje de manzanas defectuosas de su producción es del 1% coloca 2 defectuosas entre las 48. ¿Cuál es la probabilidad de que le rechacen la partida? 5.25) (Requiere computadora) Simule 80 valores de una variable binomial de p=0,01; n=6. Estime con los valores obtenidos en valor de p, calcule un intervalo de confianza al 95%. Compare los resultados con el valor “real” utilizado en la simulacion. Observe y analice las diferencias. Observacion: éste es un ejemplo didáctico, lógicamente no tendría ninguna lógica que no sea la didáctica simular para estimar. 5.26) En una bodega se desea conocer la proporción p de barriles existentes con el vino ya estacionado y listo para la distribución. En base a estudios previos, se le asigna a p la siguiente Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 distribución: f ( p ) = c(1 − p ) ; para 0 < p < 1 . Por otro lado, a un empleado de la bodega se le encomienda la tarea de probar un vaso de cada uno de los 800 barriles existentes, para poder determinar p en forma exacta. El empleado empieza a probar un vaso de cada barril, y va anotando en su cuaderno “LISTO” o “NO LISTO”, de acuerdo a lo que prueba. Sin embargo, luego de probar el noveno vaso, se olvida de qué era lo que estaba haciendo, y se queda dormido entre dos barriles. Otro empleado recoge el cuaderno, donde encuentra 5 veces la palabra “LISTO” y 4 veces “NO LISTO”. a) Actualice en forma bayesiana la distribución de p, en base a los 9 resultados que llegó a obtener el primer empleado. Hallar la meda y el máximo de la distribución a posteriori de p condicional a dichos resultados. b) Encuentre el estimador de máxima verosimilitud, que no tiene en cuenta la distribución a priori, y compare con el máximo encontrado en a). 5.27) De un nuevo ventilador se quiere estimar en forma bayesiana el parámetro λ suponiendo que el tiempo de vida es exponencial y que la distribución a priori para λ es U(0; 0,05). Si 5 pruebas dieron como resultado: 100; 120; 180; 110 y 90 horas, halle f(λx1,…,x5) y estime la probabilidad de que un equipo dure más de 100 horas. 5.28) Se supone que la concentración de SO 4 para una estación de contaminación tiene distribución N(µ, 4ppm). Captando 16 muestras de una hora de duración cada una, seleccionadas al azar en un período de estudio, se obtuvo una media muestral de 9 ppm. a) ¿Cuál es el intervalo de confianza del 95% de nivel de confianza para µ? b) ¿Cuál debe ser el tamaño de la muestra si se desea que el error sea menor a 0,25 ppm, con una confianza del 90%? c) ¿Cuál es el intervalo de confianza del 95% para estimar µ si el desvío standard fue estimado a partir de los datos de la muestra: s=4 ppm? 5.29) De un conjunto de datos sobre DBO (demanda bioquímica de oxígeno) en una cierta estación fluvial se obtuvo que para 25 días seleccionados al azar, dicho parámetro indicador de contaminación arrojaba una media muestral de 35 mg/l y s 2=0,184 (mg/l)2. Asuma que el nivel diario de DBO obedece a una distribución normal. a) Halle el intervalo de confianza del 99% de nivel de confianza para estimar el verdadero valor medio de DBO. b) ¿Cómo modificaría a) si se conoce σ2 = 0,184 (mg/l)2? c) Si un ingeniero no está de acuerdo con la amplitud del intervalo establecido en b) y quisiera reducirlo en un 50% considerando el mismo nivel de confianza, ¿cuántas mediciones adicionales debería realizar? 5.30) Una empresa de servicios desea evaluar la satisfacción de sus clientes acerca de la atención al público por parte de sus empleados. Para esto, decide elegir al azar una muestra de sus clientes, de tamaño n, a los cuales se les preguntará si están o no conformes con la atención. Si el porcentaje de clientes disconformes es menor al 70%, aplicarán correcciones. Entrevistan a n = 50 clientes, de los cuales 13 están disconformes. Construya un intervalo de confianza del 90% para la estimación del porcentaje de clientes disconformes. ¿Cuán grande deberá ser la muestra para que el ancho del intervalo sea menor que 3%? 5.31) En una elección política se enfrentan dos candidatos, el Ing. Manodur, y el Lic. Ionorrobo. Una semana antes de la elección, se realiza una encuesta a 2000 votantes, de los cuales 925 eligieron al primero, y 890 al segundo. El resto manifestó que pensaba votar en blanco. Estimar por intervalos de confianza de nivel 0,95 los porcentajes verdaderos de cada candidato. ¿Es posible aventurar que alguno va a ganar, o, por el contrario, hay empate técnico? La decisiones bajo riesgo. Los ensayos de hipótesis 5.32) Un operario toma una muestra aleatoria de 12 cables obteniendo las siguientes longitudes (en metros): 9,2; 9,7; 9,8; 10,2; 10,4; 10; 9,4; 9,5; 10,3; 9,9; 9,7. (Se supone distribución normal). a) ¿Hay evidencia suficiente para afirmar con un α=0.01 que la longitud media es <10m? (suponer σ = 0,35m ) b) Idem, si no se conoce σ c) Para el caso a), ¿cuál es la probabilidad de cometer error de tipo II si la longitud media verdadera fuese de 9,7 m? Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 5.33) Una máquina automática de embolsado de papas es diseñada para ubicar en promedio por lo menos 112 kilos en cada bolsa. Se sospecha que está embolsando por debajo del peso. Para controlar, se eligen 8 bolsas al azar y se encuentra que el peso de cada bolsa arroja los siguientes valores: 115; 110; 109; 107; 108; 102; 111; 113. (Se supone distribución normal). a) ¿Puede afirmarse que el peso medio es inferior a 112 kg (usar α=0,1) b) ¿Puede afirmarse que la desviación standard es inferior a 5 kg? (usar α=0,1) 5.34) Un fabricante de acero afirma que la dureza de su producto es N(75, 1). Diseñe un test de hipótesis que cumpla simultáneamente con: P(error de tipo I) ≤ 0,05 y P(error de tipo II/ la dureza se aparta en más de 2 unidades de 75) ≤ 0,05. Establezca el tamaño de la muestra y el criterio de decisión. 5.35) Testee H0: µ = 5 contra H1: µ < 5 sobre la base de una muestra aleatoria de tamaño 4, extraida de una población que tiene una distribución de Poisson. Elija un nivel de significación del 5%. Dicha muestra aleatoria arrojó los siguientes valores: 3; 7; 2; 4. Decida al respecto. 5.36) Se tomó una muestra de 28 capacitores, midiéndose la distancia entre conductores. Se obtuvo x = 0,06mm, s = 0,01mm (suponga distribución normal). a) ¿Puede afirmar, al nivel 0,05, que la separación media supera 0,05 mm? Plantee las hipótesis nula y alternativa y explíquelas en palabras b) Si la separación media en realidad es de 0,058 mm, halle la probabilidad de que dicho test avale la conclusión equivocada de que la separación media es inferior a 0,05 mm, suponiendo σ=0,01 mm. Grafique la curva característica. c) ¿Puede afirmar, al nivel 0,95, que la desviación standard poblacional es menor a 0,015 mm? 5.37) Para estimar el rendimiento de un proceso químico, se observaron datos correspondientes a las últimas 10 corridas del mismo. El rendimiento promedio de estas corridas fue de 64,8%, y la desviación estándar de las mismas fue de 9,8%. El responsable del proceso está decidido a invertir en su mejora, sólo si recibe evidencia estadística de que el rendimiento medio del proceso es inferior al 70%. Si le preguntaran a usted ¿justificaría la inversión? (suponga que el rendimiento tiene distribución normal y explique detalladamente su respuesta y los criterios utilizados) 5.38) Se sabe que el 30% de los automovilistas en una ciudad cruzan semáforos en rojo. Para disminuir este porcentaje, la municipalidad realiza una intensiva campaña publicitaria. Luego de la misma se quiere evaluar si la campaña tuvo éxito o no. Para tal fin se dispone, en una esquina representativa, una cámara de video la cual filma durante varias horas lo ocurrido en el semáforo. Luego de este lapso de tiempo, se contabilizaron 400 autos pasando por la esquina, de los cuales 92 cruzaron el semáforo en rojo. ¿Se puede afirmar, con una probabilidad de error del 5%, que la campaña hizo descender el porcentaje inicial? Justifique detalladamente 5.39) Un vendedor de tornos fresadoras afirma que el 98% de las piezas que se producen, cuando se regula la máquina con la media en 80, estarán entre 79,8 y 80,2, Para no perder tiempo en ajustar la media se produce así como esta obteniéndose 5 valores: 30,05; 29,90 29,95; 30,00; 30,10. ¿Puede afirmarse que lo que dice el vendedor es correcto? ¿Cuales son las hipótesis y las consideraciones que debe efectuar? 5.40) El contenido de los paquetes de cereal llenados por una determinada máquina tiene una distribución normal con desvío estándar de 30 gr. Se desea establecer un control periódico del proceso de llenado y se establece en un 5% la probabilidad de detener la máquina innecesariamente cuando el peso promedio de los paquetes es igual a 360gr. (que es el peso neto indicado en el envase), y en 2% la probabilidad de no realizar las correcciones necesarias en el proceso cuando el peso promedio de cereal difiere por caja en un 10% del valor indicado en el envase. Indique el criterio de decisión y el tamaño de muestra adecuado que daría usted a la persona encargada de controlar el proceso. 5.41) Sea una variable aleatoria X con función de densidad fX(x)= 2(x-a) para a<x<a+1 ; 0 para el resto de valores. El ensayo de control para medir x es destructivo y resulta económicamente imposible tomar más de una muestra. A pesar de ello es necesario establecer un esquema de control para determinar si µ = 5. Defina el ensayo de hipótesis para un nivel de significación (error tipo I) del 5%. Trace la curva caracteristica con al menos 5 puntos. Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 5.42) En un proceso químico se producen en promedio, 800 toneladas de un producto químico por día. Las producciones diarias de una semana fueron: 805 790 790 780 770 a) En base a este resultado, ¿puede afirmar que la producción promedio es menor a 800 toneladas y que, por lo tanto, algo anda mal en el proceso? Decida a un nivel de significación del 5%. b) ¿Cuál es el intervalo del 90% de confianza para estimar la varianza de la producción diaria? c) En las partes a) y b), ¿qué supuestos se requieren para que sea válido el procedimiento para analizar estos datos? 5.43) Diseñe una prueba de control para clasificar las personas entre adivinadores y no adivinadores mediante la adivinación del resultado del tiro de un dado. Indique claramente que criterios utilizó. 5.44) Se considera que, si en una esquina la tasa de circulacion en la hora pico y cada uno de los sentidos es mayor a 60 autos/minuto o si en por lo menos un sentido es mayor a 100 autos/minuto, deberia colocarse semáforo. Establezca el criterio de decisión si el plazo de toma de muestras en cada cruce es de 20 horas. (Suponga un proceso Poisson). 5.45) (Uso del soft Excel) Prepare una matriz de 200 valores simulados de una variable N(µ;σ) dejando en celdas respectivas los parametros y activa la matriz a fin de que se recalcule automaticamente. Establezca con nivel de significación del 10% un criterio de decisión a dos colas para la media con desvio conocido. a) Observe con cada resimulacion (F9) el resultado que obtiene con el criterio de decision definido, y verifique que un 10% de las veces la decision seria rechazar. b) Calcule la probabilidad de aceptar una hipótesis de una media 10% mayor a la tomada para el ensayo y verifique, simulando, el porcentaje de veces que el resultado sería aceptar. c) Repita el esquema ensayando el desvío 5.46) Se deben cortar flejes de aluminio de ancho medio 100 mm y desvío máximo 0,5 mm. El control de calidad periódico de la producción establece hacer 20 mediciones del ancho y detener el corte para ajustar si el promedio de los valores medidos esta fuera del rango 100 ± 0,05, o si el estimador del desvio resulta mayor a 0,6. ¿qué porcentaje de veces se detendrá el corte innecesariamente? 5.47) Una empresa tiene como esquema de control de recepción tomar una muestra del 10% de la partida recibida y rechazar si en la misma hay mas de un 5% relativo de piezas fuera de tolerancia. Estudiar si para el proveedor es más conveniente enviar una partida de 1000 unidades o dos de 500. 5.48) Una empresa sabe que el 20% de los clientes de un supermercado tiene una imagen positiva de sus productos. Estaría dispuesta a gastar una fuerte suma en publicidad si le pueden demostrar que una campaña de promotoras dentro un supermercado puede llevar ese porcentaje a no menos del 40%. Establezca un ensayo piloto para definir la situacion. Test de bondad de ajuste χ2 5.49) (Requiere computadora) Se han obtenido valores de tiempos necesarios para procesar 150 lotes de hilo en una máquina continua de hilar (en horas). (Los valores se encuentran en la tabla del problema 5.13). a) Establezca un modelo adecuado para la variable “tiempo de proceso”. b) Con el modelo obtenido calcule la probabilidad de que el tiempo de proceso supere las 2 horas y compare el valor con el porcentaje de valores muestrales con tal condición. c) En un mismo gráfico muestre el histograma de los valores y la función de probabilidad en escalas comparables. 5.50) Establezca si el modelo de variable uniforme es razonable para asociar a los siguientes valores: 1 6,32 2 4,89 3 7,92 4 5,40 5 5,64 6 5,02 7 8,20 8 6,97 9 5,05 10 9,40 11 5,62 12 5,36 13 6,88 14 8,77 15 5,78 16 4,10 17 8,01 18 5,77 19 5,39 20 6,51 21 4,91 22 6,05 23 8,75 24 5,07 25 7,74 26 6,67 27 5,71 28 7,85 29 6,89 30 8,07 Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 31 8,25 32 6,66 33 6,69 34 6,80 35 5,56 36 6,22 37 6,12 38 4,39 39 6,50 40 6,08 41 7,17 42 5,19 43 7,14 44 9,71 45 4,77 46 7,73 47 9,32 48 6,68 49 4,75 50 7,06 51 4,37 52 6,53 53 7,15 54 6,88 55 7,73 56 5,10 57 7,89 58 4,39 59 4,89 60 8,41 5.51) Establezca si los 45 resultados del tiro de un dado que se listan a continuación pueden considerarse de uno equilibrado: 6 2 4 3 5 2 3 2 2 5 3 2 1 3 6 3 3 5 1 2 2 2 1 4 1 2 2 2 4 1 5 1 2 2 3 1 4 3 2 1 5 4 2 3 4 5.52) (Requiere computadora) Repita el proceso entre llaves al menos 60 veces: {Tome un numero de 4 digitos, elevelo al cuadrado y tome los cuatro digitos centrales del numero obtenido con ellos; repita la operación 5 veces}. Verifique si el último valor obtenido responde a un numero aleatorio. 5.53) Se sospecha que la cantidad de fallas de terminación en una línea de pintura de carrocerías de autos, tiene distribución de Poisson. De los últimos 100 autos pintados se obtuvo la siguiente estadística de fallas: Nro. de fallas por auto Cantidad de autos en que se encontró dicho número de fallas 0 1 2 3 4 5 6 7 8 2 11 18 24 22 11 8 3 1 Estime la tasa de fallas por auto, y testee si realmente es aplicable la distribución de Poisson. Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 Ejercicios Adicionales A.1. El arribo de clientes a un comercio sigue un proceso de Poisson de media 3 clientes por hora. Sin embargo, sólo el 30% de los clientes que arriban realizan alguna compra. a) Si el costo de cada compra realizada es una variable aleatoria con distribución U(100, 150) (en $) calcule la facturación esperada luego de 6 horas de trabajo. b) Calcule aproximadamente la probabilidad de que en 80 horas de trabajo se facture más de $11000. A.2. Sea X ~ U(3,4) y Y/X=x ~N(x,1).Usando la tabla de la distribución normal (DN), hallar fY(5) y P(X>3.5/Y=5). A.3. Una empresa compra grandes lotes de envases de vidrio. Por convención, un lote se declara como “bueno” si contiene 1% o menos de envases quebrados, y se establece como “malo” si dicho porcentaje supera el 5%. Se debe establecer un plan de muestreo, esto es: un tamaño muestral n y un número de aceptación c. Se inspeccionará una muestra de n envases, y se aceptará un lote cuando el número de envases quebrados encontrados en la muestra supere a c. Halle valores de n y c que garanticen que tanto la probabilidad de aceptar lotes malos (error I), y la probabilidad de rechazar lotes buenos (error II) sean ambas iguales o menores que 0,05 A.4. (opcional) Sea φ la fase de un generador eléctrico, la cual varía aleatoriamente según una distribución U(−π,π).Se define el factor de potencia como C=cos(φ). a) Halle la función de densidad de C. Calcule algunos puntos de esta función que permitan realizar un gráfico aproximado. Calcular P (C < 0.5) ) (Recuerde que arccos( x)' = − 1 1 − x 2 ) b) Nos proponemos medir el factor de potencia 50 veces, para obtener valores C1,…,C50 ( P C < 0.5 ) Calcule A.5. a) Dadas Ui ~ U(0,1) (i=1,…,n) independientes, calcule la distribución de ln(T), si 1 T= U1 ⋅ ⋅ U n b) Obtenga una expresión matemática que permita calcular P(T<106), para n=20 c) Calcule numéricamente en forma aproximada la expresión anterior A.6. Simule 5 variables aleatorias con distribución γ (n = 4, λ = 1) (puede usarse el resultado del ejercicio anterior). Calcule el promedio y la desviación standard muestral, y compárelos con los valores teóricos. A.7. La duración en horas de un modelo de capacitores utilizados en un sistema electrónico tiene distribución exponencial con λ=0,015. El sistema tiene instalados 5 capacitores idénticos con reemplazo automático: al comienzo hay sólo uno activado, cuando éste falla se activa el segundo, y así sucesivamente hasta que falla el último, en cuyo caso el sistema se inutiliza. Sólo es posible reemplazar los capacitores cuando se desconecta el sistema: una vez cada dos semanas. En ese momento, un técnico descarta los quemados y los reemplaza. El proceso de desconectar el sistema genera un costo operativo estimado en $1500. Por otro lado, por cada hora con el sistema inutilizado se estima un costo de $50 a) Halle una expresión matemática que permita calcular el costo esperado de funcionamiento. b) ¿Se justificaría económicamente la decisión de desconectar el sistema una vez por semana para cambiar los capacitores fallados, en lugar de cada dos? (realice las aproximaciones necesarias para poder responder). A.8. La duración (en horas) de un generador energético tiene distribución exponencial con parámetro λ=0,002 h-1. Dos generadores idénticos están conectados de forma tal que, cuando uno falla, se activa automáticamente el segundo. Por otro lado, la potencia de cada generador es una variable aleatoria U(0; 0.01) (MW), independiente para los dos equipos. a) Halle la energía total generada por ambos equipos en toda su vida útil (Recuerde: energía = potencia × tiempo) b) Calcule la probabilidad de que la energía generada sea mayor que 7 MWh, si es mayor que 5 MWh . Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 A.9. En un casino hay una ruleta con 5 números, como indica la figura. El sector con el nº 1 abarca 90º del plato de la ruleta; el del 2 y el del 3, 45º cada uno; el del 1 5 4, 60º y el del 5, 120º. La probabilidad de que salga cada número es proporcional al ángulo que define cada sector. a) Utilizando la tecla RANDOM de la calculadora, simule 10 tiradas de la ruleta. 2 4 b) Calcule el promedio y la desviación standard muestrales, y compárelos con los 3 valores teóricos esperados. c) Halle la probabilidad aproximada de que, luego de tirar la ruleta 100 veces, la suma de los números obtenidos sea mayor que 250 A.10. Una empresa fabrica puré de tomate en latas y una máquina lo envasa en latas. La máquina es controlada por una balanza que al registrar un peso A, seteado por el operador, corta el flujo de producto y cierra la lata. Se supone que la balanza no es exacta. El peso medido es un variable aleatoria con distribución normal centrada en el peso verdadero, y σ=10. La empresa debe asegurar que las latas contengan por lo menos 350g, en caso contrario se expone a una multa. ¿Cómo debe elegirse A para asegurar que menos del 0,5% de latas tengan un peso <350g? A.11. Un micro de larga distancia dispone de 90 asientos. Sin embargo, la empresa está decidida a vender algunos boletos más que 90, porque sabe que, habitualmente, el 20% de los pasajeros que han comprado su boleto desisten de viajar. Si se mantiene esta proporción, ¿cuántos boletos deben venderse, para tener una probabilidad aproximada de 0,99 de que todos los pasajeros que desean viajar tengan lugar en el micro? A.12. En el ej. 15 de la Guía 4, se dijo que las llegadas de pacientes a un consultorio de guardia constituye un proceso de Poisson de λ=2 pacientes/hora. Se desea hallar la probabilidad aproximada de que en 48 horas seguidas de guardia acudan menos de 100 pacientes. Para esto, puede aplicarse el TCL de dos maneras: como la aproximación de una distribución de Poisson, o como la aproximación de una distribución Gamma. Calcúlelo de ambas formas, y compare los resultados con 99 e 96 96 i i! =0,645 (este último resultado puede obtenerse con Excel, la probabilidad exacta i= 0 tipeando “=POISSON(99,96,verdadero)” ) ∑ A.13. Una empresa láctea fabrica queso descremado, con leche comprada a 3 tambos distintos: el tambo A entregó 300 barriles de leche, el B, 200, y el C, 500. El porcentaje de grasa de la leche tiene función de densidad k ( x − a ) si a ≤ x ≤ 2 a f ( x) = 0 si no Para la leche del tambo A, a = 2, para la del B, a = 3 y para la del C, a = 4. Cada barril recibido es controlado y, si el porcentaje de grasa excede 6%, no se lo utiliza para queso descremado sino para otro producto. a) Halle los valores de las constantes k, la función de densidad del porcentaje de grasa, y la probabilidad de que un barril aceptado para queso descremado provenga del tambo B. 2 b) Llame y al porcentaje de grasa del queso elaborado, que puede calcularse como y = 0,2 ⋅ ( x − 2 ) , donde x es el porcentaje de grasa de la materia prima. Halle la distribución y la esperanza de y A.14. Sea X∼N(0,1). Hallar la ditribución de X2 A.15. Se desea medir la longitud del semieje de un camión, con un calibre digital largo de resolución 0.01 mm. Esto último significa que el instrumento posee un indicador digital como el siguiente: , mm Si L es la variable física (continua) correspondiente a la longitud medida, el dispositivo digitalizador del calibre redondea L a un valor Y (discreto). Y es el valor más cercano a L entre los expresables en centésimas de mm. a) En estas condiciones, se suele suponer que L Y ~U( Y - 0.005mm; Y + 0.005 mm). Explique en palabras por qué. b) Por otro lado, la indicación Y puede variar a causa de dilataciones térmicas del calibre. Para Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 evaluar estas variaciones se repitió la medición del semieje 100 veces, obteniendo los valores siguientes: Y (en mm) frecuencia 1931.13 28 1931.14 40 1931.15 26 1931.16 6 En base a estos datos, estime la función de probabilidad pY y deduzca E(Y) y E(L) c) Halle la función de densidad de L a partir de la información disponible, y calcule la probabilidad de que el semieje mida más de 1931.158 mm Nota: En realidad, L es un parámetro físico constante (longitud del semieje), pero se lo considera una variable aleatoria debido a la falta de información completa sobre su valor exacto. ------------A.16. Un fabricante de ventiladores asegura que la velocidad media de rotación de sus productos es superior a 215 vueltas/min. Se ensayaron 12 ventiladores, obteniendo un promedio de 208,5 vueltas/min, y se supone un valor σ= 0.8 vueltas/min. ¿Existe evidencia para desmentir justificadamente la afirmación del fabricante al nivel α=0.05? Exprese en palabras la conclusión obtenida, como para contársela a alguien sin conocimientos de Probabilidad o Estadística. Grafique la curva característica. A.17. Para decidir periódicamente si la cantidad de piezas defectuosas que produce una máquina está dentro de los niveles razonables establecidos del 2%, deben hacerse ensayos. Fije los riesgos y elabore un informe donde se indique cómo hacer el ensayo y por qué. A.18. Una empresa farmacéutica debe comprar un gran lote de envases de vidrio para uno de sus productos y quiere asegurar que el porcentaje de envases con la rosca defectuosa sea mucho menor que el 2%. Para verificar si un lote entregado cumple el requerimiento se extrae una muestra de n=250 envases y se inspeccionan. Sea X el número de envases inspeccionados con la rosca defectuosa. Se aceptará el lote si X ≤ c, (para algún valor cuidadosamente elegido de c), y si X > c, se decide que el lote será devuelto. a) ¿Cómo debe elegirse c, si se quiere tener una probabilidad cercana a 0,1 de aceptar el lote cuando la verdadera proporción de envases defectuosas es del 2%? b) Para dicho c halle la probabilidad de rechazar el lote, cuando el verdadero valor de p es 1%. A.19. Una empresa requiere, para una materia prima comprada en grandes lotes, que el porcentaje de unidades defectuosas sea bastante menor al 3%. Para verificar si un lote entregado cumple el requerimiento se extrae una muestra de 130 unidades, a las que se somete a inspección. Si el número de piezas defectuosas es menor o igual que un valor c, se acepta el lote. Si no, se lo rechaza. a) Exprese en palabras los errores de Tipo I y II. b) Halle c para que el error de Tipo I, sea menor al 10%. A.20. Una especificación de compras de una empresa requiere, para una materia prima comprada en grandes lotes, que el porcentaje de unidades defectuosas sea no mayor del 2%. Para verificar si un lote entregado cumple el requerimiento se extrae una muestra de n unidades, a las que se somete a inspección. Suponiendo que n=80 y sólo una pieza inspeccionada es no conforme, ¿recomendaría aceptar el lote? Justifique detalladamente. A.21. Una muestra de 9 barras extraídas al azar de una producción arrojan una media de 20 cm. Se sabe que la longitud de las barras es una v.a. N(µ, σ = 3 cm) a) ¿Cuál es el intervalo de confianza de nivel 90% para estimar la longitud media de las barras? b) ¿Cuántas barras adicionales deben ser medidas para aumentar la confianza del mismo intervalo al 95%? c) Si se desconoce σ pero las 9 mediciones arrojaron un valor: s= 9,4cm, ¿cuáles son los intervalos de confianza del 90% para estimar la media, la varianza y el desvío standard de la longitud de las barras? A.22. Antes de comprar un lote de rollos de papel, un comprador desea estar prácticamente seguro de que el espesor medio del producto no es menor que 0,5 mm (“prácticamente seguro” significa para él “con una certeza del 99%”). Guía de Trabajos Prácticos 61.06 (No Industrial) Versión 0.2 1º cuatrimestre 2012 a) Plantee un test para ese problema. Exprese en palabras el riesgo del comprador y del vendedor, y sus probabilidades. b) Una muestra seleccionada de 8 pliegos registró un espesor medio de 0,6 mm y una desviación standard de 0,01 mm. ¿Qué decisión debe tomar el comprador? A.23. El coeficiente de reflexión de voltaje de un medidor de potencia de microondas es definido como una variable aleatoria compleja Rde la cual se supone que tanto Re(R) como Im(R) son variables aleatorias reales N(0, u) independientes, con u conocido (en este ejercicio se supondrá u=0.05). 2 a) El factor de absorción de potencia de dicho medidor se puede calcular como P = 1 − R . Halle E(P) b) Dé un intervalo que “cubra” a P con probabilidad 0,95 (aplique que, si las variables aleatorias Z1 ,, Z n son N(0,1) e independientes, entonces ∑ Z i2 ≈ χ n2 ). c) (Opcional) Para calibrar un medidor como el anterior se debe medir el cociente Y entre el factor de potencia PM absorbida por él, y el factor de potencia PR absorbida por un medidor patrón de similares características (Y= PM / PR). Realice una simulación en Excel para generar 1000 valores de Y, y graficarlos en un histograma. De acuerdo a este histograma, ¿puede suponer que Y tiene distribución normal? A.24. Se deben fabricar discos de acero, con un muy pequeño error de redondez. Esto significa que el “diámetro” de un disco debe ser prácticamente constante, independientemente de la dirección considerada para medirlo. En la figura se observa un disco “bueno” (redondo) y dos “malos” (en los cuales, para ilustrar mejor la situación, los errores de redondez han sido dibujados exageradamente). disco bueno discos malos Concretamente, el requisito de fabricación es: σD < 0.02 mm, donde σD representa la dispersión entre “diámetros” en diferentes direcciones sobre un disco (está claro que, si el disco fuera perfectamente circular, se tendría σD=0) Se desea evaluar si la máquina-herramienta existente en la fábrica es capaz de tornear este tipo de piezas. Para esto, se fabrica un único disco, que se considera representativo de la producción futura, y se lo mide 20 veces en direcciones al azar, con un micrómetro. La desviación standard muestral obtenida es s = 0.016 mm ¿Se cuenta con evidencia suficiente para asegurar, al nivel 0,95, que se cumple el requisito de fabricación? A.25. Se desea determinar la masa seca C correspondiente a la carga de cemento en un camión. Para esto, se pesa por quintuplicado el camión lleno en una báscula de camiones, obteniendo: 35600 kg; 35635 kg; 35620 kg; 35665 kg y 35610 kg. Se sabe que el peso del camión vacío es una variable aleatoria con distribución N(18560; 10) kg. La báscula está afectada por un error sistemático cuyo valor exacto se desconoce, pero se supone U(-20; 20) kg. Además, debe descontarse el agua presente en el cemento, cuya masa se considera una variable aleatoria con función de densidad f(x)= x/1250, si 0<x<50kg; f(x)=0, si no. Todas las variables mencionadas son incorrelacionadas entre sí. a) Plantee un modelo adecuado para estimar C, y calcule la esperanza y varianza del estimador aplicado. b) Suponiendo dicho estimador es aproximadamente normal, dé un intervalo de confianza aproximado del 95% para C. c) Para una obra se requieren 17 ton de cemento seco, ¿cuál es la probabilidad de que el contenido del camión alcance? A.26. Se desea determinar la concentración de cloruro de vinilo en una bebida gaseosa envasada en botellas plásticas. Se toman 20 botellas de la producción de una fábrica, determinando la concentración de cada botella, y promediando los 20 valores obtenidos. Si la muestra produjo una media de 0,5 ppm y una desviación estándar s = 0.02 ppm, dé un intervalo de confianza del 95 % para la concentración media.