Guía de TP, versión 0.2, capítulo 5

Anuncio
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
Guía 5 – Simulación. Estimación. Test de hipótesis
Un cambio de variable particular: la simulación
(es necesario el uso de Excel o algún lenguaje de programación)
5.1) Pruebe que, si U es un número aleatorio generado con la instrucción RANDOM de una
calculadora, entonces X definida así:
X = −
ln(1 − U )
~ ε (λ
λ
)
5.2) Elija un número positivo λ cualquiera, y genere 8 variables aleatorias ε(λ).Luego calcule el
promedio y desviación standard muestrales, y compárelos con los valores teóricos.
5.3) Genere 10 variables aleatorias continuas con función de densidad de probabilidad f(x)= k. x, si
0<x<2; f(x)= 0 en otro caso. Calcule su promedio y desviación standard muestral, y compárelos con
los valores teóricos.
5.4) Genere 1000 valores de una variable exponencial cuya F T(t)= 1-e -1/10 t cuya media es 10.
Calcule el promedio de los 1000 valores obtenidos y verifique que se obtiene un número cercano a la
media. Genere un histograma con los valores obtenidos. Repítalo varias veces. ¿Qué observa?
5.5) Genere 5 números random. Defina la variable X = mínimo de los 5 valores. Trace el histograma
de X, luego de simularla al menos 100 veces. Calcule el promedio. Ídem para el valor central, el
máximo de los cinco valores y el segundo mayor. Interprete los resultados.
5.6) Genere por simulación una tirada de un dado. Con ello resuelva el siguiente problema de
decisión: En un juego de generala un jugador se encuentra ante la situación que únicamente le falta
completar escalera y 6, habiendo obtenido en los tiros anteriores: 2,3;5;6;6 y quedándole un solo
tiro. ¿Le conviene levantar los dados 2;3;5 y apostar a sacar más seis o levantar un dado con 6 y
apostar a escalera? Simule una cantidad suficiente de jugadas como para que el valor de decisión
(¿cuál?) sea relativamente estable.
5.7) Genere valores de 2 variables uniformes entre -1 y 1. A cada par de valores considérelo un par
(x;y). Calcule a partir 1000 pares simulados la proporción de pares que caen dentro del circulo de
radio 1. ¿A qué número se parece?
5.8) Simule que llegan autos en una esquina con intervalos de tiempo exponenciales de media 5
segundos. La luz roja dura 40 segundos. ¿Cuántos autos habrá en la cola al encenderse la luz verde?
(en cada luz verde se vacía la cola)
5.9) (Modelo de cola simple) A la única ventanilla de atención al público llegan personas con
intervalos de tiempo que responden a la F T(t)= 1- e-0,25 t (t>0) t en minutos. El tiempo de atención
en las ventanilla es una variable aleatoria X con f X(x) = 2/25 x para 0<x<5. Calcule por simulación
el tiempo promedio de espera para entrar en ventanilla, el tiempo promedio en que una ventanilla se
encuentra sin clientes, la longitud promedio de la cola, la proporción de clientes que no deben
esperar para ser atendidos, la proporción de clientes con mas de 8 minutos de espera. Trace en un
diagrama x,y los pares x longitud de la cola para cada persona que llega vs. y su tiempo de espera.
Estadistica descriptiva
5.10) Los 30 operarios de una empresa tienen las siguientes alturas y pesos:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
altura m 1,64 1,80 1,71 1,93 1,71 1,68 1,75 1,91 1,63 1,82 1,59 1,80 1,88 1,77 1,68
peso Kg
61
84
69
88
74
68
72
82
68
86
64
81
91
72
59
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
altura m 1,63 1,72 1,78 1,71 1,68 1,81 1,71 1,81 1,74 1,78 1,80 1,80 1,74 1,67 1,93
peso Kg
62
67
81
61
72
88
72
80
77
70
89
84
76
57 101
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
Presente un informe sintético descriptivo de la población de operarios y realice gráficos
representativos.
5.11) Teórico: Explique a una persona sin conocimientos de estadística, a quien le explicaron que la
variancia es un valor medio de las distancias cuadráticas a la media, por qué para estimar la
variancia muestral divide por (N-1) y no por N.
5.12) Una empresa tiene 150 clientes y hace un censo para establecer el grado de satisfaccion
medido de 1 a 5 (1: insatisfecho, 5: totalmente satisfecho)
grado
respuestas
1
10
2
20
3
50
4
40
5
30
Elabore un informe de estadística descriptiva.
5.13) Se han obtenido valores de tiempos al procesar lotes de hilo en una máquila continua de hilar:
(en horas).
lote
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
horas 1,72 1,88 2,88 2,23 1,83 1,23 1,42 1,90 1,90 2,91 1,28 2,10 1,75 0,71 1,36
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
2,87 1,60 1,78 1,95 1,77 0,98 2,82 1,96 1,39 2,15 1,80 1,81 1,48 0,88 2,13
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
2,47 0,80 1,25 2,08 1,53 2,34 0,58 1,69 2,36 1,55 2,11 1,61 3,29 1,76 2,35
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
3,22 1,37 1,10 1,69 2,98 1,35 2,30 1,64 0,69 1,60 1,21 1,98 0,91 1,27 1,98
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
1,91 1,87 1,59 3,44 0,96 4,84 1,01 1,62 1,63 2,86 2,21 3,02 1,57 0,89 1,08
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
1,75 2,48 3,06 2,34 1,45 0,64 1,59 1,12 3,66 1,14 0,98 1,15 1,12 2,00 0,81
91
92
93
94
95
96
97
98
99 100 101 102 103 104 105
2,03 2,49 1,94 1,78 1,79 2,48 2,05 2,06 2,19 1,49 0,80 0,60 1,53 2,89 1,71
106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
2,02 2,50 3,81 1,63 1,82 0,53 1,52 2,30 2,98 3,44 0,71 3,44 2,27 2,06 1,80
121 122 123 124 125 126 127 128 129 130 131 132 133 134 135
2,49 2,37 1,76 1,14 1,16 1,48 1,94 2,19 2,74 2,07 1,04 1,67 2,24 0,76 2,51
136 137 138 139 140 141 142 143 144 145 146 147 148 149 150
1,23 2,56 2,78 1,62 1,78 1,74 1,30 0,96 2,47 1,35 2,30 3,28 2,71 2,89 1,73
Realice un histograma. Elabore un informe de estadística descriptiva.
Estimación de parámetros
5.14) Dé una muestra de 5 números en la cual la mediana coincide con la media, otra en que la
mediana tome valores muy por encima de la media, y otra en que tome valores muy por debajo.
5.15) Se desea estimar la media µ de una población normal N(µ; 1), basándose en dos
observaciones. Para eso se proponen tres estimadores:
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
4 X1 + X 2
3X1 + X 2
X + X2
µˆ1 =
; µˆ 2 =
; µˆ 3 = 1
5
6
2
Calcule los errores cuadráticos medios de c/estimador ¿Cuál de ellos es preferible? Explique por qué.
5.16) En una serie de m experiencias binomiales se registran X éxitos, y en una serie posterior de n
experiencias binomiales se registran Y éxitos.
X /m+ Y /n
X+Y
; pˆ 2 =
2
m+ n
Calcule los errores cuadráticos medios de cada estimador ¿Cuál es preferible?
Se proponen los siguientes estimadores del parámetro p: pˆ 1 =
5.17) Estime por el método de máxima verosimilitud, tomando una muestra aleatoria de tamaño n:
a) Los parámetros µ y σ de una distribución normal.
b) El parámetro p de una distribución Bi(n; p).
c) El parámetro p, la media y la varianza de una distribución G(p)
d) El parámetro p, la media y la varianza de una distribución de Pascal (r,p)
e) La media, la varianza y el desvío standard de una distribución de Poisson.
f) El parámetro lambda, la media y la varianza de una distribución exponencial
5.18) Estime por el método de máxima verosimilitud, para una muestra aleatoria de temaño n:
a) El parámetro b de una distribución uniforme [0; b].
b) Si el estimador obtenido resulta sesgado, proponga uno que no lo sea.
5.19) Sea una función densidad f(x)= K/x3 para x>a; 0 para otros x. Encuentre el valor de K.
Estime el parámetro a si se han obtenido tres valores muestrales 5, 6, 8.
Establezca un intervalo de confianza.
5.20) Estime el parámetro a de una función del tipo
obtenido 3 valores muestrales: 3; 4; 4,4.
f(x)= 1/2 (x-a)
para a<x<a+2 si se han
5.21) La longitud (en metros) de ciertas varillas es una variable aleatoria con función de densidad:
 ax 3 0 < x ≤ K
f ( x / a) = 
 0 en otro caso
siendo a>0. Determine K. Estime en forma bayesiana (pregunte a sus docentes la distribución “a
priori” para “a”), y presente un intervalo de confianza para el parámetro “a”, si en una muestra de
cuatro varillas se obtuvieron las siguientes longitudes en metros: 1, 1, 4, 2. Con esta
información calcule la probabilidad de que una varilla mida más de 4 metros.
5.22) Una primera estimacion de la cantidad de enfermos se hizo con una muestra al azar de 50
individuos encontrando 1 enfermo. Se obtiene una segunda muestra de 100 individuos y no se
encontró ningún enfermo. ¿Qué puede informar respecto al porcentaje de enfermos en esa
población?
5.23) Para estimar la probabilidad de As de un dado que puede estar cargado se lo tira 20 veces
obteniéndose 6 ases. Si ahora debe arrojarlo 3 veces y el premio es de 2$ por As obtenido, cuál
estima que será la media del premio?
5.24) Un productor de manzanas provee las mismas en cajas de 48 manzanas. Sabe que su cliente
elige una caja, controla 5 manzanas y rechaza la partida si encuentra una fuera de calidad. Siendo
que el porcentaje de manzanas defectuosas de su producción es del 1% coloca 2 defectuosas entre
las 48. ¿Cuál es la probabilidad de que le rechacen la partida?
5.25) (Requiere computadora) Simule 80 valores de una variable binomial de p=0,01; n=6. Estime
con los valores obtenidos en valor de p, calcule un intervalo de confianza al 95%. Compare los
resultados con el valor “real” utilizado en la simulacion. Observe y analice las diferencias.
Observacion: éste es un ejemplo didáctico, lógicamente no tendría ninguna lógica que no sea la
didáctica simular para estimar.
5.26) En una bodega se desea conocer la proporción p de barriles existentes con el vino ya
estacionado y listo para la distribución. En base a estudios previos, se le asigna a p la siguiente
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
distribución: f ( p ) = c(1 − p ) ; para 0 < p < 1 . Por otro lado, a un empleado de la bodega se le
encomienda la tarea de probar un vaso de cada uno de los 800 barriles existentes, para poder
determinar p en forma exacta. El empleado empieza a probar un vaso de cada barril, y va anotando
en su cuaderno “LISTO” o “NO LISTO”, de acuerdo a lo que prueba. Sin embargo, luego de probar el
noveno vaso, se olvida de qué era lo que estaba haciendo, y se queda dormido entre dos barriles. Otro
empleado recoge el cuaderno, donde encuentra 5 veces la palabra “LISTO” y 4 veces “NO LISTO”.
a) Actualice en forma bayesiana la distribución de p, en base a los 9 resultados que llegó a obtener
el primer empleado. Hallar la meda y el máximo de la distribución a posteriori de p condicional a
dichos resultados.
b) Encuentre el estimador de máxima verosimilitud, que no tiene en cuenta la distribución a priori, y
compare con el máximo encontrado en a).
5.27) De un nuevo ventilador se quiere estimar en forma bayesiana el parámetro λ suponiendo que
el tiempo de vida es exponencial y que la distribución a priori para λ es U(0; 0,05). Si 5 pruebas
dieron como resultado: 100; 120; 180; 110 y 90 horas, halle f(λx1,…,x5) y estime la probabilidad de
que un equipo dure más de 100 horas.
5.28) Se supone que la concentración de SO 4 para una estación de contaminación tiene distribución
N(µ, 4ppm). Captando 16 muestras de una hora de duración cada una, seleccionadas al azar en un
período de estudio, se obtuvo una media muestral de 9 ppm.
a) ¿Cuál es el intervalo de confianza del 95% de nivel de confianza para µ?
b) ¿Cuál debe ser el tamaño de la muestra si se desea que el error sea menor a 0,25 ppm, con una
confianza del 90%?
c) ¿Cuál es el intervalo de confianza del 95% para estimar µ si el desvío standard fue estimado a
partir de los datos de la muestra: s=4 ppm?
5.29) De un conjunto de datos sobre DBO (demanda bioquímica de oxígeno) en una cierta estación
fluvial se obtuvo que para 25 días seleccionados al azar, dicho parámetro indicador de contaminación
arrojaba una media muestral de 35 mg/l y s 2=0,184 (mg/l)2. Asuma que el nivel diario de DBO
obedece a una distribución normal.
a) Halle el intervalo de confianza del 99% de nivel de confianza para estimar el verdadero valor
medio de DBO.
b) ¿Cómo modificaría a) si se conoce σ2 = 0,184 (mg/l)2?
c) Si un ingeniero no está de acuerdo con la amplitud del intervalo establecido en b) y quisiera
reducirlo en un 50% considerando el mismo nivel de confianza, ¿cuántas mediciones adicionales
debería realizar?
5.30) Una empresa de servicios desea evaluar la satisfacción de sus clientes acerca de la atención al
público por parte de sus empleados. Para esto, decide elegir al azar una muestra de sus clientes, de
tamaño n, a los cuales se les preguntará si están o no conformes con la atención. Si el porcentaje de
clientes disconformes es menor al 70%, aplicarán correcciones. Entrevistan a n = 50 clientes, de los
cuales 13 están disconformes. Construya un intervalo de confianza del 90% para la estimación del
porcentaje de clientes disconformes. ¿Cuán grande deberá ser la muestra para que el ancho del
intervalo sea menor que 3%?
5.31) En una elección política se enfrentan dos candidatos, el Ing. Manodur, y el Lic. Ionorrobo. Una
semana antes de la elección, se realiza una encuesta a 2000 votantes, de los cuales 925 eligieron al
primero, y 890 al segundo. El resto manifestó que pensaba votar en blanco. Estimar por intervalos
de confianza de nivel 0,95 los porcentajes verdaderos de cada candidato. ¿Es posible aventurar que
alguno va a ganar, o, por el contrario, hay empate técnico?
La decisiones bajo riesgo. Los ensayos de hipótesis
5.32) Un operario toma una muestra aleatoria de 12 cables obteniendo las siguientes longitudes (en
metros): 9,2; 9,7; 9,8; 10,2; 10,4; 10; 9,4; 9,5; 10,3; 9,9; 9,7. (Se supone distribución normal).
a) ¿Hay evidencia suficiente para afirmar con un α=0.01 que la longitud media es <10m? (suponer
σ = 0,35m )
b) Idem, si no se conoce σ
c) Para el caso a), ¿cuál es la probabilidad de cometer error de tipo II si la longitud media verdadera
fuese de 9,7 m?
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
5.33) Una máquina automática de embolsado de papas es diseñada para ubicar en promedio por lo
menos 112 kilos en cada bolsa. Se sospecha que está embolsando por debajo del peso. Para
controlar, se eligen 8 bolsas al azar y se encuentra que el peso de cada bolsa arroja los siguientes
valores: 115; 110; 109; 107; 108; 102; 111; 113. (Se supone distribución normal).
a) ¿Puede afirmarse que el peso medio es inferior a 112 kg (usar α=0,1)
b) ¿Puede afirmarse que la desviación standard es inferior a 5 kg? (usar α=0,1)
5.34) Un fabricante de acero afirma que la dureza de su producto es N(75, 1). Diseñe un test de
hipótesis que cumpla simultáneamente con: P(error de tipo I) ≤ 0,05 y P(error de tipo II/ la dureza
se aparta en más de 2 unidades de 75) ≤ 0,05. Establezca el tamaño de la muestra y el criterio de
decisión.
5.35) Testee H0: µ = 5 contra H1: µ < 5 sobre la base de una muestra aleatoria de tamaño 4,
extraida de una población que tiene una distribución de Poisson. Elija un nivel de significación del
5%. Dicha muestra aleatoria arrojó los siguientes valores: 3; 7; 2; 4. Decida al respecto.
5.36) Se tomó una muestra de 28 capacitores, midiéndose la distancia entre conductores. Se obtuvo
x = 0,06mm, s = 0,01mm (suponga distribución normal).
a) ¿Puede afirmar, al nivel 0,05, que la separación media supera 0,05 mm? Plantee las hipótesis nula
y alternativa y explíquelas en palabras
b) Si la separación media en realidad es de 0,058 mm, halle la probabilidad de que dicho test avale
la conclusión equivocada de que la separación media es inferior a 0,05 mm, suponiendo σ=0,01
mm. Grafique la curva característica.
c) ¿Puede afirmar, al nivel 0,95, que la desviación standard poblacional es menor a 0,015 mm?
5.37) Para estimar el rendimiento de un proceso químico, se observaron datos correspondientes a
las últimas 10 corridas del mismo. El rendimiento promedio de estas corridas fue de 64,8%, y la
desviación estándar de las mismas fue de 9,8%. El responsable del proceso está decidido a invertir
en su mejora, sólo si recibe evidencia estadística de que el rendimiento medio del proceso es inferior
al 70%. Si le preguntaran a usted ¿justificaría la inversión? (suponga que el rendimiento tiene
distribución normal y explique detalladamente su respuesta y los criterios utilizados)
5.38) Se sabe que el 30% de los automovilistas en una ciudad cruzan semáforos en rojo. Para
disminuir este porcentaje, la municipalidad realiza una intensiva campaña publicitaria. Luego de la
misma se quiere evaluar si la campaña tuvo éxito o no. Para tal fin se dispone, en una esquina
representativa, una cámara de video la cual filma durante varias horas lo ocurrido en el semáforo.
Luego de este lapso de tiempo, se contabilizaron 400 autos pasando por la esquina, de los cuales 92
cruzaron el semáforo en rojo. ¿Se puede afirmar, con una probabilidad de error del 5%, que la
campaña hizo descender el porcentaje inicial? Justifique detalladamente
5.39) Un vendedor de tornos fresadoras afirma que el 98% de las piezas que se producen, cuando
se regula la máquina con la media en 80, estarán entre 79,8 y 80,2, Para no perder tiempo en
ajustar la media se produce así como esta obteniéndose 5 valores: 30,05; 29,90 29,95; 30,00;
30,10. ¿Puede afirmarse que lo que dice el vendedor es correcto? ¿Cuales son las hipótesis y las
consideraciones que debe efectuar?
5.40) El contenido de los paquetes de cereal llenados por una determinada máquina tiene una
distribución normal con desvío estándar de 30 gr. Se desea establecer un control periódico del
proceso de llenado y se establece en un 5% la probabilidad de detener la máquina innecesariamente
cuando el peso promedio de los paquetes es igual a 360gr. (que es el peso neto indicado en el
envase), y en 2% la probabilidad de no realizar las correcciones necesarias en el proceso cuando el
peso promedio de cereal difiere por caja en un 10% del valor indicado en el envase. Indique el
criterio de decisión y el tamaño de muestra adecuado que daría usted a la persona encargada de
controlar el proceso.
5.41) Sea una variable aleatoria X con función de densidad fX(x)= 2(x-a) para a<x<a+1 ; 0 para el
resto de valores. El ensayo de control para medir x es destructivo y resulta económicamente
imposible tomar más de una muestra. A pesar de ello es necesario establecer un esquema de control
para determinar si µ = 5. Defina el ensayo de hipótesis para un nivel de significación (error tipo I) del
5%. Trace la curva caracteristica con al menos 5 puntos.
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
5.42) En un proceso químico se producen en promedio, 800 toneladas de un producto químico por
día. Las producciones diarias de una semana fueron:
805
790
790
780
770
a) En base a este resultado, ¿puede afirmar que la producción promedio es menor a 800 toneladas y
que, por lo tanto, algo anda mal en el proceso? Decida a un nivel de significación del 5%.
b) ¿Cuál es el intervalo del 90% de confianza para estimar la varianza de la producción diaria?
c) En las partes a) y b), ¿qué supuestos se requieren para que sea válido el procedimiento para
analizar estos datos?
5.43) Diseñe una prueba de control para clasificar las personas entre adivinadores y no adivinadores
mediante la adivinación del resultado del tiro de un dado. Indique claramente que criterios utilizó.
5.44) Se considera que, si en una esquina la tasa de circulacion en la hora pico y cada uno de los
sentidos es mayor a 60 autos/minuto o si en por lo menos un sentido es mayor a 100 autos/minuto,
deberia colocarse semáforo. Establezca el criterio de decisión si el plazo de toma de muestras en
cada cruce es de 20 horas. (Suponga un proceso Poisson).
5.45) (Uso del soft Excel) Prepare una matriz de 200 valores simulados de una variable N(µ;σ)
dejando en celdas respectivas los parametros y activa la matriz a fin de que se recalcule
automaticamente. Establezca con nivel de significación del 10% un criterio de decisión a dos colas
para la media con desvio conocido.
a) Observe con cada resimulacion (F9) el resultado que obtiene con el criterio de decision definido, y
verifique que un 10% de las veces la decision seria rechazar.
b) Calcule la probabilidad de aceptar una hipótesis de una media 10% mayor a la tomada para el
ensayo y verifique, simulando, el porcentaje de veces que el resultado sería aceptar.
c) Repita el esquema ensayando el desvío
5.46) Se deben cortar flejes de aluminio de ancho medio 100 mm y desvío máximo 0,5 mm. El
control de calidad periódico de la producción establece hacer 20 mediciones del ancho y detener el
corte para ajustar si el promedio de los valores medidos esta fuera del rango 100 ± 0,05, o si el
estimador del desvio resulta mayor a 0,6. ¿qué porcentaje de veces se detendrá el corte innecesariamente?
5.47) Una empresa tiene como esquema de control de recepción tomar una muestra del 10% de la
partida recibida y rechazar si en la misma hay mas de un 5% relativo de piezas fuera de tolerancia.
Estudiar si para el proveedor es más conveniente enviar una partida de 1000 unidades o dos de 500.
5.48) Una empresa sabe que el 20% de los clientes de un supermercado tiene una imagen positiva
de sus productos. Estaría dispuesta a gastar una fuerte suma en publicidad si le pueden demostrar
que una campaña de promotoras dentro un supermercado puede llevar ese porcentaje a no menos
del 40%. Establezca un ensayo piloto para definir la situacion.
Test de bondad de ajuste χ2
5.49) (Requiere computadora) Se han obtenido valores de tiempos necesarios para procesar 150
lotes de hilo en una máquina continua de hilar (en horas). (Los valores se encuentran en la tabla del
problema 5.13).
a) Establezca un modelo adecuado para la variable “tiempo de proceso”.
b) Con el modelo obtenido calcule la probabilidad de que el tiempo de proceso supere las 2 horas y
compare el valor con el porcentaje de valores muestrales con tal condición.
c) En un mismo gráfico muestre el histograma de los valores y la función de probabilidad en escalas
comparables.
5.50) Establezca si el modelo de variable uniforme es razonable para asociar a los siguientes
valores:
1
6,32
2
4,89
3
7,92
4
5,40
5
5,64
6
5,02
7
8,20
8
6,97
9
5,05
10
9,40
11
5,62
12
5,36
13
6,88
14
8,77
15
5,78
16
4,10
17
8,01
18
5,77
19
5,39
20
6,51
21
4,91
22
6,05
23
8,75
24
5,07
25
7,74
26
6,67
27
5,71
28
7,85
29
6,89
30
8,07
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
31
8,25
32
6,66
33
6,69
34
6,80
35
5,56
36
6,22
37
6,12
38
4,39
39
6,50
40
6,08
41
7,17
42
5,19
43
7,14
44
9,71
45
4,77
46
7,73
47
9,32
48
6,68
49
4,75
50
7,06
51
4,37
52
6,53
53
7,15
54
6,88
55
7,73
56
5,10
57
7,89
58
4,39
59
4,89
60
8,41
5.51) Establezca si los 45 resultados del tiro de un dado que se listan a continuación pueden
considerarse de uno equilibrado:
6
2
4
3
5
2
3
2
2
5
3
2
1
3
6
3
3
5
1
2
2
2
1
4
1
2
2
2
4
1
5
1
2
2
3
1
4
3
2
1
5
4
2
3
4
5.52) (Requiere computadora) Repita el proceso entre llaves al menos 60 veces: {Tome un numero
de 4 digitos, elevelo al cuadrado y tome los cuatro digitos centrales del numero obtenido con ellos;
repita la operación 5 veces}. Verifique si el último valor obtenido responde a un numero aleatorio.
5.53) Se sospecha que la cantidad de fallas de terminación en una línea de pintura de carrocerías de
autos, tiene distribución de Poisson. De los últimos 100 autos pintados se obtuvo la siguiente
estadística de fallas:
Nro. de fallas por auto
Cantidad de autos en que se encontró dicho
número de fallas
0
1
2
3
4
5
6
7
8
2
11
18
24
22
11
8
3
1
Estime la tasa de fallas por auto, y testee si realmente es aplicable la distribución de Poisson.
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
Ejercicios Adicionales
A.1. El arribo de clientes a un comercio sigue un proceso de Poisson de media 3 clientes por hora.
Sin embargo, sólo el 30% de los clientes que arriban realizan alguna compra.
a) Si el costo de cada compra realizada es una variable aleatoria con distribución U(100, 150) (en
$) calcule la facturación esperada luego de 6 horas de trabajo.
b) Calcule aproximadamente la probabilidad de que en 80 horas de trabajo se facture más de
$11000.
A.2. Sea X ~ U(3,4) y Y/X=x ~N(x,1).Usando la tabla de la distribución normal (DN), hallar fY(5) y
P(X>3.5/Y=5).
A.3. Una empresa compra grandes lotes de envases de vidrio. Por convención, un lote se declara
como “bueno” si contiene 1% o menos de envases quebrados, y se establece como “malo” si dicho
porcentaje supera el 5%. Se debe establecer un plan de muestreo, esto es: un tamaño muestral n y
un número de aceptación c. Se inspeccionará una muestra de n envases, y se aceptará un lote
cuando el número de envases quebrados encontrados en la muestra supere a c. Halle valores de n y
c que garanticen que tanto la probabilidad de aceptar lotes malos (error I), y la probabilidad de
rechazar lotes buenos (error II) sean ambas iguales o menores que 0,05
A.4. (opcional) Sea φ la fase de un generador eléctrico, la cual varía aleatoriamente según una
distribución U(−π,π).Se define el factor de potencia como C=cos(φ).
a) Halle la función de densidad de C. Calcule algunos puntos de esta función que permitan realizar
un gráfico aproximado. Calcular P
(C <
0.5) ) (Recuerde que arccos( x)' = − 1 1 − x 2 )
b) Nos proponemos medir el factor de potencia 50 veces, para obtener valores C1,…,C50
(
P C < 0.5
)
Calcule
A.5. a) Dadas Ui ~ U(0,1) (i=1,…,n) independientes, calcule la distribución de ln(T), si
1
T=
U1 ⋅  ⋅ U n
b) Obtenga una expresión matemática que permita calcular P(T<106), para n=20
c) Calcule numéricamente en forma aproximada la expresión anterior
A.6. Simule 5 variables aleatorias con distribución γ (n = 4, λ = 1) (puede usarse el resultado del
ejercicio anterior). Calcule el promedio y la desviación standard muestral, y compárelos con los
valores teóricos.
A.7. La duración en horas de un modelo de capacitores utilizados en un sistema electrónico tiene
distribución exponencial con λ=0,015. El sistema tiene instalados 5 capacitores idénticos con
reemplazo automático: al comienzo hay sólo uno activado, cuando éste falla se activa el segundo, y
así sucesivamente hasta que falla el último, en cuyo caso el sistema se inutiliza. Sólo es posible
reemplazar los capacitores cuando se desconecta el sistema: una vez cada dos semanas. En ese
momento, un técnico descarta los quemados y los reemplaza. El proceso de desconectar el sistema
genera un costo operativo estimado en $1500. Por otro lado, por cada hora con el sistema inutilizado
se estima un costo de $50
a) Halle una expresión matemática que permita calcular el costo esperado de funcionamiento.
b) ¿Se justificaría económicamente la decisión de desconectar el sistema una vez por semana para
cambiar los capacitores fallados, en lugar de cada dos? (realice las aproximaciones necesarias para
poder responder).
A.8. La duración (en horas) de un generador energético tiene distribución exponencial con
parámetro λ=0,002 h-1. Dos generadores idénticos están conectados de forma tal que, cuando uno
falla, se activa automáticamente el segundo. Por otro lado, la potencia de cada generador es una
variable aleatoria U(0; 0.01) (MW), independiente para los dos equipos.
a) Halle la energía total generada por ambos equipos en toda su vida útil (Recuerde: energía =
potencia × tiempo)
b) Calcule la probabilidad de que la energía generada sea mayor que 7 MWh, si es mayor que 5
MWh
.
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
A.9. En un casino hay una ruleta con 5 números, como indica la figura. El sector
con el nº 1 abarca 90º del plato de la ruleta; el del 2 y el del 3, 45º cada uno; el del
1
5
4, 60º y el del 5, 120º. La probabilidad de que salga cada número es proporcional al
ángulo que define cada sector.
a) Utilizando la tecla RANDOM de la calculadora, simule 10 tiradas de la ruleta.
2
4
b) Calcule el promedio y la desviación standard muestrales, y compárelos con los
3
valores teóricos esperados.
c) Halle la probabilidad aproximada de que, luego de tirar la ruleta 100 veces, la suma de los
números obtenidos sea mayor que 250
A.10. Una empresa fabrica puré de tomate en latas y una máquina lo envasa en latas. La máquina
es controlada por una balanza que al registrar un peso A, seteado por el operador, corta el flujo de
producto y cierra la lata. Se supone que la balanza no es exacta. El peso medido es un variable
aleatoria con distribución normal centrada en el peso verdadero, y σ=10. La empresa debe asegurar
que las latas contengan por lo menos 350g, en caso contrario se expone a una multa. ¿Cómo debe
elegirse A para asegurar que menos del 0,5% de latas tengan un peso <350g?
A.11. Un micro de larga distancia dispone de 90 asientos. Sin embargo, la empresa está decidida a
vender algunos boletos más que 90, porque sabe que, habitualmente, el 20% de los pasajeros que
han comprado su boleto desisten de viajar. Si se mantiene esta proporción, ¿cuántos boletos deben
venderse, para tener una probabilidad aproximada de 0,99 de que todos los pasajeros que desean
viajar tengan lugar en el micro?
A.12. En el ej. 15 de la Guía 4, se dijo que las llegadas de pacientes a un consultorio de guardia
constituye un proceso de Poisson de λ=2 pacientes/hora. Se desea hallar la probabilidad aproximada
de que en 48 horas seguidas de guardia acudan menos de 100 pacientes. Para esto, puede aplicarse
el TCL de dos maneras: como la aproximación de una distribución de Poisson, o como la
aproximación de una distribución Gamma. Calcúlelo de ambas formas, y compare los resultados con
99
e 96 96 i i! =0,645 (este último resultado puede obtenerse con Excel,
la probabilidad exacta
i= 0
tipeando “=POISSON(99,96,verdadero)” )
∑
A.13. Una empresa láctea fabrica queso descremado, con leche comprada a 3 tambos distintos: el
tambo A entregó 300 barriles de leche, el B, 200, y el C, 500. El porcentaje de grasa de la leche
tiene función de densidad
 k ( x − a ) si a ≤ x ≤ 2 a
f ( x) = 
 0 si no
Para la leche del tambo A, a = 2, para la del B, a = 3 y para la del C, a = 4. Cada barril recibido es
controlado y, si el porcentaje de grasa excede 6%, no se lo utiliza para queso descremado sino para
otro producto.
a) Halle los valores de las constantes k, la función de densidad del porcentaje de grasa, y la
probabilidad de que un barril aceptado para queso descremado provenga del tambo B.
2
b) Llame y al porcentaje de grasa del queso elaborado, que puede calcularse como y = 0,2 ⋅ ( x − 2 ) ,
donde x es el porcentaje de grasa de la materia prima. Halle la distribución y la esperanza de y
A.14. Sea X∼N(0,1). Hallar la ditribución de X2
A.15. Se desea medir la longitud del semieje de un camión, con un calibre digital largo de resolución
0.01 mm. Esto último significa que el instrumento posee un indicador digital como el siguiente:
,
mm
Si L es la variable física (continua) correspondiente a la longitud medida, el dispositivo digitalizador
del calibre redondea L a un valor Y (discreto). Y es el valor más cercano a L entre los expresables en
centésimas de mm.
a) En estas condiciones, se suele suponer que
L Y ~U( Y - 0.005mm; Y + 0.005 mm). Explique en
palabras por qué.
b) Por otro lado, la indicación Y puede variar a causa de dilataciones térmicas del calibre. Para
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
evaluar estas variaciones se repitió la medición del semieje 100 veces, obteniendo los valores
siguientes:
Y (en mm)
frecuencia
1931.13
28
1931.14
40
1931.15
26
1931.16
6
En base a estos datos, estime la función de probabilidad pY y deduzca E(Y) y E(L)
c) Halle la función de densidad de L a partir de la información disponible, y calcule la probabilidad de
que el semieje mida más de 1931.158 mm
Nota: En realidad, L es un parámetro físico constante (longitud del semieje), pero se lo considera
una variable aleatoria debido a la falta de información completa sobre su valor exacto.
------------A.16. Un fabricante de ventiladores asegura que la velocidad media de rotación de sus productos es
superior a 215 vueltas/min. Se ensayaron 12 ventiladores, obteniendo un promedio de 208,5
vueltas/min, y se supone un valor σ= 0.8 vueltas/min. ¿Existe evidencia para desmentir
justificadamente la afirmación del fabricante al nivel α=0.05? Exprese en palabras la conclusión
obtenida, como para contársela a alguien sin conocimientos de Probabilidad o Estadística. Grafique
la curva característica.
A.17. Para decidir periódicamente si la cantidad de piezas defectuosas que produce una máquina
está dentro de los niveles razonables establecidos del 2%, deben hacerse ensayos. Fije los riesgos y
elabore un informe donde se indique cómo hacer el ensayo y por qué.
A.18. Una empresa farmacéutica debe comprar un gran lote de envases de vidrio para uno de sus
productos y quiere asegurar que el porcentaje de envases con la rosca defectuosa sea mucho menor
que el 2%. Para verificar si un lote entregado cumple el requerimiento se extrae una muestra de
n=250 envases y se inspeccionan. Sea X el número de envases inspeccionados con la rosca
defectuosa. Se aceptará el lote si X ≤ c, (para algún valor cuidadosamente elegido de c), y si X > c,
se decide que el lote será devuelto.
a) ¿Cómo debe elegirse c, si se quiere tener una probabilidad cercana a 0,1 de aceptar el lote
cuando la verdadera proporción de envases defectuosas es del 2%?
b) Para dicho c halle la probabilidad de rechazar el lote, cuando el verdadero valor de p es 1%.
A.19. Una empresa requiere, para una materia prima comprada en grandes lotes, que el porcentaje
de unidades defectuosas sea bastante menor al 3%. Para verificar si un lote entregado cumple el
requerimiento se extrae una muestra de 130 unidades, a las que se somete a inspección. Si el
número de piezas defectuosas es menor o igual que un valor c, se acepta el lote. Si no, se lo
rechaza.
a) Exprese en palabras los errores de Tipo I y II.
b) Halle c para que el error de Tipo I, sea menor al 10%.
A.20. Una especificación de compras de una empresa requiere, para una materia prima comprada en
grandes lotes, que el porcentaje de unidades defectuosas sea no mayor del 2%. Para verificar si un
lote entregado cumple el requerimiento se extrae una muestra de n unidades, a las que se somete a
inspección. Suponiendo que n=80 y sólo una pieza inspeccionada es no conforme, ¿recomendaría
aceptar el lote? Justifique detalladamente.
A.21. Una muestra de 9 barras extraídas al azar de una producción arrojan una media de 20 cm. Se
sabe que la longitud de las barras es una v.a. N(µ, σ = 3 cm)
a) ¿Cuál es el intervalo de confianza de nivel 90% para estimar la longitud media de las barras?
b) ¿Cuántas barras adicionales deben ser medidas para aumentar la confianza del mismo intervalo al
95%?
c) Si se desconoce σ pero las 9 mediciones arrojaron un valor: s= 9,4cm, ¿cuáles son los intervalos
de confianza del 90% para estimar la media, la varianza y el desvío standard de la longitud de las
barras?
A.22. Antes de comprar un lote de rollos de papel, un comprador desea estar prácticamente seguro de
que el espesor medio del producto no es menor que 0,5 mm (“prácticamente seguro” significa para él
“con una certeza del 99%”).
Guía de Trabajos Prácticos 61.06 (No Industrial)
Versión 0.2
1º cuatrimestre 2012
a) Plantee un test para ese problema. Exprese en palabras el riesgo del comprador y del vendedor, y
sus probabilidades.
b) Una muestra seleccionada de 8 pliegos registró un espesor medio de 0,6 mm y una desviación
standard de 0,01 mm. ¿Qué decisión debe tomar el comprador?
A.23. El coeficiente de reflexión de voltaje de un medidor de potencia de microondas es definido
como una variable aleatoria compleja Rde la cual se supone que tanto Re(R) como Im(R) son
variables aleatorias reales N(0, u) independientes, con u conocido (en este ejercicio se supondrá
u=0.05).
2
a) El factor de absorción de potencia de dicho medidor se puede calcular como P = 1 − R . Halle E(P)
b) Dé un intervalo que “cubra” a P con probabilidad 0,95 (aplique que, si las variables aleatorias
Z1 ,, Z n son N(0,1) e independientes, entonces ∑ Z i2 ≈ χ n2 ).
c) (Opcional) Para calibrar un medidor como el anterior se debe medir el cociente Y entre el factor
de potencia PM absorbida por él, y el factor de potencia PR absorbida por un medidor patrón de
similares características (Y= PM / PR). Realice una simulación en Excel para generar 1000 valores de
Y, y graficarlos en un histograma. De acuerdo a este histograma, ¿puede suponer que Y tiene
distribución normal?
A.24. Se deben fabricar discos de acero, con un muy
pequeño error de redondez. Esto significa que el
“diámetro” de un disco debe ser prácticamente
constante, independientemente de la dirección
considerada para medirlo. En la figura se observa un
disco “bueno” (redondo) y dos “malos” (en los cuales,
para ilustrar mejor la situación, los errores de
redondez han sido dibujados exageradamente).
disco bueno
discos malos
Concretamente, el requisito de fabricación es: σD < 0.02 mm, donde σD representa la dispersión
entre “diámetros” en diferentes direcciones sobre un disco (está claro que, si el disco fuera
perfectamente circular, se tendría σD=0)
Se desea evaluar si la máquina-herramienta existente en la fábrica es capaz de tornear este tipo de
piezas. Para esto, se fabrica un único disco, que se considera representativo de la producción futura,
y se lo mide 20 veces en direcciones al azar, con un micrómetro. La desviación standard muestral
obtenida es s = 0.016 mm ¿Se cuenta con evidencia suficiente para asegurar, al nivel 0,95, que se
cumple el requisito de fabricación?
A.25. Se desea determinar la masa seca C correspondiente a la carga de cemento en un camión.
Para esto, se pesa por quintuplicado el camión lleno en una báscula de camiones, obteniendo: 35600
kg; 35635 kg; 35620 kg; 35665 kg y 35610 kg. Se sabe que el peso del camión vacío es una
variable aleatoria con distribución N(18560; 10) kg. La báscula está afectada por un error
sistemático cuyo valor exacto se desconoce, pero se supone U(-20; 20) kg. Además, debe
descontarse el agua presente en el cemento, cuya masa se considera una variable aleatoria con
función de densidad f(x)= x/1250, si 0<x<50kg; f(x)=0, si no. Todas las variables mencionadas son
incorrelacionadas entre sí.
a) Plantee un modelo adecuado para estimar C, y calcule la esperanza y varianza del estimador
aplicado.
b) Suponiendo dicho estimador es aproximadamente normal, dé un intervalo de confianza
aproximado del 95% para C.
c) Para una obra se requieren 17 ton de cemento seco, ¿cuál es la probabilidad de que el contenido
del camión alcance?
A.26. Se desea determinar la concentración de cloruro de vinilo en una bebida gaseosa envasada en
botellas plásticas. Se toman 20 botellas de la producción de una fábrica, determinando la concentración
de cada botella, y promediando los 20 valores obtenidos.
Si la muestra produjo una media de 0,5 ppm y una desviación estándar s = 0.02 ppm, dé un intervalo
de confianza del 95 % para la concentración media.
Descargar