I.T.Industrial Métodos Estadísticos Problemas de Repaso

Anuncio
I.T.Industrial
Métodos Estadísticos
Problemas de Repaso
1. Para analizar la degradación de la señal emitida por una antena, se tomaron
los siguientes datos: la frecuencia de la señal en el momento de ser emitida
(X) y la frecuencia de la señal al ser recibida (Y). Los resultados medidos
en Megahercios fueron:
X
Y
1.75
1.56
1.8
1.45
1.78
1.75
2.01
0.84
2.48
2.02
2.58
2.41
2.98
2.75
2.65
1.44
2.01
1.55
3.87
2.02
a. Calcula la media, mediana y moda de ambas variables.
b. De las señales emitidas entre 2 y 3 Megahercios ¿Cuál es la proporción de ocasiones en las que la frecuencia recibida fue menor que 2.5
Megahercios?
c. Determina el intervalo en el que se encuentra el 50% central de la
variable Y.
d. Estudia el grado de asociación lineal entre las variables.
e. ¿Qué frecuencia se predice en la señal al ser recibida si al ser emitida
es de 3.5 Megahercios?. ¿Es fiable la predicción?.
2. Una industria ha vertido a un río próximo una cantidad cercana a los
3500 litros de sustancia contaminante. Por experiencias anteriores se sabe
que la Administración ha impuesto las siguientes sanciones (X en miles de
litros) por vertidos de similares características y por las cantidades (Y en
miles de euros) que a continuación se indican:
X (miles de litros)
Y (miles de euros)
0.5
6
1
18
1.5
30
2
45
2.5
66
3
90
4
144
a. Obtener medidas de tendencia central (media, mediana, moda) para
ambas variables.
b. ¿Qué variable es más homogénea con respecto a su media?. Razonar
la respuesta.
c. Estudiar el grado de asociación lineal entre las variables.
d. Estimar la cuantía de la sanción que la Administración impondrá
a dicha industria. ¿Te parece fiable tal estimación?. Razona la respuesta.
3. El tiempo T (en segundos) que una máquina tarda en perforar un material
de tipo 1 es una variable aleatoria continua con función de densidad dada
por:
1
f (t) =
½
k(t2 − 4t)
0
si 0 ≤ t ≤ 4
en otro caso
Se pide:
a. Calcular el valor de k.
b. ¿Qué probabilidad hay de que tarde menos de tres segundos en perforar una placa de material tipo 1?.
c. Calcular el tiempo medio que tarda en perforar placas de tipo 1.
Supongamos que el tiempo que esta misma máquina tarda en perforar un
material de tipo 2 es una variable aleatoria con distribución normal de
media 2 y desviación típica 0.5. Además, de todas las placas que perfora
la máquina en un mismo día, el 20% son de material tipo 1 y el 80% son
de material tipo 2.
d. Si elegimos una placa al azar, ¿cúal es la probabilidad de que la
máquina tarde más de tres segundos en perforarla?.
e. Si la máquina tardó más de tres segundos en perforar una placa, ¿cúal
es la probabilidad de que sea de material tipo 1?.
4. El alumbrado de Navidad de una avenida se establece en filas paralelas
de 3 bombillas, y las 3 bombillas de cada fila están conectadas en serie.
El tiempo de fallo de cada bombilla (en horas) sigue una distribución
exponencial de parámetro λ y los tiempos de fallo de las bombillas son
independientes. Una muestra de 10 bombillas proporciona los siguientes
tiempos de fallo en horas:
166.6
163
170.2
168.2
158.9
169.2
167
170
164.5
168.5
a. Estima el valor de λ haciendo uso del método de máxima verosimilitud o del método de los momentos.
b. Calcula la probabilidad de que una fila deje de iluminar pasados 10
días desde su inaguración. Suponer para este apartado y para los
siguientes que cada día las bombillas se encienden durante 7 horas.
c. Determina el número de filas de bombillas que deberá haber en la
avenida para que con una probabilidad de 0.95 al menos una de las
filas ilumine durante diez días desde su inaguración.
d. Supongamos que hay 60 filas de bombillas en la avenida. Consideremos para cada fila i (i=1,...,60) una variable aleatoria Xi que toma el
valor 1 si luce en un instante dado, y toma el valor 0 en caso contrario.
Toma el valor 1 con probabilidad 0.65. Calcula la probabilidad de
que en un instante dado al menos 40 de las 60 filas luzcan.
2
5. Tres miembros de un club privado han sido nominados para la presidencia
del mismo: Luis, Pedro y Ana.La probabilidad de que Luis sea elegido es de
0.3, la probabilidad de que Pedro sea elegido es de 0.5 y la probabilidad de
que Ana lo sea es de 0.2. En el caso de que Luis sea elegido, la probabilidad
de un incremento en las cuotas es de 0.8. En el caso de que Pedro o Ana
sean elegidos, las correspondientes probabilidades de incremento en las
cuotas son de 0.1 y 0.4 respectivamente. Si se ha observado un incremento
en las cuotas, ¿cuál es la probabilidad de que Luis haya sido el candidato
elegido?.
6. Una empresa oferta puestos de trabajo. A los aspirantes se les realiza una
prueba de selección siendo contratados el 6%.
a) De un grupo de 10 aspirantes, calcular la probabilidad de que a lo
sumo un aspirante haya sido seleccionado.
b) De un grupo de 80 aspirantes, calcular la probabilidad de que fuesen
seleccionados exactamente 9 aspirantes.
c) De un grupo de 1000 aspirantes, calcular la probabilidad de que el no
de seleccionados esté entre 60 y 100.
7. Se estima que el número medio de accidentes que ocurren en una determinada zona es de 20 por año. Si se sabe que en lo que llevamos de año ya
han ocurrido 5, calcular la probabilidad de que al finalizar el año se hayan
contabilizado en esta zona entre 15 y 30 accidentes.
8. En un estudio sobre ciertas características de unas vigas se determinó que
el 60% eran de tipo A. De entre éstas el 25% presentaba una concentración
demasiado baja de acero, y de las que presentaban las dos características
anteriores el 35% presentaba aluminosis. Si se elige al azar una viga, ¿cuál
es la probabilidad de que presente las tres características?.
9. En tres regiones de un país, A,B,C, se declaró una epidemia de cólera. La
probabilidad de que una persona que visita una de las regiones se contagie
es de 0.15 para la región A, 0.08 para la B y 0.24 para la C. Los turistas que
están visitando cada una de las tres regiones se reparte en las siguientes
proporciones: el 30% para la región A, el 50% para la B y el 20% para la
C.
a) ¿Cuál es la probabilidad de que un turista presente cólera?.
b) ¿Qué porcentaje del total de turistas con cólera corresponde a cada
una de las regiones?.
10. El tiempo T en horas que una máquina tarda en producir un artículo
sigue una distribución Exponencial con media 18 horas. La máquina puede
desajustarse durante la producción del artículo, y en tal caso el artículo
resulta defectuoso. Esto ocurre generalmente cuando la máquina tarda
más de 30 horas en la producción del artículo.
3
Los artículos producidos han de pasar por un control de la calidad antes de
su venta. Para ello, se hacen lotes de 100 artículos cada uno, tolerándose
un máximo de 25 artículos defectuosos por lote. Si un lote contiene más
de 25 defectuosos no pasa el control de la calidad.
a. Obtener la función de distribución del tiempo de producción T.
b. ¿Qué porcentaje de artículos tardan en ser producidos más de 16
horas pero menos de 18 horas?.
c. Calcular el tiempo de producción t tal que la probabilidad de excederlo sea de 0.05.
d. Calcular la probabilidad de que la máquina se desajuste durante la
producción de un artículo, y éste resulte por lo tanto defectuoso.
e. Calcular la probabilidad de que un lote no pase el control de la calidad.
En la venta de los lotes, el fabricante asegura que no presentan más de
un 20% de defectuosos, y esto sabemos que no siempre es cierto. Si se
muestrean 50 artículos de un lote vendido y se detectan 11 defectuosos,
f. Obtener un Intervalo de Confianza al 95% para la proporción de
defectuosos en un lote vendido.
g. Contrastar al 5% de significación si puede considerarse superior al
20% el porcentaje de defectuosos en un lote vendido.
11. Un sistema está sometido a dos tipos de fallo: tipo I y tipo II. La probabilidad de que ocurra un fallo en el sistema es de 0.25. Si ocurre un fallo en el
sistema, la probabilidad de que sea tipo I es de 0.3. Cuando ocurre un fallo
de este tipo el sistema se sustituye por uno nuevo e idéntico, pero si ocurre
un fallo tipo II (menos grave) éste pasa a un canal de reparación, con la
variante de que el sistema una vez reparado no habrá quedado ”tan bueno
como nuevo”. Es decir, el tiempo de vida (en años) del sistema cuando
es nuevo se modeliza mediante una distribución exponencial de parámetro
0.5, mientras que el tiempo de vida del sistema después de haber sufrido un
fallo tipo II sigue una distribución exponencial de parámetro 1 (se reduce
el tiempo medio de vida en un año). Calcular
a) Probabilidad de que el sistema funcione durante al menos seis meses
después de la ocurrencia de un fallo.
b) Si suponemos que los fallos tipo I llegan al sistema según un proceso
de Poisson a razón de 1 fallo por año, calcular la probabilidad de
que a los 3 años de poner inicialmente el sistema en funcionamiento
hayan ocurrido exactamente 4 fallos de este tipo.
c) Si hasta un momento dado se han contabilizado 50 fallos en el sistema,
calcula la probabilidad de que de entre ellos al menos 16 sean de tipo
I.
4
Nota: No pueden ocurrir simultáneamente un fallo tipo I y tipo II.
12. Dada
Q una m.a.s. X1 , X2 ......, Xn con función de verosimilitud L(x1 , x2 , ...., xn ) =
an [ (1 − xi )a−1 ], 0 ≤ xi ≤ 1, i = 1, 2, ...., n
Calcular el estimador máximo verosímil del parámetro a.
13. Se desea estudiar cómo afecta la concentración de un compuesto a la velocidad de una reacción química. De forma independiente y bajo las mismas
condiciones, se llevó a cabo la reacción 15 veces para una concentración
baja. Se obtuvo una velocidad media de 7.5 micromoles por cada 30 minutos, con una desviación típica de 1.5. Además, también se llevó a cabo
12 veces la reacción para una concentración alta. En este caso se obtuvo
una velocidad media de 8.8 micromoles por cada 30 minutos, con una
desviación típica de 1.42.
a. Obtén un intervalo de confianza al 90% para el cociente de varianzas.
¿Pueden considerarse las varianzas iguales?. Razona la respuesta.
b. ¿Existe suficiente evidencia para concluir que la velocidad media es
mayor cuando la concentración es alta?. Realizar el contraste al 5%
de significación.
Nota: Suponer que sendas muestras proceden de poblaciones normales e
independientes.
14. Se sabe que el 70% de las personas a las que se aplica una determinada
prueba requieren algún tipo de explicación adicional.Para determinar si
un nuevo método reduce el porcentaje de explicaciones, se aplica éste a 30
personas de los cuales 17 requieren alguna explicación adicional.
a) Obtener los valores entre los que estará el porcentaje (proporción *
100) de explicaciones adicionales necesarias con este nuevo método,
con un nivel de confianza del 95%. Interpretar resultados.
b) Contrastar la eficacia del nuevo método, es decir, si el nuevo método reduce la proporción de explicaciones necesarias con respecto al método
anterior. Tomar α = 0.05.
15. Con un cierto método de enseñanza para niños retrasados se obtiene una
desviación típica de 8 en las puntuaciones de los test finales realizados por
26 niños seleccionados. Se pone a prueba un nuevo método y se ensaya
con 31 niños diferentes . Las calificaciones obtenidas en los test finales
dan una desviación típica de 10.¿Puede asegurarse que el nuevo método
produce distinta variación en las puntuaciones con un nivel de significación
del 10% ?.
Nota: Se supone normalidad en las calificaciones obtenidas por ambos
métodos.
5
16. En una muestra aleatoria de 150 jóvenes , 115 declararon conocer todas
las medidas de prevención del sida, mientras que en otra muestra de 150
adultos, 60 reconocieron no estar suficientemente informados respecto a
dicho tema. ¿Podemos afirmar que los jóvenes están más informados que
los adultos respecto a la prevención del sida?. Realizar el contraste con
un nivel de significación del 5%. Se supone que sendas muestras proceden
de poblaciones normales e independientes.
17. La tabla siguiente presenta los valores observados de un índice de rendimiento,
en un proceso químico, para dos niveles de concentración de una de las
materias primas utilizadas.
Nivel A
120
106
109
103
122
105
107
111
115
106
Nivel B
140
125
152
162
156
146
133
149
158
162
¿Puede considerarse significativamente mayor el índice de rendimiento
obtenido con el nivel de concentracion B?. Realizar el contraste con un
nivel de significacion α = 0.05.
18. Un laboratorio farmaceutico investiga sobre animales de laboratorio el
efecto de dos nuevos fármacos para el tratamiento de una misma enfermedad. El experimento consiste en medir el tiempo de reacción después de
la inyección de una dosis de fármaco en el animal. Para ello se seleccionan
18 animales, biológicamente equivalentes, y se les aplica aleatoriamente a
10 de ellos el fármaco A y a resto el fármaco B. Los tiempos de reacción
observados (en minutos) son:
Fármaco A
8.3
7.6
8.4
8.3
7.5
8.2
7.6
8.3
8.4
7.9
6
Fármaco B
7.3
7.4
7.3
8.1
7.3
6.8
7.1
7.3
Si el farmaceutico espera que el individuo reaccione a estos fármacos en un
tiempo inferior a 8 minutos, ¿será significativamente mayor la proporción
individuos que lo hacen con el fármaco B que con el A?. Realizar el
contraste para un nivel de significación del 5%.
19. Los siguientes datos son valores de presion en un resorte de torsión para
varios ajustes del angulo entre las vueltas del resorte en una posición libre:
Angulo 71o
87
85
85
86
86
86
87
Angulo 75o
86
87
87
87
88
88
87
86
88
Angulo 79o
89
90
90
91
91
¿Es significativo el efecto del ángulo sobre la presión del resorte?. Realizar
el contraste al 5% de significación.
20. Los siguientes datos corresponden al consumo de enegía eléctrica (Megavatios/10−3 hora)
en el año 1998 de sendas muestras de 10 pueblos seleccionados al azar en
las provincias de Jaén, Granada y Sevilla.
Jaén
1,881
64,147
25,710
0,842
113,537
8,969
6,998
3,882
45,120
80,328
Consumo energía elect.
Granada
0,675
0,775
44,417
2,025
0,4
10,518
1,003
0,759
6,462
4,067
Sevilla
3,914
5,515
1,819
25,500
17,299
31,799
13,971
1,584
2,390
4,524
Contrastar con un nivel de significación del 5% si existen diferencias significativas entre las tres provincias en el consumo de enegía eléctrica.
Nota: Se supone que las tres muestras proceden de distribuciones normales e independientes con la misma varianza.
7
Descargar